Aprendizagem pessoal com IA
e orientação prática
TRAE
Total de 1020 artigos

Tags: ai projetos de código aberto Página 31

Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物-首席AI分享圈

Audiblez: Gere audiolivros, converta livros eletrônicos em audiolivros com o Kokoro

Introdução geral O Audiblez é um projeto de código aberto desenvolvido para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e vozes. Os usuários podem converter eBooks com uma simples linha de comando ...

Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识-首席AI分享圈

Pesquisa o1: Capacitar modelos de inferência para pesquisar ativamente, permitindo que modelos grandes pesquisem conhecimento externo enquanto pensam

Introdução abrangente O Search-o1 é um projeto de código aberto que visa aprimorar o desempenho de modelos de raciocínio em larga escala (LRMs) por meio da integração de mecanismos de pesquisa avançados. A ideia central é resolver o problema do déficit de conhecimento encontrado no processo de raciocínio por meio de pesquisa dinâmica e integração de conhecimento. O projeto é desenvolvido pela equipe sunnynexus, ...

Llama 3.2 Reasoning WebGPU: executando o Llama-3.2 em um navegador

Introdução geral Transformers.js é uma biblioteca JavaScript fornecida pela Hugging Face, projetada para executar modelos de aprendizado de máquina de última geração diretamente no navegador, sem suporte de servidor. A biblioteca é comparável à biblioteca de transformadores da Hugging Face para Python e oferece suporte a uma variedade de modelos...

MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布-首席AI分享圈

MoneyPrinter V2: gere e publique automaticamente vídeos curtos no YouTube e conteúdo no Twitter

Introdução geral O MoneyPrinter V2 é um projeto de código aberto desenvolvido por FujiwaraChoki para ajudar os usuários a ganhar dinheiro on-line por meio da automação. O projeto integra principalmente a automação do Twitter, a geração de vídeos curtos do YouTube, o marketing de afiliados e outras funções. Os usuários podem usar scripts Python para conteúdo...

RTranslator:语音实时翻译安卓应用,免费且支持离线使用-首席AI分享圈

RTranslator: um aplicativo de tradução de voz em tempo real para Android, gratuito e off-line!

Introdução geral O RTranslator é um aplicativo de tradução off-line em tempo real, quase gratuito e de código aberto, desenvolvido para dispositivos Android. Os usuários podem manter o telefone no bolso conectando um fone de ouvido Bluetooth e conversar com outras pessoas como se estivessem falando seu próprio idioma.

Gemini Next Chat:一键免费部署您的私人多模态Gemini应用-首席AI分享圈

Gemini Next Chat: Implemente seu aplicativo Gemini multimodal privado gratuitamente com um clique!

Introdução geral O Gemini Next Chat é um projeto de código aberto desenvolvido para ajudar os usuários a implementar facilmente aplicativos Gemini privados. O projeto é compatível com o modelo multimodal Gemini 1.5 e Gemini 2.0, e os usuários podem implementá-lo gratuitamente com um clique no Vercel. O Gemini Next Chat oferece um cliente multiplataforma ...

AutoMouser: geração de código de automação do navegador para transformar ações do mouse em scripts Selenium Python via IA

Descrição geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as em scripts Python Selenium robustos e fáceis de manter,...

Vanna:利用RAG技术将文本生成精准SQL查询-首席AI分享圈

Vanna: uso de técnicas RAG para gerar consultas SQL precisas a partir de texto

Introdução geral O Vanna é uma estrutura Python de código aberto licenciada pelo MIT que se concentra na geração de consultas SQL por meio de técnicas RAG (Retrieval Augmented Generation). Os usuários podem treinar modelos RAG, aplicá-los a seus próprios dados e, em seguida, fazer perguntas, e o Vanna retornará as consultas SQL apropriadas. Essas consultas podem ser automaticamente...

SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频-首席AI分享圈

SVFR: uma estrutura unificada para implementar o reparo de faces em vídeos, reparando vídeos antigos com retratos em preto e branco e desfocados

Introdução abrangente O SVFR (Stable Video Face Restoration) é uma estrutura unificada para restauração de faces em vídeo que suporta as tarefas de restauração básica de faces (BFR), coloração, reparo e suas combinações. A estrutura utiliza a priori geradores e de movimento para integrar informações específicas da tarefa por meio de uma estrutura unificada de restauração facial, propondo...

LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话-首席AI分享圈

LiveTalking: sistema interativo digital humano ao vivo em tempo real de código aberto para obter um diálogo síncrono de áudio e vídeo

Introdução abrangente O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, comprometido com a criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0 e integra várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de fluxo de áudio e vídeo em tempo real, sincronização labial e assim por diante. O sistema oferece suporte a ...

Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑-首席AI分享圈

Aider: ferramenta de assistente de programação de código aberto, use o assistente de IA para escrever códigos e editar arquivos

Introdução geral O Aider é uma poderosa ferramenta de assistente de programação de IA de código aberto que ajuda os desenvolvedores a escrever, editar e refatorar códigos por meio de diálogo em linguagem natural. Como uma ferramenta interativa de programação de pares de IA, o Aider é compatível com muitas das principais linguagens de programação, integra-se perfeitamente aos fluxos de trabalho do Git e pode...

JoyGen:音频驱动的3D深度感知人像说话视频编辑工具-首席AI分享圈

JoyGen: Ferramenta de edição de vídeo de retratos falados em 3D com reconhecimento de profundidade e orientada por áudio

Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução em 3D e métodos de extração de recursos de áudio para capturar com precisão os recursos de identidade e os coeficientes de expressão do locutor...

VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)-首席AI分享圈

VSR: software de remoção de marca d'água de vídeo sem perdas e legendas rígidas com tecnologia de IA (cliente de remoção de marca d'água de vídeo 7G+)

Introdução abrangente O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas e marcas d'água de texto de vídeos. A ferramenta usa uma variedade de modelos de algoritmos de IA (STTN, LAMA, PROPAINTER) para identificar de forma inteligente...

微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台-首席AI分享圈

WeChat Video No. Downloader: Baixe rapidamente o vídeo WeChat Video No., compatível com vários formatos e plataformas

Introdução abrangente O WeChat Video No. Downloader é um projeto de código aberto criado para ajudar os usuários a baixar rapidamente o conteúdo de vídeo dos números de vídeo do WeChat. A ferramenta é compatível com vários formatos e plataformas de vídeo, e os usuários podem usá-la facilmente nos sistemas Windows e macOS. O projeto foi desenvolvido pela ltaoo e hospedado no GitHub, os usuários...

Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言-首席AI分享圈

Riona-AI-Agent: inteligências interativas automatizadas de mídia social que pesquisam, curtem e deixam mensagens automaticamente

Introdução geral O Riona-AI-Agent é uma ferramenta inovadora de automação baseada em IA, projetada especificamente para gerenciar e otimizar as operações das principais plataformas de mídia social. Ela utiliza modelos avançados de IA para fornecer geração inteligente de conteúdo e recursos de gerenciamento de contas para plataformas como Instagram, Twitter e GitHub. O sistema...

NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本-首席AI分享圈

NV Ingest: análise de documentos de formato complexo e extração de dados multimodais em metadados e texto

Introdução abrangente O NV Ingest (NVIDIA Ingest) é um conjunto de microsserviços de acesso antecipado projetado para analisar centenas de milhares de PDFs não estruturados complexos e confusos e outros documentos corporativos. Ele pode converter esses documentos em metadados e texto para incorporação em sistemas de recuperação.

Assistente de IA Deepseek "sempre ativo": criação de um sistema de interação de voz inteligente baseado no Deepseek-V3

Introdução abrangente O Always-On AI Assistant é um projeto inovador de assistente de IA que cria um sistema de assistente de IA avançado e permanentemente on-line por meio da integração de tecnologias avançadas, como Deepseek-V3, RealtimeSTT e Typer. O projeto é especialmente otimizado para cenários de desenvolvimento de engenharia, fornecendo um...

STAR:空间时序增强AI模型,提升视频分辨率清晰度-首席AI分享圈

STAR: Modelo de IA de aprimoramento de tempo espacial para melhorar a nitidez da resolução de vídeo

Introdução abrangente O STAR (Spatial-Temporal Augmentation with Text-to-Video Models) é uma estrutura inovadora de super-resolução de vídeo desenvolvida em conjunto pela Nanjing University, ByteDance e Southwest University. O projeto se dedica a resolver os principais problemas no processamento de super-resolução de vídeo do mundo real...

pt_BRPortuguês do Brasil