Introdução geral O Audiblez é um projeto de código aberto desenvolvido para converter livros eletrônicos (por exemplo, formato .epub) em audiolivros (por exemplo, formato .m4b). O projeto utiliza a tecnologia de síntese de voz de alta qualidade da Kokoro para oferecer suporte a vários idiomas e vozes. Os usuários podem converter eBooks com uma simples linha de comando ...
Introdução abrangente O Search-o1 é um projeto de código aberto que visa aprimorar o desempenho de modelos de raciocínio em larga escala (LRMs) por meio da integração de mecanismos de pesquisa avançados. A ideia central é resolver o problema do déficit de conhecimento encontrado no processo de raciocínio por meio de pesquisa dinâmica e integração de conhecimento. O projeto é desenvolvido pela equipe sunnynexus, ...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral Transformers.js é uma biblioteca JavaScript fornecida pela Hugging Face, projetada para executar modelos de aprendizado de máquina de última geração diretamente no navegador, sem suporte de servidor. A biblioteca é comparável à biblioteca de transformadores da Hugging Face para Python e oferece suporte a uma variedade de modelos...
Introdução geral O MoneyPrinter V2 é um projeto de código aberto desenvolvido por FujiwaraChoki para ajudar os usuários a ganhar dinheiro on-line por meio da automação. O projeto integra principalmente a automação do Twitter, a geração de vídeos curtos do YouTube, o marketing de afiliados e outras funções. Os usuários podem usar scripts Python para conteúdo...
Introdução geral O RTranslator é um aplicativo de tradução off-line em tempo real, quase gratuito e de código aberto, desenvolvido para dispositivos Android. Os usuários podem manter o telefone no bolso conectando um fone de ouvido Bluetooth e conversar com outras pessoas como se estivessem falando seu próprio idioma.
Introdução geral O Gemini Next Chat é um projeto de código aberto desenvolvido para ajudar os usuários a implementar facilmente aplicativos Gemini privados. O projeto é compatível com o modelo multimodal Gemini 1.5 e Gemini 2.0, e os usuários podem implementá-lo gratuitamente com um clique no Vercel. O Gemini Next Chat oferece um cliente multiplataforma ...
Descrição geral O AutoMouser é uma extensão do Chrome que rastreia de forma inteligente as interações do usuário e gera automaticamente o código de teste Selenium usando os modelos GPT da OpenAI. Ele faz isso registrando as ações do navegador do usuário e convertendo-as em scripts Python Selenium robustos e fáceis de manter,...
Introdução geral O Vanna é uma estrutura Python de código aberto licenciada pelo MIT que se concentra na geração de consultas SQL por meio de técnicas RAG (Retrieval Augmented Generation). Os usuários podem treinar modelos RAG, aplicá-los a seus próprios dados e, em seguida, fazer perguntas, e o Vanna retornará as consultas SQL apropriadas. Essas consultas podem ser automaticamente...
Introdução abrangente O SVFR (Stable Video Face Restoration) é uma estrutura unificada para restauração de faces em vídeo que suporta as tarefas de restauração básica de faces (BFR), coloração, reparo e suas combinações. A estrutura utiliza a priori geradores e de movimento para integrar informações específicas da tarefa por meio de uma estrutura unificada de restauração facial, propondo...
Introdução abrangente O LiveTalking é um sistema humano digital interativo em tempo real de código aberto, comprometido com a criação de soluções humanas digitais ao vivo de alta qualidade. O projeto usa o protocolo de código aberto Apache 2.0 e integra várias tecnologias de ponta, incluindo renderização ER-NeRF, processamento de fluxo de áudio e vídeo em tempo real, sincronização labial e assim por diante. O sistema oferece suporte a ...
Introdução geral O Aider é uma poderosa ferramenta de assistente de programação de IA de código aberto que ajuda os desenvolvedores a escrever, editar e refatorar códigos por meio de diálogo em linguagem natural. Como uma ferramenta interativa de programação de pares de IA, o Aider é compatível com muitas das principais linguagens de programação, integra-se perfeitamente aos fluxos de trabalho do Git e pode...
Introdução abrangente O JoyGen é uma estrutura inovadora de geração de vídeo em dois estágios para rostos falantes, com foco na solução do problema de geração de expressões faciais orientadas por áudio. Desenvolvido por uma equipe da Jingdong Technology, ele usa técnicas avançadas de reconstrução em 3D e métodos de extração de recursos de áudio para capturar com precisão os recursos de identidade e os coeficientes de expressão do locutor...
Introdução abrangente O Video Subtitle Remover (Video-subtitle-remover, ou VSR) é um software de processamento de vídeo baseado na tecnologia de IA, especialmente projetado para remover legendas e marcas d'água de texto de vídeos. A ferramenta usa uma variedade de modelos de algoritmos de IA (STTN, LAMA, PROPAINTER) para identificar de forma inteligente...
Introdução abrangente O TimesFM 2.0 - 500M PyTorch é um modelo de base de série temporal pré-treinado desenvolvido pela Google Research e projetado para previsão de série temporal. O modelo é capaz de lidar com comprimentos de contexto de até 2048 pontos de tempo e suporta intervalos de previsão arbitrários.
Introdução abrangente O WeChat Video No. Downloader é um projeto de código aberto criado para ajudar os usuários a baixar rapidamente o conteúdo de vídeo dos números de vídeo do WeChat. A ferramenta é compatível com vários formatos e plataformas de vídeo, e os usuários podem usá-la facilmente nos sistemas Windows e macOS. O projeto foi desenvolvido pela ltaoo e hospedado no GitHub, os usuários...
Introdução geral O Riona-AI-Agent é uma ferramenta inovadora de automação baseada em IA, projetada especificamente para gerenciar e otimizar as operações das principais plataformas de mídia social. Ela utiliza modelos avançados de IA para fornecer geração inteligente de conteúdo e recursos de gerenciamento de contas para plataformas como Instagram, Twitter e GitHub. O sistema...
Introdução abrangente O NV Ingest (NVIDIA Ingest) é um conjunto de microsserviços de acesso antecipado projetado para analisar centenas de milhares de PDFs não estruturados complexos e confusos e outros documentos corporativos. Ele pode converter esses documentos em metadados e texto para incorporação em sistemas de recuperação.
Introdução abrangente O Always-On AI Assistant é um projeto inovador de assistente de IA que cria um sistema de assistente de IA avançado e permanentemente on-line por meio da integração de tecnologias avançadas, como Deepseek-V3, RealtimeSTT e Typer. O projeto é especialmente otimizado para cenários de desenvolvimento de engenharia, fornecendo um...
Introdução abrangente O STAR (Spatial-Temporal Augmentation with Text-to-Video Models) é uma estrutura inovadora de super-resolução de vídeo desenvolvida em conjunto pela Nanjing University, ByteDance e Southwest University. O projeto se dedica a resolver os principais problemas no processamento de super-resolução de vídeo do mundo real...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.