Introdução geral O OpenAvatarChat é um projeto de código aberto desenvolvido pela equipe HumanAIGC-Engineering e hospedado no GitHub. É uma ferramenta modular de diálogo humano digital que permite aos usuários executar todas as funcionalidades em um único PC. O projeto combina vídeo em tempo real, reconhecimento de fala e tecnologia humana digital...
Introdução geral O uniOCR é uma ferramenta de reconhecimento de texto de código aberto desenvolvida pela equipe mediar-ai. Ela é baseada na linguagem Rust e é compatível com os sistemas macOS, Windows e Linux. Ele é compatível com os sistemas macOS, Windows e Linux. Os usuários podem usá-lo para extrair texto de imagens, a operação é simples e gratuita. O principal recurso do uniOCR é o suporte a várias plataformas...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral O Serena é uma ferramenta de programação gratuita e de código aberto desenvolvida pela equipe Oraios AI e hospedada no GitHub. É um assistente de código avançado que funciona diretamente em sua base de código para ajudar os desenvolvedores a analisar, editar e executar o código. O Serena é implementado por meio do Language Server Protocol (LSP)...
Introdução geral O AudioX é um projeto de código aberto de Zeyue Tian et al. no GitHub, com um artigo oficial publicado no arXiv (nº 2503.10522). Ele se baseia na tecnologia de transformador de difusão (Diffusion Transformer), a partir de texto, vídeo, imagens, áudio e outras entradas para gerar alta qualidade ...
Introdução geral O EasyControl é um projeto de código aberto que oferece controle de geração de imagens eficiente e flexível com base na arquitetura Diffusion Transformer (DiT). Entre eles, o Ghibli Control LoRA é um de seus recursos especiais, usando apenas 100 rostos asiáticos e suas imagens no estilo Ghibli geradas pelo GPT-4o...
O YOLOE é um projeto de código-fonte aberto desenvolvido pelo Grupo de Inteligência Multimídia (THU-MIG) da Escola de Software da Universidade de Tsinghua, com o nome completo "You Only Look Once Eye". Ele se baseia na estrutura PyTorch e é uma extensão da série YOLO, que pode detectar e segmentar qualquer objeto em tempo real. O projeto está hospedado no GitHub, ...
Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniMax três...
Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a maneira como os humanos entendem o vídeo, dividindo as tarefas em planejamento,...
Introdução geral O SuperCoder é uma ferramenta inteligente que é executada no terminal e foi projetada para programadores. Ele usa a tecnologia de IA para ajudar os usuários a pesquisar código, visualizar a estrutura do projeto, editar arquivos e corrigir bugs. O projeto tem código aberto por huytd no GitHub e é compatível com Linux, MacOS e Windows...
Introdução geral O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub. O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub, que ajuda os programadores a concluir a análise, a geração, a modificação e outras tarefas de código no Emacs, integrando um modelo de linguagem em grande escala (LLM).
Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou veículos. Ela combina o TAP...
Introdução geral O GenXD é um projeto de código aberto desenvolvido pela Universidade Nacional de Cingapura (NUS) e pela equipe da Microsoft. Ele se concentra na geração de cenas arbitrárias em 3D e 4D, resolvendo a geração de 3D e 4D no mundo real devido à insuficiência de dados e à complexidade do design do modelo causada pelo problema. O projeto analisa o movimento da câmera e do objeto,...
Introdução geral O ChatAnyone é um projeto inovador desenvolvido pela equipe do HumanAIGC. Ele usa técnicas de inteligência artificial para gerar vídeos digitais de retratos humanos com movimentos da parte superior do corpo a partir de uma única foto e entrada de áudio. O projeto baseia-se em um modelo de difusão de movimento hierárquico que gera movimentos da cabeça, gestos e expressões para...
Introdução geral O Search-R1 é um projeto de código aberto desenvolvido por PeterGriffinJin no GitHub e baseado na estrutura veRL. Ele usa técnicas de aprendizagem por reforço (RL) para treinar grandes modelos de linguagem (LLMs), permitindo que os modelos aprendam de forma autônoma a raciocinar e invocar mecanismos de pesquisa para resolver problemas. O projeto é compatível com o Qwen2.5...
Introdução geral O DeepGemini é um projeto de código aberto, criado pelo desenvolvedor Thomas Sligter. É uma ferramenta de gerenciamento de IA que oferece suporte à orquestração de vários modelos. O principal recurso é a capacidade de combinar com flexibilidade uma variedade de modelos de IA e é chamado por meio da interface de API compatível com OpenAI. O projeto é baseado em Python 3.11 e ...
Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: ComputerGYM, AgentAI e Playwright, e os usuários podem ...
Introdução geral O II-Researcher é uma ferramenta de pesquisa de inteligência artificial de código aberto desenvolvida pela equipe do Intelligent-Internet e hospedada no GitHub. Ele foi projetado para pesquisa profunda e raciocínio complexo, e é capaz de responder a perguntas complexas por meio de pesquisas inteligentes na Web e análise em várias etapas. O projeto foi lançado em 27 de março de 2025...
Introdução geral O Cua é um projeto de código aberto chamado Computer-Use Agent (pronuncia-se "koo-ah"), projetado para dispositivos Apple Silicon para criar e executar máquinas virtuais macOS e Linux de alto desempenho em velocidades próximas a 90% nativamente. Ele foi projetado para dispositivos Apple Silicon, pode criar e executar máquinas virtuais macOS e Linux de alto desempenho, com velocidades próximas às do dispositivo nativo 90%. O Cua usa o Ap...
Introdução geral O Paper to Podcast é uma ferramenta de código aberto especializada em transformar trabalhos de pesquisa acadêmica em podcasts animados e divertidos. Ela facilita a compreensão de conteúdos acadêmicos complexos usando tecnologia de inteligência artificial para transformar um artigo em formato PDF em um diálogo entre três personagens: o apresentador, o aluno e o especialista. Isso ...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.