Introdução geral O Skywork-R1V é um modelo de raciocínio multimodal de código aberto desenvolvido pela equipe do SkyworkAI (Kunlun Wanwei) e publicado no GitHub. Ele é capaz de processar imagens e textos simultaneamente, executar raciocínio lógico em várias etapas e é particularmente bom na análise de problemas complexos de imagens. O modelo foi lançado oficialmente em 18 de março de 2025...
A Mistral AI anunciou recentemente o lançamento de seu modelo mais recente, o Mistral Small 3.1, que afirma ser o melhor de sua classe atualmente. Esse novo modelo se baseia nos fundamentos do Mistral Small 3, com melhorias significativas no desempenho do texto, na compreensão multimodal e nos recursos de processamento contextual,...
Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.
Introdução geral O JigsawStack é uma plataforma de ferramentas de IA para desenvolvedores. Ela fornece uma variedade de serviços de API para pequenos modelos de IA para ajudar os usuários a integrar rapidamente os recursos em seus aplicativos. Os principais recursos são velocidades rápidas com latência global tão baixa quanto 200 milissegundos e disponibilidade tão alta quanto 99,51 TP3T. A plataforma oferece suporte ao rastreamento da Web...
Na era da explosão de informações, como localizar de forma rápida e precisa as principais informações de dados massivos tornou-se o principal desafio do gerenciamento de conhecimento empresarial e pessoal. Recentemente, a equipe de produtos da Dify lançou a versão 1.1.0 e, de forma inovadora, introduziu os "metadados" como o núcleo da função de filtro de conhecimento. Essa atualização é como...
Introdução geral O AI Logo é um projeto de aplicativo de IA de código aberto com o objetivo de ajudar os usuários a gerar rapidamente logotipos de marca personalizados por meio de inteligência artificial. Ele combina técnicas avançadas de IA, como Stable Diffusion e DeepAI, para permitir que os usuários insiram informações simples sobre a marca e obtenham designs de logotipo de alta qualidade. Esse...
Introdução geral O Docs é uma plataforma colaborativa de código aberto para anotações e gerenciamento de documentos desenvolvida pela equipe do suitenumerique. Ela foi criada usando as tecnologias Django e React com o objetivo de fornecer uma ferramenta fácil de usar para ajudar os usuários a fazer anotações, gerenciar documentos e compartilhar conhecimento. Essa plataforma é compatível com...
A tecnologia OCR é capaz de converter informações textuais em uma imagem em dados de texto editáveis e processáveis. Em termos simples, ela reconhece e extrai texto de imagens. A seguir, analisaremos os 10 projetos de código-fonte aberto de OCR com o maior número de estrelas no GitHub, fornecendo a você uma seleção detalhada de ferramentas de OCR...
Introdução abrangente O SmartRead é uma ferramenta de código aberto baseada em IA projetada para documentos técnicos. Ele analisa automaticamente arquivos PDF e anota o conteúdo principal, como termos importantes, títulos ou ideias centrais, para ajudar os usuários a entender rapidamente documentos complexos. Ao mesmo tempo, ele também pode fornecer artigos e vídeos relacionados ao tópico do documento...
Introdução geral O Hunyuan3D-2 é um projeto de código aberto desenvolvido pela Tencent, com o objetivo de gerar modelos 3D de alta resolução a partir de texto ou imagens. Ele consiste em dois componentes principais: modelo de geração de forma (Hunyuan3D-DiT) e modelo de geração de textura (Hunyuan3D-Paint). Os usuários podem inserir descrições de texto ou...
Introdução geral O LangManus é uma estrutura de automação de IA de código aberto hospedada no GitHub. Desenvolvido por um grupo de ex-colegas em seu tempo livre, é um projeto acadêmico com o objetivo de combinar modelos de linguagem e ferramentas especializadas para realizar tarefas como pesquisa na Web, rastreamento de dados e execução de código. A estrutura usa modelos multiagentes...
O Gemini tem sido atualizado com certa frequência ultimamente, sem nenhuma ordem específica: O modelo de inferência Veo2 agora está disponível no Google AI Studio, Gemini (versão reduzida) Suporte nativo para modelos multimodais para geração e edição de imagens: Gemini 2.0 Flash (agora o nome padrão é: Gemini 2.0 Fl...
Resumo Os sistemas de recuperação de informações são essenciais para o acesso eficiente a grandes coleções de documentos. Abordagens recentes usam modelos de linguagem ampla (LLMs) para melhorar o desempenho da recuperação por meio do aumento da consulta, mas geralmente dependem de técnicas caras de aprendizado supervisionado ou destilação que exigem recursos computacionais significativos e dados rotulados manualmente. Em ...
Introdução geral O Cursor Talk to Figma MCP é um projeto de código aberto que conecta a ferramenta de programação de IA Cursor ao software de design Figma por meio do protocolo Model Context Protocol (MCP). Ele foi criado pelo desenvolvedor Sonny Lazuardi, está hospedado no GitHub e tem data de lançamento em 3 de março de 2025. ...
Introdução abrangente O XianyuAutoAgent é um sistema robótico inteligente de atendimento ao cliente projetado especificamente para a plataforma Idlefish, com código aberto pelo desenvolvedor shaxiu no GitHub. Ele realiza tarefas automatizadas de 7×24 horas por meio da tecnologia de IA para ajudar os vendedores de peixes ociosos a responder a mensagens, lidar com barganhas e obter orientação técnica. As principais funções incluem ...
Introdução geral O Seed-VC é um projeto de código aberto no GitHub, desenvolvido pela Plachtaa. Ele pode usar um trecho de áudio de referência de 1 a 30 segundos para realizar rapidamente a conversão de voz ou música, sem treinamento adicional. O projeto oferece suporte à conversão de voz em tempo real, com latência tão baixa quanto 400 milissegundos ou mais, adequado para reuniões on-line...
Introdução geral O PilottAI é uma estrutura Python de código aberto hospedada no GitHub e criada pelo desenvolvedor anuj0456. Ele se concentra em ajudar os usuários a criar um sistema corporal multiinteligente de classe empresarial, com suporte para integração de modelo de linguagem grande (LLM), fornecendo agendamento de tarefas, expansão dinâmica, mecanismo tolerante a falhas e outros recursos.
Introdução geral O HumanOmni é um grande modelo multimodal de código aberto desenvolvido pela equipe HumanMLLM e hospedado no GitHub. Ele se concentra na análise de vídeos humanos e pode processar imagens e sons para ajudar a entender o conteúdo de emoções, ações e diálogos. O projeto usou 2,4 milhões de videoclipes centrados em humanos e...
Introdução geral A Aha é a primeira ferramenta do mundo a se concentrar no marketing da Netflix usando uma equipe de IA, desenvolvida pela Aha Labs. Ela oferece uma equipe de agentes de IA on-line 24 horas por dia, 7 dias por semana, para ajudar os usuários a lançar, gerenciar e dimensionar suas campanhas de marketing da Netflix. Os usuários inserem informações sobre a marca ou o site, e a IA automatizará tarefas como a correspondência com a Netflix,...
A gigante chinesa da Internet, Alibaba, está entrando no espaço da inteligência artificial (IA) em grande estilo. Segundo informações, o CEO da Alibaba, Wu Yongming, deixou claro que deseja se dedicar totalmente à IA nos negócios existentes da empresa. Em um anúncio na Bolsa de Valores de Hong Kong (24 de fevereiro), o Alibaba planeja investir pelo menos US$ 380 bilhões nos próximos três...
Não consegue encontrar ferramentas de IA? Tente aqui!
Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.