Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 992 artigos

Tags: ai projetos de código aberto Página 6

OmniSQL:将自然语言转化为高质量SQL查询的模型-首席AI分享圈

OmniSQL: um modelo para transformar a linguagem natural em consultas SQL de alta qualidade

Introdução geral O OmniSQL é um projeto de código aberto desenvolvido pela equipe do RUCKBReasoning e hospedado no GitHub. Sua principal função é transformar as perguntas de linguagem natural inseridas pelo usuário em instruções de consulta SQL de alta qualidade para ajudar os usuários a interagir facilmente com os bancos de dados. O projeto se baseia em um texto automatizado...

LatentSync:用音频直接生成唇形同步视频的开源工具-首席AI分享圈

LatentSync: uma ferramenta de código aberto para gerar vídeo com sincronização labial diretamente do áudio

Introdução geral O LatentSync é uma ferramenta de código aberto desenvolvida pela ByteDance e hospedada no GitHub. Ela aciona os movimentos labiais dos personagens em um vídeo diretamente por meio do áudio, permitindo que o formato da boca corresponda à voz com precisão. O projeto é baseado no modelo de difusão latente do Stable Diffusion, conhecido como LatentSync.

基于Workers AI免费将多种文件转为Markdown格式-首席AI分享圈

Converta vários arquivos para o formato Markdown gratuitamente com base em Workers AI

Introdução geral O serverless-markdown-convertor é uma ferramenta de código aberto gratuita, baseada no desenvolvimento do Cloudflare Worker e do Workers AI, que pode converter uma variedade de arquivos para o formato Markdown. Ele é compatível com PDF, imagens, documentos do Office, HTML e outros tipos de arquivos comuns, sem a necessidade de ...

VirtualWife:支持B站直播和语音互动的二次元数字人-首席AI分享圈

VirtualWife: uma pessoa digital secundária que suporta a transmissão ao vivo da estação B e a interação por voz

O VirtualWife é um projeto de pessoa digital virtual de código aberto criado pelo desenvolvedor yakami129. O objetivo é criar um personagem virtual com uma "alma" e os usuários podem interagir com ele como se fosse um amigo. O projeto é compatível com a transmissão ao vivo da estação B e pode ser usado em voz e texto chineses para se comunicar com...

GPT-Crawler:自动爬取网站内容生成知识库文件-首席AI分享圈

GPT-Crawler: rastreamento automático do conteúdo do site para gerar documentos da base de conhecimento

Introdução geral O GPT-Crawler é uma ferramenta de código aberto desenvolvida pela equipe do BuilderIO e hospedada no GitHub. Ele rastreia o conteúdo da página inserindo um ou mais URLs de sites, gerando um arquivo de conhecimento estruturado (output.json) para criar GPTs personalizados ou assistentes de IA. Os usuários podem...

MegaTTS3:合成中英文语音的轻量模型-首席AI分享圈

MegaTTS3: um modelo leve para sintetizar a fala em chinês e inglês

Introdução abrangente O MegaTTS3 é uma ferramenta de síntese de fala de código aberto desenvolvida pela ByteDance em colaboração com a Universidade de Zhejiang, com foco na geração de fala em chinês e inglês de alta qualidade. Seu modelo principal tem apenas 0,45B de parâmetros, é leve e eficiente, suporta a geração de discursos mistos em chinês e inglês e a clonagem de discursos. O projeto está hospedado no GitHub e é mencionado...

KBLaM:为大模型嵌入外部知识的开源增强工具-首席AI分享圈

KBLaM: uma ferramenta aprimorada de código aberto para incorporar conhecimento externo em modelos grandes

O KBLaM é um projeto de código aberto desenvolvido pela Microsoft, conhecido como Knowledge Base augmented Language Model (KBLaM). Ele transforma o conhecimento externo em vetores e o incorpora à camada de atenção de um modelo grande, de modo que o modelo possa usar diretamente esse conhecimento para responder a perguntas ou ...

LangGraph CodeAct: geração de código para ajudar as inteligências a resolver tarefas complexas

Introdução geral O LangGraph CodeAct é uma estrutura de código aberto no GitHub pela equipe de IA da LangChain, com base na arquitetura CodeAct (consulte o artigo arXiv:2402.01030 para obter detalhes). Ela ajuda as inteligências a processar tarefas complexas com eficiência, gerando e executando código Python. Essa ferramenta é usada pelo Manus...

BrowserTools MCP:实时监控浏览器活动的MCP服务-首席AI分享圈

BrowserTools MCP: serviço MCP para monitoramento em tempo real da atividade do navegador

Introdução geral O BrowserTools MCP é um projeto de código aberto desenvolvido pela equipe do AgentDeskAI. Ele permite que a IA monitore a atividade do navegador em tempo real, incluindo registros, solicitações de rede e capturas de tela, além de analisar o desempenho da Web, SEO e acessibilidade por meio de extensões do Chrome e serviços Node.js....

AgentLaboratory:利用智能代理完成科研全流程的开源工具-首席AI分享圈

AgentLaboratory: uma ferramenta de código aberto para completar todo o processo de pesquisa científica com agentes inteligentes

Introdução geral O AgentLaboratory é uma ferramenta de código aberto hospedada no GitHub e desenvolvida por Samuel Schmidgall. Ela usa agentes inteligentes orientados por modelos de linguagem ampla (LLMs) para ajudar os pesquisadores com todo o processo de pesquisa científica, incluindo revisão da literatura, projeto experimental e elaboração de relatórios. Essa ferramenta é...

Kilo Code:具有简洁使用体验的Roo Code分支-首席AI分享圈

Kilo Code: uma ramificação do Roo Code com uma experiência de usuário limpa

Introdução geral O Kilo Code é um plug-in de extensão de código aberto para o Visual Studio Code (VS Code). Ele usa tecnologia de inteligência artificial para ajudar os usuários a escrever códigos com mais eficiência. Esse projeto foi desenvolvido pela equipe do Kilo-Org, inicialmente bifurcado do Roo Code, seguido pela adição de mais recursos, como ...

AgentIQ:灵活连接和管理AI智能体的开源工具-首席AI分享圈

AgentIQ: uma ferramenta de código aberto para conexão e gerenciamento flexíveis de inteligências de IA

Introdução geral O AgentIQ é uma ferramenta de código aberto da NVIDIA projetada para ajudar os desenvolvedores a conectar e gerenciar eficientemente as inteligências de IA. Ela permite que as inteligências de diferentes estruturas colaborem perfeitamente, conectem dados e ferramentas empresariais e criem fluxos de trabalho como funções de chamada. Os melhores recursos dessa ferramenta são a flexibilidade e a re...

MIDI-3D:从单张图片快速生成多物体3D场景的开源工具-首席AI分享圈

MIDI-3D: uma ferramenta de código aberto para gerar rapidamente cenas 3D com vários objetos a partir de uma única imagem

Introdução geral O MIDI-3D é um projeto de código aberto desenvolvido pela equipe do VAST-AI-Research que pode gerar rapidamente cenas 3D contendo vários objetos a partir de uma única imagem para desenvolvedores, pesquisadores e criadores. Essa ferramenta é baseada em técnicas de modelagem de difusão de múltiplas instâncias, combinando inteligência artificial e modelagem 3D, e pode ser usada com...

TripoSF:快速生成高分辨率3D模型的实用工具-首席AI分享圈

TripoSF: uma ferramenta prática para a geração rápida de modelos 3D de alta resolução

Introdução geral O TripoSF é um projeto de código aberto criado pela equipe do VAST-AI-Research, especificamente projetado para gerar rapidamente modelos 3D de alta resolução a partir de uma única imagem. Ele usa uma tecnologia chamada SparseFlex, com eficiência de processamento, e pode ser executado em dispositivos comuns.

TripoSG:单张图像生成高分辨率3D建模数字资产-首席AI分享圈

TripoSG: geração de ativos digitais modelados em 3D de alta resolução a partir de uma única imagem

Introdução geral O TripoSG é um projeto de código aberto desenvolvido pela equipe de pesquisa VAST AI para gerar modelos 3D de alta qualidade a partir de uma única imagem. O projeto usa a tecnologia de conversor de fluxo retificador em larga escala, combinada com treinamento supervisionado híbrido e conjuntos de dados de alta qualidade, para permitir a geração de modelos 3D com detalhes geométricos claros e...

pt_BRPortuguês do Brasil