Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 1020 artigos

Tags: ai projetos de código aberto Página 38

Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟-首席AI分享圈

Genesis: mecanismo de física generativo de código aberto para simulação de mundo dinâmico 4D baseado em física real

Introdução geral O Genesis é um mundo de física generativa projetado para robótica de uso geral e aprendizado de IA incorporado. Ele fornece uma plataforma de simulação unificada que suporta a simulação de uma ampla gama de materiais e fenômenos físicos. O Genesis tem como objetivo desbloquear uma variedade infinita de dados combinando IA generativa e simulação física para ajudar a máquina...

Kolors:生成高质量图像的文本到图像模型,支持生成中文海报-首席AI分享圈

Kolors: modelo de texto para imagem para gerar imagens de alta qualidade, com suporte para gerar pôsteres em chinês

Introdução abrangente O Kolors é um modelo de geração de texto para imagem em grande escala desenvolvido pela equipe do Racer, com base em técnicas de difusão de potencial. O modelo é treinado em bilhões de pares de dados de texto-imagem e é capaz de gerar imagens de alta qualidade, complexas e semanticamente precisas, com suporte para entradas em chinês e inglês.

ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量-首席AI分享圈

ColorFlow: sombreamento de desenhos animados, sombreamento automático de imagens em preto e branco para melhorar a consistência e a qualidade da cor da imagem

Introdução abrangente O ColorFlow é uma ferramenta de coloração automática de sequências de imagens desenvolvida pela equipe do Tencent ARC para resolver o problema de coloração automática de sequências de imagens em preto e branco. A ferramenta aproveita a recuperação de um pipeline de coloração aprimorado para gerar com precisão as cores de vários elementos, incluindo a cor do cabelo e a roupa do personagem, a partir de um conjunto de imagens de referência, garantindo que a cor seja a mesma...

BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具-首席AI分享圈

BrushEdit: ferramenta multifuncional para restauração e edição de imagens lançada pela Tencent ARC

Introdução abrangente O BrushEdit é uma ferramenta completa de reparo e edição de imagens desenvolvida pela Tencent ARC Labs. A ferramenta é baseada na mais recente tecnologia de IA e é capaz de identificar e reparar automaticamente defeitos em imagens, além de oferecer suporte à edição interativa pelos usuários.

Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出-首席AI分享圈

Contornos: gerar saída de texto estruturado por meio de expressões regulares, JSON ou modelos Pydantic

Introdução geral Outlines é uma biblioteca de código aberto desenvolvida pela dottxt-ai para aprimorar a aplicação de modelos de linguagem grande (LLMs) por meio da geração de texto estruturado. A biblioteca é compatível com uma variedade de integrações de modelos, incluindo OpenAI, transformadores, llama.cpp, etc. Ela fornece prompts simples, mas poderosos, para proto...

RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)-首席AI分享圈

RapBank: um modelo para gerar diretamente vocais de rap (Rap) a partir de letras e faixas de apoio (conjunto de dados atualmente aberto)

Introdução geral O RapBank é um conjunto de dados e ferramentas projetado para a geração de letras de músicas de rap. O projeto foi criado pela NZqian para fornecer a pesquisadores e desenvolvedores um conjunto de dados de letras de rap de alta qualidade, coletando e processando músicas de rap do YouTube.

R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统-首席AI分享圈

R2R: um sistema avançado de recuperação de IA (RAG) para análise de conteúdo multimodal e combinação de gráfico de conhecimento com pesquisa híbrida

Introdução abrangente O R2R (RAG to Riches) é um sistema de recuperação de IA de última geração que oferece suporte à funcionalidade Retrieval Augmented Generation (RAG) com recursos prontos para produção. Criado em uma API RESTful em contêiner, o sistema oferece análise de conteúdo multimodal, recursos de pesquisa híbrida, GraphRAG configurável e recursos abrangentes...

Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析-首席AI分享圈

Megrez-3B-Omni: um modelo de compreensão multimodal do lado final que oferece suporte à compreensão e análise multimodal de texto, imagem e áudio

Introdução abrangente O Infini-Megrez é uma solução de inteligência de ponta desenvolvida pela cúpula de núcleo inquestionável (Infinigence AI), com o objetivo de obter compreensão e análise multimodais eficientes por meio de co-projeto de hardware e software. No centro do projeto está o modelo Megrez-3B, que oferece suporte à compreensão integrada de imagem, texto e áudio com alta precisão...

GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)-首席AI分享圈

GenEx: geração de mundos 3D exploráveis em 360° a partir de uma única imagem (código progressivamente de código aberto)

Introdução geral O GenEx é um modelo avançado de IA capaz de gerar um mundo 3D 360° totalmente explorável a partir de uma única imagem. Os usuários podem explorar interativamente esse mundo gerado. O GenEx ultrapassa os limites da IA figurativa em espaços imaginativos e tem o potencial de estender esses recursos para apresentar...

RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流-首席AI分享圈

RAGFlow: um mecanismo RAG de código aberto baseado na compreensão profunda de documentos, fornecendo fluxos de trabalho de geração aprimorados por recuperação eficientes

Introdução abrangente O RAGFlow é um mecanismo RAG (Retrieval Augmented Generation) de código aberto baseado na tecnologia de compreensão profunda de documentos. Ele fornece um fluxo de trabalho RAG eficiente para empresas de todos os portes, incorporando um modelo de linguagem em grande escala (LLM) capaz de fornecer recursos de perguntas e respostas do mundo real com base em dados em formatos complexos.

NodeTool:基于节点编排的AI模型工作流可视化客户端-首席AI分享圈

NodeTool: um cliente de visualização de fluxo de trabalho para modelos de IA com base na orquestração de nós

Introdução geral O NodeTool é uma plataforma inovadora de criação de IA projetada para fornecer uma interface simples e intuitiva para entusiastas de IA, desenvolvedores, cientistas de dados e criativos. Seja você um artista, desenvolvedor ou iniciante, o NodeTool o ajuda a criar protótipos de ideias e visualizá-los rapidamente sem...

Porkybank:AI驱动的日常预算管理,轻松追踪每日预算-首席AI分享圈

Porkybank: gerenciamento de orçamento diário com tecnologia de IA para facilitar o acompanhamento de orçamentos diários

Descrição geral O Porkybank é um aplicativo de gerenciamento de finanças pessoais de código aberto desenvolvido para ajudar os usuários a controlar facilmente seu orçamento diário. Com uma fórmula simples (Renda - Despesas) / Dias = Dinheiro, os usuários podem visualizar sua situação financeira. O projeto está hospedado no GitHub e usa Elixir e P...

CrewAI:多角色扮演协作智能框架,简化复杂任务-首席AI分享圈

CrewAI: uma estrutura de inteligência colaborativa para vários papéis para simplificar tarefas complexas

Introdução abrangente O CrewAI é uma estrutura avançada projetada para orquestrar a colaboração entre agentes de IA autônomos e de interpretação de papéis. Ao facilitar a inteligência colaborativa, o CrewAI permite que os agentes trabalhem juntos sem problemas para resolver tarefas complexas. Seja para criar plataformas de assistentes inteligentes, automatizar equipes de atendimento ao cliente ou equipes de pesquisa com vários agentes, o Crew...

Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件-首席AI分享圈

Artab: mostra pinturas mundialmente famosas em uma nova guia aberta no navegador, plug-in do Chrome

Descrição geral O Artab é uma extensão de navegador projetada para exibir as maiores obras de arte do mundo sempre que você abrir uma nova guia. A extensão está disponível para os navegadores Chrome, Edge e Firefox. Com o Artab, os usuários podem desfrutar de uma ampla variedade de obras de arte clássicas em sua navegação diária, aprimorando...

Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型-首席AI分享圈

Leffa: modelo de alta fidelidade, teste virtual e ajuste de pose de personagens, modelo de geração de imagens de personagens controlados com código aberto

Introdução abrangente O Leffa é uma estrutura unificada para gerar imagens de personagens controláveis, permitindo a manipulação precisa da aparência do personagem (por exemplo, ajuste virtual) e da pose (por exemplo, transferência de pose). A estrutura reduz significativamente a distorção de detalhes refinados, direcionando a consulta de destino para focar na chave de referência correta na camada de atenção, ao mesmo tempo em que preserva...

MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具-首席AI分享圈

MMAudio: geração de efeitos sonoros e trilhas sonoras sincronizadas para filmagens de vídeo, ferramenta de treinamento conjunto multimodal de vídeo para áudio

Introdução geral O MMAudio é um projeto de código aberto que visa a gerar áudio sincronizado de alta qualidade por meio de treinamento multimodal conjunto. Desenvolvido por Ho Kei Cheng e outros na Universidade Chinesa de Hong Kong, a principal função do projeto é gerar áudio sincronizado com base na entrada de vídeo e/ou texto.

H2O GPT:灵活配置的本地AI对话与文档处理工具-首席AI分享圈

H2O GPT: configuração flexível de ferramentas nativas de diálogo e processamento de documentos de IA

Introdução geral O H2O GPT é um projeto de código aberto que tem como objetivo fornecer recursos privatizados de bate-papo e processamento de documentos. O projeto é baseado na licença Apache 2.0 e oferece suporte a vários modelos de GPT, incluindo LLaMa2, Mistral, Falcon e assim por diante. Os usuários podem usar o H2O GPT para obter documentos locais (como PDF, E...

OpenChat:快速集成多数据源的自定义聊天机器人-首席AI分享圈

OpenChat: Chatbots personalizados para integração rápida de várias fontes de dados

Introdução geral O OpenChat é um console de chatbot fácil de usar, projetado para simplificar o uso de LLMs (Large Language Models). Ao fornecer um processo de configuração em duas etapas, o OpenChat permite que os usuários criem e gerenciem facilmente vários chatbots personalizados. A plataforma é compatível com os modelos GPT-3 e GPT-4 e...

LocalGPT:在本地设备上与多文档对话,确保数据隐私-首席AI分享圈

LocalGPT: garanta a privacidade dos dados conversando com vários documentos em dispositivos locais

Introdução geral O LocalGPT é um projeto de código aberto criado para permitir que os usuários conversem com documentos em dispositivos locais, garantindo a privacidade dos dados. Ao usar vários modelos de código aberto, o LocalGPT pode processar e entender o conteúdo de documentos sem carregar dados na nuvem. O projeto é compatível com diversas plataformas, incluindo GPU, C...

pt_BRPortuguês do Brasil