Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 992 artigos

Tags: ai projetos de código aberto Página 5

OpenAvatarChat:模块化设计的数字人对话工具-首席AI分享圈

OpenAvatarChat: uma ferramenta de diálogo humano digital projetada de forma modular

Introdução geral O OpenAvatarChat é um projeto de código aberto desenvolvido pela equipe HumanAIGC-Engineering e hospedado no GitHub. É uma ferramenta modular de diálogo humano digital que permite aos usuários executar todas as funcionalidades em um único PC. O projeto combina vídeo em tempo real, reconhecimento de fala e tecnologia humana digital...

uniOCR:跨平台开源的文字识别工具-首席AI分享圈

uniOCR: ferramenta de reconhecimento de texto de código aberto multiplataforma

Introdução geral O uniOCR é uma ferramenta de reconhecimento de texto de código aberto desenvolvida pela equipe mediar-ai. Ela é baseada na linguagem Rust e é compatível com os sistemas macOS, Windows e Linux. Ele é compatível com os sistemas macOS, Windows e Linux. Os usuários podem usá-lo para extrair texto de imagens, a operação é simples e gratuita. O principal recurso do uniOCR é o suporte a várias plataformas...

Serena:语义检索和编辑代码的免费MCP工具-首席AI分享圈

Serena: uma ferramenta MCP gratuita para recuperação semântica e edição de código

Introdução geral O Serena é uma ferramenta de programação gratuita e de código aberto desenvolvida pela equipe Oraios AI e hospedada no GitHub. É um assistente de código avançado que funciona diretamente em sua base de código para ajudar os desenvolvedores a analisar, editar e executar o código. O Serena é implementado por meio do Language Server Protocol (LSP)...

EasyControl:将人像转为吉卜力风格图像的免费工具-首席AI分享圈

EasyControl: uma ferramenta gratuita para transformar retratos em imagens no estilo Ghibli

Introdução geral O EasyControl é um projeto de código aberto que oferece controle de geração de imagens eficiente e flexível com base na arquitetura Diffusion Transformer (DiT). Entre eles, o Ghibli Control LoRA é um de seus recursos especiais, usando apenas 100 rostos asiáticos e suas imagens no estilo Ghibli geradas pelo GPT-4o...

YOLOE:实时视频检测和分割物体的开源工具-首席AI分享圈

YOLOE: uma ferramenta de código aberto para detecção de vídeo em tempo real e segmentação de objetos

O YOLOE é um projeto de código-fonte aberto desenvolvido pelo Grupo de Inteligência Multimídia (THU-MIG) da Escola de Software da Universidade de Tsinghua, com o nome completo "You Only Look Once Eye". Ele se baseia na estrutura PyTorch e é uma extensão da série YOLO, que pode detectar e segmentar qualquer objeto em tempo real. O projeto está hospedado no GitHub, ...

集成多种先进语音合成服务的开源运营项目-首席AI分享圈

Projeto operacional de código aberto que integra vários serviços avançados de síntese de fala

Introdução geral O Open-VoiceCanvas é uma plataforma de síntese de fala de código aberto desenvolvida pela equipe da ItusiAI. Ela é compatível com mais de 50 idiomas e pode converter texto em fala natural, além de clonar vozes personalizadas por meio do upload de áudio. O projeto integra o OpenAI TTS, o AWS Polly e o MiniMax três...

VideoMind:视频按时间戳定位内容与问答的开源项目-首席AI分享圈

VideoMind: vídeo por conteúdo de posicionamento de carimbo de data/hora e projeto de código aberto de perguntas e respostas

Introdução geral O VideoMind é uma ferramenta de IA multimodal de código aberto que se concentra em inferência, perguntas e respostas e geração de resumo para vídeos longos. Ele foi desenvolvido por Ye Liu, da Universidade Politécnica de Hong Kong, e por uma equipe do Show Lab da Universidade Nacional de Cingapura. A ferramenta imita a maneira como os humanos entendem o vídeo, dividindo as tarefas em planejamento,...

SuperCoder:命令行终端运行的智能代码助手-首席AI分享圈

SuperCoder: assistente de código inteligente para execução em terminal de linha de comando

Introdução geral O SuperCoder é uma ferramenta inteligente que é executada no terminal e foi projetada para programadores. Ele usa a tecnologia de IA para ajudar os usuários a pesquisar código, visualizar a estrutura do projeto, editar arquivos e corrigir bugs. O projeto tem código aberto por huytd no GitHub e é compatível com Linux, MacOS e Windows...

Emigo:在Emacs中使用AI完成复杂编程任务的助手-首席AI分享圈

Emigo: um assistente para tarefas de programação complexas usando IA no Emacs

Introdução geral O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub. O Emigo é um assistente de programação de IA de código aberto para o Emacs, desenvolvido por MatthewZMD no GitHub, que ajuda os programadores a concluir a análise, a geração, a modificação e outras tarefas de código no Emacs, integrando um modelo de linguagem em grande escala (LLM).

SegAnyMo:从视频中自动分割任意运动物体的开源工具-首席AI分享圈

SegAnyMo: uma ferramenta de código aberto para segmentar automaticamente objetos móveis arbitrários em vídeos

Introdução geral O SegAnyMo é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da UC Berkeley e da Universidade de Pequim, incluindo membros como Nan Huang. Essa ferramenta se concentra no processamento de vídeo e pode identificar e segmentar automaticamente objetos móveis arbitrários em um vídeo, como pessoas, animais ou veículos. Ela combina o TAP...

GenXD:生成任意3D和4D场景视频的开源框架-首席AI分享圈

GenXD: estrutura de código aberto para gerar vídeos de cenas arbitrárias em 3D e 4D

Introdução geral O GenXD é um projeto de código aberto desenvolvido pela Universidade Nacional de Cingapura (NUS) e pela equipe da Microsoft. Ele se concentra na geração de cenas arbitrárias em 3D e 4D, resolvendo a geração de 3D e 4D no mundo real devido à insuficiência de dados e à complexidade do design do modelo causada pelo problema. O projeto analisa o movimento da câmera e do objeto,...

ChatAnyone:从照片生成半身数字人肖像视频的工具-首席AI分享圈

ChatAnyone: uma ferramenta para gerar vídeos de retratos humanos digitais de meio corpo a partir de fotografias

Introdução geral O ChatAnyone é um projeto inovador desenvolvido pela equipe do HumanAIGC. Ele usa técnicas de inteligência artificial para gerar vídeos digitais de retratos humanos com movimentos da parte superior do corpo a partir de uma única foto e entrada de áudio. O projeto baseia-se em um modelo de difusão de movimento hierárquico que gera movimentos da cabeça, gestos e expressões para...

Search-R1:强化学习训练大模型搜索与推理的工具-首席AI分享圈

Search-R1: Aprendizado por reforço para treinar modelos grandes para pesquisa e raciocínio

Introdução geral O Search-R1 é um projeto de código aberto desenvolvido por PeterGriffinJin no GitHub e baseado na estrutura veRL. Ele usa técnicas de aprendizagem por reforço (RL) para treinar grandes modelos de linguagem (LLMs), permitindo que os modelos aprendam de forma autônoma a raciocinar e invocar mecanismos de pesquisa para resolver problemas. O projeto é compatível com o Qwen2.5...

DeepGemini:多模型编排任务并封装为API接口-首席AI分享圈

DeepGemini: orquestração de tarefas de vários modelos e encapsulamento em uma interface de API

Introdução geral O DeepGemini é um projeto de código aberto, criado pelo desenvolvedor Thomas Sligter. É uma ferramenta de gerenciamento de IA que oferece suporte à orquestração de vários modelos. O principal recurso é a capacidade de combinar com flexibilidade uma variedade de modelos de IA e é chamado por meio da interface de API compatível com OpenAI. O projeto é baseado em Python 3.11 e ...

Optexity:用人类演示训练AI执行网页操作的开源项目-首席AI分享圈

Optexity: um projeto de código aberto para treinar a IA para realizar ações na Web com demonstrações humanas

Introdução geral O Optexity é um projeto de código aberto no GitHub, desenvolvido pela equipe do Optexity. Sua essência é usar dados de demonstração humana para treinar a IA para concluir tarefas de computador, especialmente operações de páginas da Web. O projeto contém três bibliotecas de código: ComputerGYM, AgentAI e Playwright, e os usuários podem ...

II-Researcher:深度搜索与分步推理解答复杂问题-首席AI分享圈

II-Researcher: pesquisa profunda e raciocínio por etapas para responder a perguntas complexas

Introdução geral O II-Researcher é uma ferramenta de pesquisa de inteligência artificial de código aberto desenvolvida pela equipe do Intelligent-Internet e hospedada no GitHub. Ele foi projetado para pesquisa profunda e raciocínio complexo, e é capaz de responder a perguntas complexas por meio de pesquisas inteligentes na Web e análise em várias etapas. O projeto foi lançado em 27 de março de 2025...

Cua:让AI代理在macOS/Linux沙盒中安全执行应用-首席AI分享圈

Cua: habilitando agentes de IA para executar aplicativos com segurança em sandboxes do macOS/Linux

Introdução geral O Cua é um projeto de código aberto chamado Computer-Use Agent (pronuncia-se "koo-ah"), projetado para dispositivos Apple Silicon para criar e executar máquinas virtuais macOS e Linux de alto desempenho em velocidades próximas a 90% nativamente. Ele foi projetado para dispositivos Apple Silicon, pode criar e executar máquinas virtuais macOS e Linux de alto desempenho, com velocidades próximas às do dispositivo nativo 90%. O Cua usa o Ap...

Paper to Podcast:把学术论文转换为多人对话播客-首席AI分享圈

Paper to Podcast: conversão de artigos acadêmicos em podcasts de conversas com várias pessoas

Introdução geral O Paper to Podcast é uma ferramenta de código aberto especializada em transformar trabalhos de pesquisa acadêmica em podcasts animados e divertidos. Ela facilita a compreensão de conteúdos acadêmicos complexos usando tecnologia de inteligência artificial para transformar um artigo em formato PDF em um diálogo entre três personagens: o apresentador, o aluno e o especialista. Isso ...

pt_BRPortuguês do Brasil