Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 1020 artigos

Tags: ai projetos de código aberto Página 39

PrivateGPT:完全本地化RAG处理流程的文档问答系统-首席AI分享圈

PrivateGPT: um sistema de perguntas e respostas de documentos com fluxo de processamento de RAG totalmente localizado

Introdução geral O PrivateGPT é um projeto de IA disponível para ambientes de produção que permite aos usuários fazer testes em documentos usando modelos de linguagem grandes (LLMs) sem uma conexão com a Internet. O projeto garante a privacidade dos dados para o 100%, e todos os dados são processados no ambiente de execução do usuário sem divulgação.Priv...

AutoGPT:工作流自动化与自主执行任务的智能体构建平台-首席AI分享圈

AutoGPT: plataforma inteligente de criação de corpos para automação do fluxo de trabalho e execução autônoma de tarefas

Descrição geral O AutoGPT é uma plataforma avançada projetada para ajudar os usuários a criar, implementar e gerenciar agentes de IA em execução contínua e automatizar fluxos de trabalho complexos. Desenvolvida pela Significant Gravitas, a plataforma oferece uma ampla gama de ferramentas e recursos que permitem que os usuários se concentrem em tarefas importantes sem se preocupar com questões técnicas...

DragGAN:交互式图像编辑工具,点选和拖拽控制图像位置-首席AI分享圈

DragGAN: ferramenta interativa de edição de imagens, controle de apontar e clicar e arrastar e soltar a posição da imagem

Introdução geral O DragGAN é uma ferramenta interativa de edição de imagens baseada em Redes Adversárias Generativas (GAN). O projeto, apresentado na SIGGRAPH 2023 por Xingang Pan et al., tem como objetivo permitir que os usuários manipulem intuitivamente detalhes em imagens por meio de operações simples de apontar e clicar e arrastar e soltar.

Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。-首席AI分享圈

Qwen-Agent: uma estrutura baseada em Qwen para aplicativos de agentes inteligentes, incluindo chamadas de ferramentas, interpretadores de código, RAGs e extensões do Chrome.

Introdução abrangente O Qwen-Agent é uma estrutura de aplicativo de agente inteligente desenvolvida com base no Qwen 2.0 e superior, com recursos como acompanhamento de comandos, uso de ferramentas, planejamento e memória. A estrutura fornece uma variedade de aplicativos de amostra, como assistentes de navegador, intérpretes de código e assistentes personalizados para ajudar os desenvolvedores a construir rapidamente...

Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面-首席AI分享圈

Mini-Cover: um criador de capas on-line projetado para gerar capas personalizadas para blogs, vídeos curtos, mídias sociais e muito mais!

Introdução geral O Mini-Cover é uma ferramenta de geração de capas on-line de código aberto projetada para gerar capas personalizadas para plataformas como blogs, vídeos curtos e mídias sociais. Desenvolvida por JLinMr, a ferramenta tem como objetivo fornecer uma solução limpa e eficiente para ajudar os usuários a gerar rapidamente capas que atendam às suas necessidades.

MarkItDown:微软文档智能转换工具,转换各种文件为Markdown格式-首席AI分享圈

MarkItDown: Ferramenta de conversão inteligente de documentos da Microsoft, converte vários arquivos para o formato Markdown

Introdução geral O MarkItDown é uma ferramenta Python desenvolvida pela Microsoft e projetada para converter vários arquivos e documentos de escritório para o formato Markdown. A ferramenta oferece suporte a uma ampla variedade de tipos de arquivos, incluindo PDF, PowerPoint, Word, Excel, imagens (metadados EXIF e OCR), áudio (metadados EXIF e idioma...

Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手-首席AI分享圈

Claude Engineer: um assistente de diálogo corporal inteligente que gera e gerencia de forma autônoma ferramentas de IA usando o modelo Claude

Introdução geral O Claude Engineer é uma interface de linha de comando (CLI) interativa desenvolvida por Doriandarko que utiliza o modelo Claude-3.5-Sonnet da Anthropic para auxiliar nas tarefas de desenvolvimento de software. A estrutura permite que o Claude gere e gerencie suas próprias ferramentas, ampliando continuamente seus recursos por meio do diálogo...

Swarms:多智能体编排框架,企业级生产工具-首席AI分享圈

Swarms: estrutura de orquestração de inteligência múltipla, ferramenta de produção empresarial

Introdução geral O Swarms é uma estrutura de orquestração de vários agentes de nível empresarial pronta para produção, projetada para aumentar a produtividade dos negócios por meio do gerenciamento eficiente de agentes e do processamento de tarefas. Com suporte para vários modelos, vários sistemas de memória e criação de agentes personalizados, a estrutura oferece um design modular e recursos abrangentes de registro para garantir a...

Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频-首席AI分享圈

Sonic: Imagens de retrato com áudio geram vídeos de demonstração digital com expressões faciais vívidas

Introdução geral O Sonic é uma plataforma inovadora focada na percepção global de áudio, projetada para gerar animações de retratos vívidos impulsionadas pelo áudio. Desenvolvida por uma equipe de pesquisadores da Tencent e da Universidade de Zhejiang, a plataforma usa informações de áudio para controlar expressões faciais e movimentos da cabeça para gerar vídeos animados naturais e suaves.

Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现-首席AI分享圈

Ultravox: um macromodelo multimodal de áudio para diálogo de voz de ponta a ponta em tempo real, uma implementação de código aberto da interação de voz GPT-4o

Introdução abrangente O Ultravox é um inovador modelo multimodal de linguagem grande (LLM) projetado para processamento de fala em tempo real. Ao contrário dos sistemas tradicionais de reconhecimento de fala, o Ultravox elimina a necessidade de um estágio separado de reconhecimento de fala em áudio (ASR) e é capaz de converter diretamente o áudio em texto em um espaço de alta dimensão. Esse recurso torna...

infinite-zoom-stable-diffusion:生成无限缩放循环视频-首席AI分享圈

infinite-zoom-stable-diffusion: gerar vídeo em loop com zoom infinito

Introdução abrangente O Infinite Zoom Stable Diffusion (Difusão estável de zoom infinito) é um projeto de código aberto desenvolvido para criar vídeos com zoom infinito usando técnicas de difusão estável. O projeto oferece um notebook Colab fácil de usar, em que os usuários podem gerar um loop infinito de vídeo por meio de vários prompts. Projeto ...

Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip-首席AI分享圈

Easy-Wav2Lip: ferramenta para sincronização labial de vídeo de alta qualidade, otimizada para Wav2Lip

Introdução geral O Easy-Wav2Lip é uma ferramenta aprimorada baseada no Wav2Lip, projetada para simplificar o processo de sincronização labial de vídeo. A ferramenta oferece configuração e implementação mais simples, suporta o Google Colab e a instalação local. Ao otimizar o algoritmo, o Easy-Wav2Lip aumenta significativamente a velocidade de processamento e corrige...

Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。-首席AI分享圈

Research Rabbit: pesquisa na Web e elaboração de relatórios usando o LLM nativo, detalhando automaticamente os tópicos especificados pelo usuário e gerando resumos.

Introdução geral O Research Rabbit é um assistente nativo de pesquisa e resumo na Web baseado em LLM (Large Language Model). Depois que o usuário fornece um tópico de pesquisa, o Research Rabbit gera uma consulta de pesquisa, obtém resultados relevantes na Web e resume esses resultados. Ele repetirá esse processo para preencher a lacuna de conhecimento...

AgentClientDemo: um cliente Python que demonstra o processo de execução de um corpo inteligente, fornecendo uma interface gráfica de usuário intuitiva

Introdução abrangente O AgentClientDemo é um projeto Python abrangente que integra a funcionalidade inteligente (Agente) e cliente (Cliente). O projeto é baseado na estrutura PyQt e oferece uma interface gráfica do usuário (GUI) intuitiva e fácil de usar. Com esse projeto, os usuários podem experimentar o corpo inteligente...

HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替-首席AI分享圈

HelloMeme: gere imagens ou vídeos consistentes com ações de expressão local de alta fidelidade, Runway Act one open source ping pong!

Introdução abrangente O HelloMeme é um projeto de código aberto desenvolvido pela HelloVision, com o objetivo de gerar imagens e vídeos de alta qualidade por meio da integração do Spatial Knitting Attentions para incorporar condições de alto nível e alta fidelidade em modelos de difusão. O código e a modelagem do projeto ...

Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务-首席AI分享圈

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Introdução abrangente O Chunkr é uma API auto-hospedada dedicada à conversão de arquivos PDF, PPTX, DOCX e Excel em dados adequados para uso em RAG (Retrieval Augmented Generation) e LLM (Large Language Modelling). Ela foi desenvolvida pela Lumina AI Inc. e usa modelos visuais avançados para a ingestão de documentos...

GitIngest:快速将Github代码仓库转为适合LLM理解的文本-首席AI分享圈

GitIngest: Converta rapidamente repositórios de código do Github em texto adequado para compreensão do LLM

Introdução geral O GitIngest é uma ferramenta de código aberto projetada para transformar repositórios de código do GitHub em texto adequado para dicas do Modelo de Linguagem Grande (LLM). Com uma operação simples, os usuários podem extrair e formatar o conteúdo de qualquer repositório do GitHub em texto adequado para o uso do LLM. A ferramenta oferece análise com um clique...

CodeArena:开源LLM编程能力对比竞技场,实时查看最佳代码生成模型-首席AI分享圈

CodeArena: Arena de comparação de recursos de programação LLM de código aberto, visualização em tempo real dos melhores modelos de geração de código

Introdução geral A CodeArena é uma plataforma exclusiva projetada para apresentar os melhores modelos de geração de código-fonte aberto (LLMs) por meio de confrontos em tempo real. Os usuários podem assistir a diferentes LLMs competindo nas mesmas tarefas de programação e ver os modelos com melhor desempenho por meio de tabelas de classificação em tempo real. A plataforma utiliza a Together AI para gerar código...

NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全-首席AI分享圈

NSFW Detector: detecta se um arquivo contém conteúdo NSFW para proteger a segurança dos dados.

Introdução abrangente O NSFW Detector é uma ferramenta de detecção de conteúdo incômodo baseada em IA, usada principalmente para detectar se imagens, vídeos, arquivos PDF etc. contêm conteúdo incômodo. A ferramenta adota o modelo Falconsai/nsfwimagedetection e usa o vit-base-patch16-224-in do Google...

pt_BRPortuguês do Brasil