Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife
Total de 1020 artigos

Tags: ai projetos de código aberto Página 48

Podcastfy:多源内容转多语言音频对话工具,NotebookLM 播客功能的开源替代方案-首席AI分享圈

Podcastfy: conteúdo de várias fontes para ferramenta de conversação de áudio multilíngue, uma alternativa de código aberto aos recursos de podcasting do NotebookLM

Introdução geral O Podcastfy é um pacote Python de código aberto que usa a tecnologia GenAI (Generative Artificial Intelligence, Inteligência Artificial Generativa) para converter conteúdo da Web, arquivos PDF, texto, imagens, vídeos do YouTube e muitas outras fontes em diálogos de áudio multilíngues envolventes. Diferentemente da interface de usuário tradicional...

One API:多模型API管理与负载均衡,分发系统-首席AI分享圈

Uma API: gerenciamento de API de vários modelos e balanceamento de carga, sistema de distribuição

Introdução abrangente O One API é um sistema de distribuição e gerenciamento de interface de código aberto que oferece suporte a uma ampla variedade de modelos grandes, como o OpenAI ChatGPT, o Anthropic Claude, o Google PaLM 2 e o Gemini. O sistema acessa todos os grandes modelos por meio do formato padrão da API da OpenAI, fornecendo balanceamento de carga, token...

文多多 AiPPT:AI生成PPT,演讲稿生成-首席AI分享圈

Wenduoduo AiPPT: PPT gerado por IA, geração de apresentações

Introdução abrangente O AiPPT é uma ferramenta de geração de PPT baseada em tecnologia de inteligência artificial, projetada para ajudar os usuários a criar rapidamente apresentações profissionais. Ele gera automaticamente slides ricos em conteúdo e com design bonito ao inserir um tema, carregar um arquivo ou fornecer um URL, etc. Ele oferece suporte a gráficos nativos, animações e efeitos 3D e outros recursos complexos...

Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频-首席AI分享圈

Easegen: plataforma de produção de curso humano digital de código aberto, vídeo de palestra humana digital de clonagem de geração de PPT com um clique

Introdução geral A Easegen é uma plataforma de código aberto para a criação de cursos humanos digitais que visa melhorar a eficiência da produção e do gerenciamento de conteúdo de ensino por meio da tecnologia de IA. A plataforma oferece uma solução completa, desde a produção do curso, o gerenciamento de vídeo até o questionamento inteligente, o que permite que os usuários criem cursos digitais em vídeo explicados por humanos e usem a IA ...

Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts-首席AI分享圈

Open Canvas: tela colaborativa de edição de código, versão de código aberto do OpenAI Canvas/Claude Artifacts

Introdução geral A LangChain apresenta o Open Canvas, um aplicativo da Web de código aberto projetado para aprimorar a experiência de edição e colaboração de documentos com funcionalidade de memória de agente duplo integrada e smith integrado para observar todos os detalhes da execução. A plataforma é inspirada no "Canvas" da OpenAI, mas de várias maneiras...

AutoGen Studio:多代理系统AutoGen的简易用户界面版-首席AI分享圈

AutoGen Studio: versão de interface fácil de usar do sistema multiagente AutoGen

Introdução geral O AutoGen Studio 2.0 é uma interface de usuário desenvolvida pelo AutoGen para simplificar o processo de criação e gerenciamento de soluções multiagentes. A plataforma permite que os usuários definam e modifiquem declarativamente os agentes e seus fluxos de trabalho por meio de uma interface intuitiva que facilita até mesmo para os iniciantes...

MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具-首席AI分享圈

MeetingMind: Ferramenta inteligente de código aberto para registro e resumo de reuniões que se baseia no OpenAI Whisper

Descrição geral O MeetingMind é um aplicativo avançado de IA projetado para melhorar a eficiência da captura e do resumo de reuniões de negócios. O aplicativo integra a tecnologia Whisper da OpenAI para obter precisão na conversão de voz em texto e usa a IA do IBM Watson para analisar e extrair os principais pontos do texto transcrito....

Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能-首席AI分享圈

Coqui TTS (xTTS): um kit de ferramentas de aprendizagem profunda para geração de texto para fala com suporte multilíngue e recursos de clonagem de voz

Introdução abrangente O Coqui TTS é um kit de ferramentas de geração de texto para fala (TTS) avançado e de código aberto baseado em técnicas de aprendizagem profunda. Ele foi testado em ambientes de pesquisa e de produção e oferece um rico conjunto de recursos e modelos que suportam a conversão de texto em fala em vários idiomas.

MemFree:本地知识库与搜索信息混合的AI搜索引擎-首席AI分享圈

MemFree: um mecanismo de pesquisa de IA que combina bases de conhecimento locais com informações de pesquisa

Introdução geral O MemFree é um mecanismo de pesquisa de IA híbrido avançado capaz de pesquisar e fazer perguntas por meio de texto, imagens, documentos e páginas da Web. Ele fornece acesso com um clique aos resultados de pesquisa de texto, mapas mentais, imagens e vídeos. O objetivo do MemFree é capturar a base de conhecimento do usuário e toda a Internet...

BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)-首席AI分享圈

BlinkShot: geração de imagens em tempo real digitando palavras de alerta (acesso gratuito ao modelo Flux Schnell)

Descrição geral O BlinkShot é um gerador de imagens de IA em tempo real e de código aberto que utiliza a tecnologia Together AI e Flux Schnell para permitir que os usuários gerem imagens de alta qualidade à medida que digitam instruções. A plataforma é totalmente gratuita e oferece suporte à personalização do usuário e ao desenvolvimento secundário para designers, artistas e criadores de conteúdo...

FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别-首席AI分享圈

FunASR: kit de ferramentas de reconhecimento de fala de código aberto, separação de locutor / reconhecimento de fala de diálogo com várias pessoas

Introdução abrangente O FunASR é um kit de ferramentas de reconhecimento de fala de código aberto desenvolvido pelo Alibaba's Dharma Institute para unir pesquisa acadêmica e aplicações industriais. Ele oferece suporte a uma ampla variedade de recursos de reconhecimento de fala, incluindo reconhecimento de fala (ASR), detecção de ponto final de voz (VAD), recuperação de pontuação, modelagem de linguagem, verificação de falante, fala...

UltraPixel:革新超高分辨率图像生成技术,图像细节丰富-首席AI分享圈

UltraPixel: tecnologia revolucionária de geração de imagens de altíssima resolução com riqueza de detalhes de imagem

Introdução geral O UltraPixel é uma tecnologia avançada de geração de imagens de resolução ultra-alta projetada para criar imagens de altíssima qualidade e ricas em detalhes. O projeto foi desenvolvido pelo usuário catcathh do GitHub e apresentado no NeurIPS 2024. O UltraPixel é compatível com imagens de qualquer resolução, de 1K a 6K...

SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天-首席AI分享圈

SiYuan (SiYuan Notes): software de gerenciamento de conhecimento pessoal que prioriza a privacidade com suporte a bate-papo de perguntas e respostas/escrita de IA

Geral: o SiYuan Notes (SiYuan) é um software de gerenciamento de conhecimento pessoal que prioriza a privacidade, é totalmente de código aberto e oferece suporte à auto-hospedagem. Ele é escrito em TypeScript e Golang e fornece referências refinadas em nível de bloco e edição Markdown WYSIWYG. O SiYuan Notes foi projetado para ajudar os usuários...

阿布量化交易系统:基于Python的开源量化交易平台-首席AI分享圈

Sistema de negociação quantitativa Abu: plataforma de negociação quantitativa de código aberto baseada em Python

Introdução geral O Abu Quantitative Trading System é uma plataforma de código aberto baseada em Python. Foi criada pelo usuário "bbfamily" para ajudar os investidores a implementar estratégias de negociação quantitativas por meio de código. O sistema suporta backtesting e negociação de vários produtos financeiros, como ações, opções, futuros e bitcoin. Ele combina técnicas de aprendizado de máquina...

Knowledge Table:高效提取与探索结构化数据的开源工具-首席AI分享圈

Knowledge Table: uma ferramenta de código aberto para extração e exploração eficientes de dados estruturados

Introdução abrangente A Knowledge Table (Tabela de conhecimento) é um projeto de código aberto criado para simplificar o processo de extração e exploração de dados estruturados de documentos não estruturados. Os usuários podem criar representações de conhecimento estruturado, como tabelas e gráficos, por meio de uma interface de consulta em linguagem natural. A ferramenta é compatível com regras e formatos de extração personalizados...

CogView3:智谱轻言开源的级联扩散文本生成图像模型-首席AI分享圈

CogView3: modelo de imagem de geração de texto de difusão em cascata de código aberto do Wisdom Spectrum

Introdução abrangente O CogView3 é um sistema avançado de geração de imagens de texto desenvolvido pela Universidade de Tsinghua e pela Think Tank Team (Chi Spectrum Qingyan). Ele se baseia no modelo de difusão em cascata e gera imagens de alta resolução por meio de vários estágios. Os principais recursos do CogView3 incluem geração em vários estágios, arquitetura inovadora e desempenho eficiente para a criação artística...

RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用-首席AI分享圈

RocketNotes: aplicativo de anotações Markdown com preenchimento de texto, diálogo de documentos e suporte à pesquisa semântica

Introdução abrangente O RocketNotes é um aplicativo de anotações Markdown baseado na Web que integra preenchimento de texto, bate-papo e pesquisa semântica orientados pelo Large Language Model (LLM). Criado usando o pipeline RAG (Relevant AI Guided) sem servidor 100%, o projeto tem como objetivo simplificar a...

F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音-首席AI分享圈

F5-TTS: clonagem de fala sem amostras para gerar vozes clonadas suaves e emocionalmente ricas

O Synthesis F5-TTS é um novo sistema não-autoregressivo de conversão de texto em fala (TTS) baseado em um transformador de difusão (DiT) compatível com o fluxo. O sistema melhora significativamente a qualidade da síntese usando o modelo ConvNeXt para otimizar a representação do texto e facilitar o alinhamento com a fala...

AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端-首席AI分享圈

AsrTools: ferramenta de fala para legenda, cliente leve com interfaces integradas para Cutscene, Racer e Must-Cut

Introdução abrangente O AsrTools é uma ferramenta inteligente de conversão de voz em texto com interfaces integradas de grandes empresas, como Cutscene, Racer, Must Cut etc. Não requer GPU nem configurações complicadas e oferece suporte ao processamento eficiente de lotes com vários threads. Foi desenvolvido com base no PyQt5, com uma interface bonita e fácil de usar, capaz de gerar arquivos de legendas nos formatos SRT e TXT. A ferramenta funciona ajustando...

pt_BRPortuguês do Brasil