Aprendizagem pessoal com IA
e orientação prática
Espelho de desenho CyberKnife

Artigos de Yang Fan

4 步速通 LLM 微调:手把手带你用 SiliconCloud 打造领域大模型-首席AI分享圈

4 etapas para o ajuste fino do LLM: um guia prático para criar grandes modelos de domínio com o SiliconCloud

Anteriormente, o SiliconCloud colocou no ar o recurso de ajuste fino LoRA on-line para modelos de linguagem. Basta fazer o upload dos dados do corpus e criar uma tarefa de ajuste fino para obter um modelo de linguagem com ajuste fino exclusivo. Recentemente, o ajuste fino do LoRA on-line do LLM do SiliconCloud foi ampliado para incluir o Qwen2.5-32B, o Qwen2.5-1...

VITA:开源视觉与语音实时交互的多模态大语言模型-首席AI分享圈

VITA: Modelos de linguagem multimodal de grande porte de código aberto para interação visual e de fala em tempo real

Introdução geral O VITA é um projeto líder de modelagem de linguagem grande multimodal interativa de código aberto, pioneiro na capacidade de obter uma verdadeira interação multimodal completa. O projeto lançou o VITA-1.0 em agosto de 2024, sendo pioneiro no primeiro modelo de linguagem grande totalmente modal e interativo de código aberto.

Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策-首席AI分享圈

Trend Finder: rastreamento de tendências de mídia social, tópicos de tendências e novos artigos em tempo real para decisões de marketing.

Introdução geral O Trend Finder é uma ferramenta poderosa criada para ajudar os usuários a rastrear tópicos e tendências nas mídias sociais em tempo real. Ao coletar e analisar publicações dos principais influenciadores, o Trend Finder pode enviar notificações oportunas do Slack quando novas tendências ou lançamentos de produtos são detectados. Essa ferramenta é extremamente...

AI 编程:如何用好 Lovable-首席AI分享圈

Programação de IA: como usar bem o Lovable

Atualmente, meus melhores parceiros de programação de IA são o Lovable e o Cursor. O bolt.new e o windsurf também são muito bons, escolhi os dois primeiros porque o teto é alto o suficiente. Site do Lovable: https://lovable.dev/ O Lovable pode não ser tão famoso quanto o bolt.new, mas recomendo a todos que o experimentem...

老罗发布的首个AI产品 J1 Assistant 功能评测-首席AI分享圈

Lançado o primeiro produto de IA da Lao Luo Análise dos recursos do J1 Assistant

Luo Yonghao está entrando novamente no setor de IA desta vez. Conforme relatado anteriormente, sua nova empresa, a Thin Red Line, lançará seu primeiro produto novo desde sua criação por volta do Ano Novo Chinês da Serpente. Já em abril do ano passado, Luo Yonghao provocou pela primeira vez em uma transmissão ao vivo que lançaria um produto misterioso, que ele descreveu como "inovação disruptiva e destrutiva...

J1 Assistant:下载J1助手,体验全新互动方式的语音AI助理-首席AI分享圈

J1 Assistant: Faça o download do J1 Assistant para experimentar uma nova forma interativa de assistente de IA por voz

Introdução geral A Matter.ai é uma empresa inovadora dedicada a fornecer soluções avançadas de inteligência artificial. Seu produto mais recente, o J1 Assistant (J1 Assistant), já está disponível na versão 0.8.3-beta1, com suporte para as séries Samsung Galaxy S24, S23 e S22, bem como para as séries Pixel 9 e Pixel 8...

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução abrangente O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo em linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo o modelo de reconhecimento de fala Whisper e uma variedade de back-ends de tradução (como o Dee...

TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具-首席AI分享圈

TransRouter: uma ferramenta de conversão de áudio em tempo real para tradução de chinês para inglês com base no modelo multimodal Gemini

O TransRouter é uma ferramenta de tradução de voz em tempo real baseada no modelo Gemini do Google, projetada para tradução de voz em tempo real entre inglês e chinês. Ele pode ser perfeitamente integrado ao software de videoconferência, como o Zoom, para oferecer suporte à tradução em tempo real para comunicação entre idiomas.

opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现-首席AI分享圈

opensource_notebooklm: implementação de código aberto do NotebookLM com base no Deepseek-V3 e no PlayHT TTS

Introdução geral O NotebookLM de código aberto é um projeto inovador de IA que combina os recursos de compreensão de linguagem do Deepseek-V3 com a tecnologia de síntese de fala do PlayHT, com o objetivo de criar um sistema inteligente de diálogo para anotações. Desenvolvido pela equipe do Build Fast with AI, o projeto transforma o conteúdo de texto em...

Open Deep Research:生成基于网络搜索内容的AI研究报告-首席AI分享圈

Open Deep Research: geração de pesquisa de IA com base em conteúdo de pesquisa na Web

Introdução abrangente O Open Deep Research é uma ferramenta de geração de relatórios de pesquisa orientada por IA de código aberto que serve como uma alternativa de código aberto aos recursos de pesquisa profunda do Google Gemini. Desenvolvido em TypeScript e com base na estrutura Next.js 15, o projeto integra a API de pesquisa do Azure Bing e o Google Gemini ...

Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)-首席AI分享圈

Visão é tudo o que você precisa: Criação de um sistema inteligente de recuperação de documentos usando modelos de linguagem visual (Vision RAG)

Introdução abrangente O Vision-is-all-you-need é um projeto inovador de demonstração do sistema visual RAG (Retrieval Augmented Generation) que abre novos caminhos na aplicação da Modelagem de Linguagem Visual (VLM) ao domínio de processamento de documentos. Diferentemente dos métodos tradicionais de fragmentação de texto, o sistema usa modelos de linguagem visual diretamente para processar as páginas de um arquivo PDF...

Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能-首席AI分享圈

Scira (MiniPerplx): projeto de código aberto que imita o Perplexity, integrando diálogo de IA, pesquisa na Web, consulta meteorológica etc.

Introdução geral O MiniPerplx (renomeado Scira) é um mecanismo de pesquisa com IA de design minimalista que integra vários recursos úteis para fornecer aos usuários uma gama completa de serviços de recuperação de informações. O projeto usa uma pilha de tecnologia moderna, incluindo Next.js, Tailwind CSS e Vercel AI SDK, e...

使用Whisper免费将语音转录为多种格式逐字稿-首席AI分享圈

Use o Whisper para transcrever sua voz em vários formatos, literalmente e de graça!

  Você precisa transcrever gravações de reuniões ou entrevistas em texto com frequência? Como escrever transcrições literais é demorado e trabalhoso, talvez você queira usar ferramentas de IA para converter gravações de áudio em texto. Neste artigo, apresentaremos o Whisper, um sistema de reconhecimento automático de fala (ASR) lançado pela equipe da OpenAI. De acordo com a OpenA...

阅读英文文章提升托福考试阅读能力的提示词-首席AI分享圈

Dicas de leitura de artigos em inglês para melhorar as habilidades de leitura no TOEFL

  Prompt Words Digite o conteúdo a ser convertido aqui Quando eu lhe der um texto em inglês (por exemplo, um relatório do The Economist ou do WSJ), forneça uma tradução e uma paráfrase de acordo com os seguintes requisitos: Requisitos de tradução: Traduza o texto do inglês para o chinês de forma natural e fluente. Traduzir o texto do inglês para o chinês de forma fluente e natural.

什么是 AI「世界模型」?为什么李飞飞、Google、OpenAI 都纷纷投入?-首席AI分享圈

O que é um "modelo mundial" de IA? Por que Fei-Fei Li, o Google e a OpenAI estão investindo nisso?

O desenvolvimento de modelos de IA está se tornando cada vez mais diversificado. Além dos modelos de linguagem em grande escala e dos modelos de linguagem em pequena escala, os "modelos de mundo", conhecidos como simuladores de mundo, estão sendo considerados uma das próximas direções de desenvolvimento importantes da IA. Em 2024, o pioneiro da IA e cientista da computação Li Fei...

Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务-首席AI分享圈

Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados externos de gráficos de conhecimento em tempo real

Introdução abrangente O Diffbot LLM Reasoning Server é um sistema inovador de modelagem de linguagem em larga escala com otimizações e aprimoramentos especiais baseados na arquitetura do modelo LLama. O recurso mais importante do projeto é a combinação das tecnologias Knowledge Graph e Retrieval Augmented Generation (RAG) em tempo real, criando um sistema de raciocínio único...

pt_BRPortuguês do Brasil