🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Conhecimento de IA Página 3

Expansão de consulta baseada em LLM

Você já se viu em uma situação em que digitou uma palavra-chave em um mecanismo de busca e os resultados foram diferentes do que você queria? Ou, você quer pesquisar algo, mas não sabe quais palavras usar para expressar isso com mais precisão? Não se preocupe, a tecnologia de "expansão de consultas" pode ajudá-lo a resolver esses problemas. Recentemente, a expansão de consultas...

2025-02-24

法律翻译领域：ChatGPT 与神经网络翻译 (NMT) 系统性能深度评测-首席AI分享圈

Tradução jurídica: uma análise aprofundada do desempenho dos sistemas ChatGPT e de tradução por rede neural (NMT)

Em meio à onda de constantes mudanças nas tecnologias de tradução, o surgimento do ChatGPT (Chat Generative Pre-trained Transformer) sem dúvida atraiu a atenção mundial. Como um LLM (Large Language Models, modelos de idiomas grandes) de última geração, o ChatGPT demonstra uma impressionante...

2025-02-24

Versão em chinês do Trae Primeiro convite para download: uso ilimitado do DeepSeek-R1 após o registro!

Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.

2025-04-30

Guia para a criação de sistemas multiagentes com base na CrewAI

1. introdução No campo da inteligência artificial (IA), o sistema multiagente está gradualmente se tornando uma tecnologia fundamental para resolver problemas complexos e obter uma colaboração eficiente. o CrewAI, como uma poderosa ferramenta de colaboração multiagente, oferece aos desenvolvedores uma maneira conveniente de criar sistemas de colaboração inteligentes. Neste artigo, apresentaremos como criar um sistema de colaboração inteligente com base no Cr...

2025-02-24

Deep Research 技术盘点！比RAG更高级的LLM应用范式-首席AI分享圈

Inventário de tecnologia de pesquisa profunda! Um paradigma para aplicativos LLM que é mais avançado do que os RAGs

Depois que a ferramenta Deep Research da OpenAI surgiu do nada, todos os principais fornecedores lançaram suas próprias ferramentas de Deep Research. A chamada pesquisa profunda é comparada à pesquisa comum, em que uma pesquisa RAG simples gera geralmente apenas uma rodada de pesquisa. No entanto, a pesquisa profunda pode agir como um ser humano, com base em uma...

2025-02-22

RIG (Retrieval Interleaved Generation): uma estratégia de recuperação de escrita durante a pesquisa, adequada para consultar dados em tempo real

Núcleo de tecnologia: Retrieval Interleaved Generation (RIG) O que é o RIG? O RIG é uma metodologia de geração inovadora projetada para resolver o problema de alucinação no processamento de dados estatísticos por grandes modelos de linguagem. Os modelos tradicionais podem gerar números ou fatos imprecisos a partir do nada, enquanto...

2025-02-22

Dominando a fragmentação de documentos RAG: um guia de estratégias de fragmentação para a criação de sistemas de recuperação eficientes

Se o seu aplicativo RAG não estiver produzindo os resultados desejados, talvez seja hora de rever a sua estratégia de fragmentação. Uma melhor divisão em blocos significa pesquisas mais precisas e, em última análise, respostas de maior qualidade. No entanto, a fragmentação não é uma técnica única, e nenhuma abordagem é absolutamente ideal. Você precisará adaptar sua...

2025-02-22

Chunking agêntico: Chunking de texto semântico orientado por agentes de IA

Introdução A fragmentação de texto desempenha um papel fundamental no domínio de aplicação dos Modelos de Linguagem Ampla (LLMs), especialmente nos sistemas de Geração Aumentada de Recuperação (RAG). A qualidade da fragmentação do texto está diretamente relacionada à validade das informações contextuais, o que, por sua vez, afeta a precisão e a integridade das respostas geradas pelos LLMs...

2025-02-21

ZEP-Graphiti: uma arquitetura de gráfico de conhecimento temporal para memória em inteligência

Quick Reads O desafio da memória de IA e a inovação do Zep Os agentes de IA (AI Agents) enfrentam gargalos de memória em tarefas complexas. Os agentes de IA tradicionais baseados no modelo de linguagem grande (LLM) são limitados por janelas contextuais que dificultam a integração eficaz do histórico de diálogo de longo prazo e dos dados dinâmicos, limitando o desempenho e tornando-os propensos a alucinações.

2025-02-21

盘点与 Ollama 类似的 LLM 框架：本地部署大模型的多元选择-首席AI分享圈

Inventário de estruturas LLM semelhantes ao Ollama: várias opções para modelos grandes implantados localmente

O surgimento da estrutura Ollama certamente atraiu muita atenção no campo da inteligência artificial e dos modelos de linguagem grandes (LLMs). Essa estrutura de código aberto tem como foco simplificar a implementação e a operação de modelos de linguagem grandes localmente, facilitando a experiência de mais desenvolvedores com o apelo dos LLMs. No entanto, olhando para o mercado, a Ollama não está sozinha...

2025-02-17

Lançamento da OpenAI: Aplicativos e práticas recomendadas para modelos de inferência de IA

No campo da IA, a escolha dos modelos é crucial, e a OpenAI, como líder do setor, oferece dois tipos principais de famílias de modelos: Modelos de raciocínio e Modelos GPT. O primeiro é representado pela série o de modelos, como o1 e o3-mini, enquanto o segundo é representado por ...

2025-02-14

Resolvendo a confusão o1, os modelos de inferência como o DeepSeek-R1 estão pensando ou não?

Encontrei um artigo interessante, intitulado "Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs" (Os pensamentos estão por toda parte: sobre o pensamento insuficiente de LLMs do tipo o1), cujo tema é analisar o modelo de raciocínio do tipo o1, a troca frequente de caminhos de pensamento e a falta de foco no pensamento, denominada "pensamento insuficiente". O tópico é analisar a troca frequente de caminhos de raciocínio do modelo de raciocínio do tipo o1 e a falta de foco no pensamento, conhecida como "underthinking", e, ao mesmo tempo, apresentar uma solução para aliviar ...

2025-02-13

模型量化是什么：FP32, FP16, INT8, INT4 数据类型详解-首席AI分享圈

O que é quantificação de modelo: explicação dos tipos de dados FP32, FP16, INT8 e INT4

Introdução No vasto céu estrelado da tecnologia de IA, os modelos de aprendizagem profunda impulsionam a inovação e o desenvolvimento em muitos campos com seu excelente desempenho. No entanto, a expansão contínua do tamanho do modelo é como uma faca de dois gumes, que provoca um aumento drástico na demanda aritmética e na pressão de armazenamento, ao mesmo tempo em que melhora o desempenho. Especialmente em aplicativos com restrição de recursos ...

2025-02-13

Think&Cite: melhorando a precisão da citação de textos usando técnicas de pesquisa em árvore

Resumo Apesar de seu excelente desempenho, os modelos de linguagem grande (LLMs) são propensos a alucinar e gerar informações factualmente imprecisas. Esse desafio tem motivado esforços na geração de texto de atributos, o que faz com que os LLMs gerem conteúdo que contenha evidências de apoio. Neste artigo, apresentamos uma nova abordagem chamada Think&Cite ...

2025-02-11

Domínio sistemático da engenharia de palavras-chave - do básico ao avançado (tempo de leitura de 2 horas)

Introdução O objetivo deste documento é ajudar os leitores a entender e apreender rapidamente os principais conceitos e aplicações da Prompt Engineering por meio de uma série de exemplos de prompts (em parte). Esses exemplos são todos derivados de um artigo acadêmico sobre uma revisão sistemática das técnicas de engenharia imediata ("The Prompt Report: A Systematic Survey of Pr...

2025-02-10

Uma análise aprofundada dos Titãs: o caminho para a convergência da memória de longo prazo e a modelagem eficiente de sequências

Titans: Aprendendo a memorizar na hora da prova Texto original: https://arxiv.org/pdf/2501.00663v1 Arquitetura dos Titãs Implementação não oficial: https://github.com/lucidrains/titans- pytorch I. Histórico e motivação da pesquisa: Transformer of ...

2025-02-09

Limitações do LLM OCR: Desafios de análise de documentos sob o glamour

Para qualquer aplicativo que exija sistemas RAG (Retrieval Augmented Generation), transformar documentos PDF enormes em blocos de texto legíveis por máquina (também conhecido como "PDF chunking") é uma grande dor de cabeça. Existem soluções de código aberto e produtos comerciais no mercado, mas, para ser honesto, não há nenhuma solução que possa realmente...

2025-02-09

DeepSeek R1 越狱：尝试突破 DeepSeek 的审查机制-首席AI分享圈

DeepSeek R1 Jailbreak: uma tentativa de burlar os censores do DeepSeek

Os jailbreaks oficiais do DeepSeek R1 são ótimos ambientes experimentais para acionar basicamente todos os tipos de mecanismos de censura, e você pode aprender muitas técnicas de defesa. Portanto, este é um artigo de aprendizado sobre Mecanismos de censura de modelo grande, que o levará a exemplos de jailbreaks de modelo grande ao longo dos anos. Os mecanismos de censura de modelos grandes geralmente são usados...

2025-02-03

Manual do sistema OpenAI o3-mini (chinês)

Original: https://cdn.openai.com/o3-mini-system-card.pdf 1 Introdução A família de modelos OpenAI o é treinada usando o aprendizado por reforço em larga escala para raciocinar usando cadeias de pensamento. Esses recursos avançados de raciocínio oferecem novas maneiras de melhorar a segurança e a robustez de nossos modelos. Em particular, ...

2025-02-02

Chinchilla 时刻与 o3 时代：大语言模型“规模定律”的演进之路-首席AI分享圈

O momento Chinchilla e o momento o3: a evolução da lei de escala para grandes modelos de linguagem

Quick Reads Uma visão abrangente e aprofundada do passado e do presente da Lei de Escalonamento de Modelos de Linguagem Grandes (LLMs) e a direção futura da pesquisa em IA. Com uma lógica clara e exemplos ricos, o autor Cameron R. Wolfe leva o leitor dos conceitos básicos até a...

2025-02-01

página anterior
1
2
3
4
5
6
...
página seguinte
Total de 11 páginas

Conhecimento de IA Página 3

Expansão de consulta baseada em LLM

Tradução jurídica: uma análise aprofundada do desempenho dos sistemas ChatGPT e de tradução por rede neural (NMT)

Versão em chinês do Trae Primeiro convite para download: uso ilimitado do DeepSeek-R1 após o registro!

Guia para a criação de sistemas multiagentes com base na CrewAI

Inventário de tecnologia de pesquisa profunda! Um paradigma para aplicativos LLM que é mais avançado do que os RAGs

RIG (Retrieval Interleaved Generation): uma estratégia de recuperação de escrita durante a pesquisa, adequada para consultar dados em tempo real

Dominando a fragmentação de documentos RAG: um guia de estratégias de fragmentação para a criação de sistemas de recuperação eficientes

Chunking agêntico: Chunking de texto semântico orientado por agentes de IA

ZEP-Graphiti: uma arquitetura de gráfico de conhecimento temporal para memória em inteligência

Inventário de estruturas LLM semelhantes ao Ollama: várias opções para modelos grandes implantados localmente

Lançamento da OpenAI: Aplicativos e práticas recomendadas para modelos de inferência de IA

Resolvendo a confusão o1, os modelos de inferência como o DeepSeek-R1 estão pensando ou não?

O que é quantificação de modelo: explicação dos tipos de dados FP32, FP16, INT8 e INT4

Think&Cite: melhorando a precisão da citação de textos usando técnicas de pesquisa em árvore

Domínio sistemático da engenharia de palavras-chave - do básico ao avançado (tempo de leitura de 2 horas)

Uma análise aprofundada dos Titãs: o caminho para a convergência da memória de longo prazo e a modelagem eficiente de sequências

Limitações do LLM OCR: Desafios de análise de documentos sob o glamour

DeepSeek R1 Jailbreak: uma tentativa de burlar os censores do DeepSeek

Manual do sistema OpenAI o3-mini (chinês)

O momento Chinchilla e o momento o3: a evolução da lei de escala para grandes modelos de linguagem

Não consegue encontrar ferramentas de IA? Tente aqui!

Gerador de imagens FLUX.1 (suporta entrada em chinês)

Hotspots de IA recentes

Recomendações de ferramentas de IA

Classificação das ferramentas de IA