🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Conhecimento de IA

adesivo (de um tópico de fórum da Internet etc.)

Avaliação do uso de modelos de inferência em sistemas RAG modulares

Neste artigo, apresentamos um relatório resumido da recente exploração da Kapa.ai do o3-mini da OpenAI e de outros modelos de inferência no sistema Retrieval-Augmented Generation (RAG). O Kapa.ai é um assistente de IA alimentado por um modelo de linguagem em grande escala (LLM) que...

2025-03-02Conhecimento de IA

Avaliação da criatividade de grandes modelos de linguagem: além do paradigma LoTbench de múltipla escolha

No campo de pesquisa de Modelagem de Linguagem Ampla (LLM), a capacidade de Leap-of-Thought do modelo, ou seja, a criatividade, não é menos importante do que a capacidade de raciocínio lógico representada pela Chain-of-Thought. No entanto, ainda há uma relativa falta de discussões aprofundadas e métodos de avaliação válidos para a criatividade do LLM, que, em um ...

2025-04-20

Como lidar com o Claude Code: um guia prático para aumentar a produtividade da programação de IA

Mastering Claude Code: Hands-on Agentic Coding Tips from the Front Lines O Claude Code é uma ferramenta de linha de comando para codificação agêntica. A codificação agêntica é o processo de dar a uma IA um grau de autonomia para entender tarefas, planejar etapas e executar operações (como ler e escrever...

2025-04-20

Versão em chinês do Trae Primeiro convite para download: uso ilimitado do DeepSeek-R1 após o registro!

Habilite o modo de programação inteligente Builder, uso ilimitado do DeepSeek-R1 e DeepSeek-V3, experiência mais suave do que a versão internacional. Basta digitar os comandos chineses, sem conhecimento de programação, para escrever seus próprios aplicativos.

2025-04-29

Guia de engenharia de dicas oficiais do GPT-4.1 (versão em chinês)

A família de modelos GPT-4.1 oferece melhorias significativas em codificação, aderência de instruções e recursos de processamento de contexto longo em relação ao GPT-4o. Especificamente, apresenta melhor desempenho em tarefas de geração e reparo de código, compreende e executa instruções complexas com mais precisão e pode lidar eficientemente com textos de entrada mais longos. Esse trabalho sugerido ...

2025-04-17

A estrutura GTR: uma nova abordagem para perguntas e respostas entre tabelas com base em gráficos heterogêneos e recuperação hierárquica

1. INTRODUÇÃO Na atual explosão de informações, uma grande quantidade de conhecimento é armazenada na forma de tabelas em páginas da Web, na Wikipédia e em bancos de dados relacionais. No entanto, os sistemas tradicionais de perguntas e respostas geralmente têm dificuldades para lidar com consultas complexas em várias tabelas, o que se tornou um grande desafio no campo da inteligência artificial. Para enfrentar esse desafio, os pesquisadores ...

2025-04-07

EQ-Bench Como avaliar a inteligência emocional e a criatividade em grandes modelos de linguagem

Como os recursos dos modelos de linguagem ampla (LLMs) estão evoluindo rapidamente, os testes de benchmark tradicionais, como o MMLU, estão gradualmente mostrando suas limitações para distinguir os melhores modelos. Com base apenas em questionários de conhecimento ou testes padronizados, tornou-se difícil medir de forma abrangente os recursos diferenciados dos modelos que são cruciais nas interações do mundo real, como inteligência emocional, criatividade e...

2025-04-01

Raciocínio com grandes modelos de linguagem: Equilíbrio entre "pensar de menos" e "pensar de mais"

O desenvolvimento de modelos de linguagem grande (LLMs) está mudando rapidamente, e sua capacidade de raciocínio se tornou um indicador importante do nível de inteligência. Em particular, os modelos com recursos de raciocínio longos, como o o1 da OpenAI, DeepSeek-R1, QwQ-32B e Kimi K1.5, que simulam o processo de raciocínio profundo humano ao resolver problemas compostos...

2025-03-31

突破工具调用瓶颈：CoTools 框架助力大型语言模型高效利用海量工具-首席AI分享圈

Eliminando o gargalo das chamadas de ferramentas: a estrutura CoTools permite que grandes modelos de linguagem utilizem eficientemente grandes quantidades de ferramentas

INTRODUÇÃO Nos últimos anos, os Modelos de Linguagem Grande (LLMs) fizeram um progresso impressionante no campo da Inteligência Artificial (IA), e seus poderosos recursos de compreensão e geração de linguagem levaram a uma ampla gama de aplicações em vários domínios. No entanto, os LLMs ainda enfrentam muitos desafios ao lidar com tarefas complexas que exigem a invocação de ferramentas externas. Por exemplo, ...

2025-03-29

comandos comuns uv

O ecossistema Python sempre teve uma escassez de ferramentas de gerenciamento de pacotes e de ambiente, desde o clássico pip e virtualenv, passando pelo pip-tools e conda, até o moderno Poetry e PDM. Cada uma dessas ferramentas tem sua própria área de especialização, mas elas geralmente tornam a cadeia de ferramentas de um desenvolvedor fragmentada e complexa. Agora, com o A...

2025-03-29

Por que os sistemas colaborativos de inteligência múltipla são mais propensos a erros?

INTRODUÇÃO Nos últimos anos, os sistemas multiinteligentes (MAS) têm atraído muita atenção no campo da inteligência artificial. Esses sistemas tentam resolver tarefas complexas e de várias etapas por meio da colaboração de várias inteligências de Modelo de Linguagem Grande (LLM). No entanto, apesar das grandes expectativas em relação aos MAS, seu desempenho em aplicações do mundo real não foi ...

2025-03-29

Anthropic 深度剖析 Claude：揭示大型语言模型的的决策与推理过程-首席AI分享圈

Anthropic Deep Dive Claude: revelando processos de tomada de decisão e raciocínio em grandes modelos de linguagem

Os modelos de linguagem grande (LLMs), como o Claude, não são criados por humanos que escrevem código de programação direto, mas são treinados com base em grandes quantidades de dados. No processo, os modelos aprendem suas próprias estratégias para resolver problemas. Essas estratégias estão ocultas nos bilhões de cálculos que o modelo realiza para gerar cada palavra para...

2025-03-28

Fazendo a IA parar e pensar: como a ferramenta "Think" da Anthropic aprimora o raciocínio de Claude

Recentemente, a Anthropic introduziu uma nova ferramenta chamada "think", que tem como objetivo aprimorar os recursos do modelo Claude para a solução de problemas complexos. Neste artigo, discutiremos o conceito de design, o desempenho e as práticas recomendadas da ferramenta "think" e analisaremos suas implicações para o desenvolvimento futuro de sistemas de IA...

2025-03-24

DeepRetrieval: geração eficiente de consultas de recuperação de informações impulsionada pelo aprendizado por reforço

Resumo Os sistemas de recuperação de informações são essenciais para o acesso eficiente a grandes coleções de documentos. Abordagens recentes usam modelos de linguagem ampla (LLMs) para melhorar o desempenho da recuperação por meio do aumento da consulta, mas geralmente dependem de técnicas caras de aprendizado supervisionado ou destilação que exigem recursos computacionais significativos e dados rotulados manualmente. Em ...

2025-03-19

Lançamento da OpenAI: Como os modelos de linguagem de grande porte monitoram a si mesmos em busca de comportamento inadequado

Os modelos de raciocínio de grande porte (LLMs) exploram vulnerabilidades quando têm a oportunidade. Pesquisas demonstraram que essas explorações podem ser detectadas com o uso de modelos de linguagem ampla (LLMs) para monitorar suas cadeias de pensamento (CoT). Punir os modelos por "pensamentos ruins" não impede a maior parte do comportamento inadequado, mas faz com que eles escondam suas intenções. ...

2025-03-18

[转载]QwQ-32B 的工具调用能力及 Agentic RAG 应用-首席AI分享圈

[Reimpressão] Capacidade de chamada de ferramenta do QwQ-32B e aplicativo RAG autêntico

Histórico Recentemente, um artigo intitulado Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning (arxiv.org/pdf/2503.09516) atraiu muita atenção. O artigo propõe uma maneira de usar a aprendizagem por reforço para treinar grandes linguagens...

2025-03-17

LazyGraphRAG：大幅优化 GraphRAG 的质量与成本-首席AI分享圈

LazyGraphRAG: otimizando drasticamente a qualidade e o custo do GraphRAG

O projeto GraphRAG tem como objetivo ampliar a gama de perguntas que os sistemas de IA podem responder em conjuntos de dados privados, explorando relações implícitas em textos não estruturados. Uma das principais vantagens do GraphRAG em relação ao RAG vetorial tradicional (ou "pesquisa semântica") é sua capacidade de responder a consultas globais em conjuntos de dados inteiros, como...

2025-03-17mapa de conhecimento Recuperação de conhecimento e a estrutura RAG

DeepSearch/DeepResearch中最优文本段选择和URL重排-首席AI分享圈

Seleção ideal de segmentos de texto e reorganização de URLs no DeepSearch/DeepResearch

Se você já leu o último artigo clássico de Jina, "Design and Implementation of DeepSearch/DeepResearch", talvez queira se aprofundar em alguns detalhes que podem melhorar significativamente a qualidade das respostas. Desta vez, vamos nos concentrar em dois detalhes: extração de segmentos de texto ideais de páginas da Web longas: como usar a...

2025-03-13

Relatório técnico Gemma 3 Versão em chinês

Gemma 3 Resumo das principais informações I. Principais métricas Parâmetros Detalhes Tamanho do modelo 100 milhões a 27 bilhões de parâmetros em quatro versões: 1B, 4B, 12B, 27B Arquitetura Arquitetura específica de decodificador baseada em transformador herdada do Gemma 2 com vários aprimoramentos Recursos multimodais Suporte para texto e imagem...

2025-03-13

IDProtector: uma maneira de proteger retratos contra o abuso da tecnologia gerada por IA

1. histórico e problemas Com o rápido desenvolvimento das tecnologias de inteligência artificial (IA), especialmente o avanço dos modelos de difusão, a IA conseguiu gerar imagens de retratos muito realistas. Por exemplo, tecnologias como o InstantID exigem apenas uma foto para gerar várias imagens novas com os mesmos recursos de identidade. No entanto, esse tipo de tecnologia...

2025-03-11

1
2
3
4
...
página seguinte
Total de 11 páginas

Conhecimento de IA

Avaliação do uso de modelos de inferência em sistemas RAG modulares

Avaliação da criatividade de grandes modelos de linguagem: além do paradigma LoTbench de múltipla escolha

Como lidar com o Claude Code: um guia prático para aumentar a produtividade da programação de IA

Versão em chinês do Trae Primeiro convite para download: uso ilimitado do DeepSeek-R1 após o registro!

Guia de engenharia de dicas oficiais do GPT-4.1 (versão em chinês)

A estrutura GTR: uma nova abordagem para perguntas e respostas entre tabelas com base em gráficos heterogêneos e recuperação hierárquica

EQ-Bench Como avaliar a inteligência emocional e a criatividade em grandes modelos de linguagem

Raciocínio com grandes modelos de linguagem: Equilíbrio entre "pensar de menos" e "pensar de mais"

Eliminando o gargalo das chamadas de ferramentas: a estrutura CoTools permite que grandes modelos de linguagem utilizem eficientemente grandes quantidades de ferramentas

comandos comuns uv

Por que os sistemas colaborativos de inteligência múltipla são mais propensos a erros?

Anthropic Deep Dive Claude: revelando processos de tomada de decisão e raciocínio em grandes modelos de linguagem

Fazendo a IA parar e pensar: como a ferramenta "Think" da Anthropic aprimora o raciocínio de Claude

DeepRetrieval: geração eficiente de consultas de recuperação de informações impulsionada pelo aprendizado por reforço

Lançamento da OpenAI: Como os modelos de linguagem de grande porte monitoram a si mesmos em busca de comportamento inadequado

[Reimpressão] Capacidade de chamada de ferramenta do QwQ-32B e aplicativo RAG autêntico

LazyGraphRAG: otimizando drasticamente a qualidade e o custo do GraphRAG

Seleção ideal de segmentos de texto e reorganização de URLs no DeepSearch/DeepResearch

Relatório técnico Gemma 3 Versão em chinês

IDProtector: uma maneira de proteger retratos contra o abuso da tecnologia gerada por IA

Não consegue encontrar ferramentas de IA? Tente aqui!

Gerador de imagens FLUX.1 (suporta entrada em chinês)

Hotspots de IA recentes

Recomendações de ferramentas de IA

Classificação das ferramentas de IA