Agents-K1 Substitui Fatias de Texto RAG por Grafos de Conhecimento Científico Digitados

O Agents-K1, detalhado em um artigo arXiv, processou 2,46 milhões de artigos científicos em um grafo multimodal estruturado chamado Scholar-KG, com o lançamento público de um subconjunto de um milhão de artigos. Este pipeline tem como objetivo substituir os fatias de texto planas e os triples baseados apenas em resumos usados em sistemas RAG de produção, que podem interromper relações.

A pilha é construída em torno de um parser multimodal de cinco módulos que trata texto, figuras, tabelas e equações como evidências interconectadas. Um backbone de extração de informação com 4 bilhões de parâmetros, treinado com GRPO sob recompensas baseadas em regras, realiza extração estruturada, emitindo entidades digitadas, afirmações, mecanismos, linhagens de método e papéis de citação em vez de triples genéricos. A saída alimenta o Scholar-KG e um CLI do graphanything unifica três fontes de recuperação - busca na web, recuperação de grafo multimodal e navegação entre documentos - atrás de uma interface única que oferece recuperação auditável para identificadores de grafo estáveis e evidências exatas. Os autores contrastam isso com sistemas de grafo-RAG implantados como LightRAG, HippoRAG e RAPTOR, que geralmente ingiram apenas resumos e emitem triples de texto apenas, perdendo a proveniência do método, o contexto multimodal e as sutilezas de citação. Eles também diferenciam o Agents-K1 de loops de agente como AI-Scientist, InternAgent e AI Co-Scientist, que leem PDFs brutos ou resumos em tempo de execução e repetem a extração por consulta, tornando a rastreabilidade da proveniência frágil.

O artefato de pesquisa é de grande escala, abrangendo 2,46 milhões de artigos em seis domínios, mas carece de evidência de produção. O artigo relata desempenho superior na extração de informação científica, construção de grafos de conhecimento e benchmarks de raciocínio multi-hop, no entanto, omite métricas de serviço como latência de recuperação de ponta a ponta, tempo de construção do índice e custo, sobrecarga de armazenamento para o grafo multimodal e taxa de transferência sob carga de agente simultânea. O modelo de extração de 4B é projetado para inferência acessível, mas o artigo não divulga horas de GPU consumidas durante o treinamento GRPO ou o custo de extração por artigo em escala. Até que esses números estejam disponíveis, o Agents-K1 permanece um pipeline de pré-processamento de nível de pesquisa em vez de um substituto pronto para uso para camadas de recuperação existentes.

A generalização fora dos seis domínios acadêmicos e a robustez das recompensas baseadas em regras GRPO contra corpora de domínio geral desordenados permanecem sem comprovação. Os autores afirmam que o pipeline pode se estender além de artigos científicos, mas isso é inválido. O risco de integração é significativo: adotar o Agents-K1 envolve substituir pipelines de fragmentação e embedding convencionais por um esquema de cinco módulos rigoroso, operar um modelo de extração de 4B parâmetros no momento da ingestão e manter identificadores de grafo estáveis para recuperação auditável - uma carga operacional que a maioria das pilhas RAG existentes não está projetada para lidar. A questão é se a ganância de fiabilidade do conhecimento científico digitado supera a complexidade de indexação, a latência de início frio e o custo de serviço ao lidar com tráfego de agente ao vivo.

Para arquitetos considerando o que adotar, o padrão transferível é a estruturação upstream: em vez de recuperar fatias planas e confiar em um LLM para reconstruir relações no tempo de inferência, integre entidades, afirmações e linhagens de evidências na camada de conhecimento para que o agente raciocine sobre nós de grafo digitados com proveniência estável desde o início.

Sources

Agents-K1 has processed 2.46 million scientific papers across six subjects to produce Scholar-KG, with a one-million-paper subset released publicly
"we process 2.46 million scientific papers across six subjects to produce Scholar-KG, of which we release a one-million-paper subset"
arxiv.org ↗
The pipeline uses a five-module multimodal parser schema that captures entities, multimodal evidence, citations, and typed inter-entity relations across the full paper rather than abstracts alone
"a multimodal parser whose five-module schema captures entities, multimodal evidence, citations, and typed inter-entity relations across the full paper rather than abstracts alone"
arxiv.org ↗
The 4B information-extraction backbone is trained with GRPO under a rule-based reward
"a 4B information-extraction backbone trained with GRPO under a rule-based reward"
arxiv.org ↗
The graphanything CLI is a tri-source agent interface that unifies web search, multimodal graph retrieval, and cross-document traversal
"a graphanything CLI, a tri-source agent interface that unifies web search, multimodal graph retrieval, and cross-document traversal"
arxiv.org ↗
Existing graph-augmented retrieval pipelines including LightRAG, HippoRAG, RAPTOR, and KGP usually build generic text-only triples and capture little beyond abstracts
"modern graph-augmented retrieval pipelines, including LightRAG, HippoRAG, HippoRAG2, GFM-RAG, E2GraphRAG, RAPTOR, and KGP, usually build generic text-only triples. They capture little beyond abstracts and directly mentioned terms"
arxiv.org ↗
LLM-based research agents such as AI-Scientist, InternAgent, and AI Co-Scientist read raw PDFs or short summaries at runtime, repeating extraction for each query
"LLM-based research agents often read raw PDFs or short summaries at runtime. This repeats extraction for each query and makes it hard to trace an answer back to exact evidence."
arxiv.org ↗
Scholarly citation graphs typically use a flat 'cites' edge that does not capture whether a paper extends a method, challenges a claim, or merely cites a baseline
"scholarly citation graphs usually use a flat cites edge. This shows that one paper references another, but not whether it extends a method, challenges a claim, or only cites a baseline."
arxiv.org ↗
Agents-K1 achieves superior performance in scientific information extraction, knowledge graph construction, and multi-hop scientific reasoning
"Extensive experiments demonstrate that Agents-K1 achieves superior performance in scientific information extraction, knowledge graph construction, and multi-hop scientific reasoning."
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Agents-K1 Substitui Fatias de Texto RAG por Grafos de Conhecimento Científico Digitados

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.