微软开源，两天10K的star的GraphRag！解决复杂数据理解的新利器作者：老码沉思录来源：老码沉思录近日，微软研究院宣布开源了一款名为GraphRAG的新工具。这个基于知识图谱和大语言模型的系统，在短短两天内就获得了超过10K stars，引起了广泛关注。GraphRAG到底是什么，它能解决哪些问题呢？什么是

微软开源，两天10K的star的GraphRag！解决复杂数据理解的新利器

作者：老码沉思录来源：老码沉思录

近日，微软研究院宣布开源了一款名为GraphRAG的新工具。这个基于知识图谱和大语言模型的系统，在短短两天内就获得了超过10K stars，引起了广泛关注。GraphRAG到底是什么，它能解决哪些问题呢？

什么是GraphRAG？

GraphRAG是微软研究院开发的一个开源项目，它结合了文本提取、网络分析和大语言模型的技术，能够从任意文本数据集中自动提取出丰富的知识图谱。这个知识图谱不仅包含实体及其关系，还能够以层级的方式对数据进行主题聚类和概括性总结。

与传统的检索增强型生成（Retrieval-Augmented Generation，RAG）方法不同，GraphRAG能够更好地"连接信息点"，并对大规模数据集进行高质量总结 。这使得它在回答复杂问题和理解大型数据集方面都有独特优势。

RAG vs GraphRAG：有何不同？

传统的RAG方法主要依赖于文本检索和生成模型，通过检索相关文本片段并生成回答。这种方法在处理复杂问题和大规模数据集时，往往会受限于文本片段的质量和相关性。下面我直接使用两幅草图来说明这两者的区别：

上面这张图片是RAG的工作流程，主要包括文本检索和生成两个阶段。检索阶段通过检索相关文本片段，生成阶段则根据检索结果生成回答。

而这张图片是GraphRAG的工作流程，它在RAG的基础上增加了知识图谱的构建和分析阶段。通过知识图谱，GraphRAG能够更好地理解数据之间的关联和整体结构，抽象出更高的层次信息。回答的生成则更加全面和准确 。

GraphRAG如何工作？

GraphRAG的工作流程主要包括以下几个步骤：

这种方法与传统RAG的区别在于，GraphRAG不仅能够利用文本内容，还能够充分发挥知识图谱的优势，更好地理解数据之间的关联和整体结构。

GraphRAG的应用场景

GraphRAG的应用场景非常广泛，主要包括以下几个方面：

可以预见的是，GraphRAG是一个非常强大的工具，能够帮助我们更好地理解和利用复杂的文本数据。相信随着它的不断完善和应用推广，必将为各行各业带来新的变革。

可关注我们的公众号：每天AI新工具