人工智能背景下的新一代知识管理及RAG落地模式
作者: 吴庆海聊知识管理 来源: 吴庆海聊知识管理
关注我们 获取更多精彩内容
春日乍暖还寒,在「花城」广州,却已花红草绿,鸟啼蛙鸣。黄浦区创业公园之畔,中国电力企业联合会知识管理标准化技术委员会年会正在召开。作为委员,吴庆海博士应邀出席本次年会并发表主旨演讲,本文基于演讲内容略有删改。
近几年,数字化、AIGC、LLM、ChatGPT、RAG等热词层出不穷,许多企业都在寻求未来战略转型与升级,思考如何落地。
我们最近给一些行业头部企业客户服务时,也不断在思考:人工智能背景下的新一代知识管理,将会如何发展及落地?
2024年2月,《2024中国知识管理调查分析报告》刚刚发布。
这项调查由创新与知识管理联盟IKMA、行者互联公司和孙行者平台联合,继“2021中国知识管理调查”后,又开展了“2023中国知识管理调查”活动,持续跟踪中国知识管理发展变化状况。
该报告中内容丰富,此不一一赘述。选择其中“知识管理从业者获得专业支持期望”一项内容,相应的数据如下图所示。
知识管理从业者希望进一步获得的专业支持
数据来源:2024中国知识管理调查分析报告
在两次调查数据中,知识管理从业者对“人工智能技术应用”的渴望都排进前5位。
实践中,我们做的许多知识管理项目,都源于企业客户的数字化转型项目。
那么数字化、人工智能、知识管理之间到底有什么关系?
关于数智化的思考,来源:吴庆海博士
对照经典的DIKW模型(关于其详细描述,请参看文章《知识管理基础——什么是知识》),我们不妨进行解读。
数字化,是计算机将万事万物以0和1的编码方式进行的处理,主要还是在数据、信息的层面,是自下而上的过程。
智能化,是让计算机尽可能模仿、模拟人类的思维思考,开始涉足知识的层面,是自上而下的过程。
数智化,约等于数字化加智能化。
与数据、信息不同,一旦到知识层面,就会涉及到人,就会涉及到认知,就会涉及到心智模式,涉及人的“意识”形态,这可谓一个分水岭。
基于大模型ChatGPT类产品横空出世,一定程度上具备了人的“意识”形态特征,预示人类新的“智能纪元”的到来。
是背后本质上看,“数智化”其实弥补了“数字化”中所缺乏关于“意识”形态特质的东西。
数字化是以大数据分析与处理为基本特征。
智能化则是以知识管理、机器学习、人工智能等为核心要素。
数智化是二者在运营过程中的融合与应用。
面向未来知识管理的发展,笔者一直在提倡**「ABC式」的知识管理** 。
所谓的“A”,指的是AI-oriented Knowledge Management,即面向AI技术的知识管理 。
所谓的“B”,指的是Business-oriented Knowledge Management,即面向业务场景的知识管理 。
所谓的“C”,指的是Collective-oriented Knowledge Management,即面向集体智慧的知识管理 。
「ABC式」的知识管理,来源:吴庆海博士
1)AIoKM-面向AI技术的知识管理
不以AI基础能力为底座,不能称之为真正的数智化。
我们需要充分利用数字与智能技术,在诸如智能分类、智能推荐、知识图谱、智能搜索、智能知识生成、智能助手等应用有新的突破。
知识管理平台建设是基础建设工程,其固有的功能,例如知识全生命周期的识别、生产、审核、发布,结构化展示,协同、后续维护、运营,是每天员工都需要的。
人工智能技术应用是未来发展方向,在智能搜索、智能问答、智能创作等方面有着巨大的应用前景。
在知识管理平台建设过程中应用人工智能技术,有助于提升用户体验和服务效果。
同时,知识管理也是人工智能技术在企业内部应用的重点场景之一,在知识管理方面先行先试的探索将为未来公司大模型建设打下基础。
建设功能完善、内容丰富的知识管理平台,是未来大模型应用的前提和基础,构建结构化的知识图谱能提升大模型数据训练时效。
2)BoKM-面向业务场景的知识管理
很多人都会抱怨“知识管理与业务是两张皮”。
但如何把知识管理真正融入到业务中去,一直是业界的一个难题。
近几年在服务客户的过程之中,提出了“面向业务的「知识水滴」知识管理三层框架 ”。
逐步总结出面向业务的知识管理BoKM的一些基本做法,如“画圈圈”、“连块块”、“挂点点”等。
具体描述可参看《**面向业务的知识管理BoKM如何才能真正落地** 》文章。
强调知识从业务中来,知识又服务于业务。
基于场景感知的知识推送,基于专家、岗位、专题、项目等的知识萃取,都需要不断开拓。
上善若水,知识如流。
不以业务绩效为产出的知识管理就是耍流氓。
3)CoKM-面向集体智慧的知识管理
现在,大家不仅需要关注与知识管理专业相关的“硬技术”,更需要关注与知识管理领域相关的“软势力”。
例如提升员工知识管理意识、培育组织知识共享文化、营造团队知识创造场域等。
解决复杂问题,提升原创能力,挖掘人的自性宝藏,找到人的价值定位。
强调人的主动性,激发人的自驱力。
员工不是螺丝钉,需要依赖人的创造性,人人争做发动机。
以实际项目中共性的痛点问题为导向,采用私董会、行动学习、实践社区、创新果酱 等模式,通过现场激发团队的智慧,最终让问题得到解决。
大多的讨论、共创场景,多会聚焦在一些具体主题或问题上。
如果提前能有一些结构化的模板框架做指引,则可以让整个讨论过程及要点记录更高效。
集体智慧画布模板,来源:吴庆海博士
为此,我设计了一个“集体智慧画布(Collective Wisdom Canvas,简称CWC)”模板,具体描述可参看《**知识管理工具——引导技术及集体智慧画布CWC的使用** 》文章。
众多的大语言模型LLM的出现,曾经让许多企业用户感觉可以解决一切的问题。
但是最近企业实践表明,大模型在知识幻觉、信息过时、参数化知识效率低、缺乏专业领域的深入知识、推理能力弱 等方面的不足开始凸显了出来。
大模型可以生成流畅、连贯的文本,但生成的信息经常不准确或不一致,而企业里需要的往往是精准、确切、不能出错的知识。
防止大模型产生幻觉的方法之一,就是使用能提供事实知识源的知识库,例如向量数据库或知识图谱。
向量数据库使用高维向量来表示数据,擅于表达实体或概念之间的相似性或相关性,非常适合相似性搜索和最佳匹配搜索。
知识图谱用于捕捉实体之间复杂的关系和依赖关系,并提供语义分析和推理能力,相应的图数据库擅于表达对象之间的关系。
因此,将大模型+知识库结合起来,形成所谓的RAG模式 ,可能是当前最靠谱的一种落地方式。
RAG的全称是Retrieval-Augmented Generation,中文翻译为检索增强生成 。
它能够为大模型提供外部知识源,能够生成准确且符合上下文的答案,同时能够减少模型幻觉。
RAG的基本流程是,当回答问题时,先从企业知识库中已积累的大量知识中检索到相关信息,然后基于这些信息,再让大模型生成答案。
在已经具备强大功能的大模型基础上,RAG通过扩展其能力,使其能够访问特定行业知识库、垂直领域知识库或企业内部知识库,而无需重新训练模型,因此也更具有经济性。
RAG的发展等会对知识管理产生哪些影响呢?可能需要在如下几个方面特别关注:
1)在知识基础形态和知识质量方面
提升知识的结构化、标准化,以新的知识形态(例如以“主题+内容段落+索引标签”形成一个一个基本知识单元),降低知识预处理难度,更容易被AI利用(AI-friendly)。
2)在知识分类及标签体系方面
需要融合多种方式,重构知识多维分类及标签体系,兼容企业官方定义的分类(如业务、专业、岗位、产品、客户、部门、场景等分类)、用户上传知识时自己打的标签、搜索/问答等大家键入的关键词以及大模型自动提取的关键信息标签等。
3)在企业的知识全链路运营方面
在知识生产、知识流通、知识消费这个全链路中,需要积极应变,例如制定文档(图片/音频/视频)制作的标准和范例,引导员工按照标准模板和优秀范例去生产各种word、excel、PPT等文档和其他形态知识。
4)在企业知识管理体系方面
以用户视角、应用视角,重新审视企业知识管理体系,看看知识搜索、问答、推荐、应用等时,用户具体要什么、他们会怎么问,并对这些需求做总结和抽象,同时也需要考虑AI效果如何评估,AI测试集、训练集如何搭建等。
在人工智能时代的大背景下,每个行业、每个企业都需要培育、训练出自己的AIKM智能体 。
所有人的角色也会发生重大的转变。
普通员工需要掌握使用AI技能,加速成为专家;
作业员工具备数据知识,需要持续训练AI;
业务专家需要向AI高级训练师和KMer转变。
在这样时代洪流中,知识管理者应该做哪些准备呢?
第一,加快构建属于自己行业专业领域的知识库。
第二,基于业务场景向智能化方向不断去探索。
第三,回归人的本质并发掘人的创造性及潜力。
《道德经》有云:江海所以能为百谷王者,以其善下之,故能为百谷王 。
未来的AIKM智能体,就是我们的百谷王。
备注:文中观点仅代表作者当下的认识,不够究竟圆满之处,请多指教斧正。自利利他,如果觉得文章还不错,对其他人有点帮助,欢迎转发分享。
推荐阅读
更多AI工具,参考Github-AiBard123,国内AiBard123