知识图谱与大规模语言模型

知识图谱(KG

知识图谱(Knowledge Graph – KG) 是人工智能的一个重要分支,它基于2001年由万维网创始人Tim Berners-Lee和Jim Hendler、Ora Lassila提出的语义网(Semantic Web)概念,并由谷歌在2012年进一步改进位知识图谱的概念,其本质上是基于图论的知识表示和推理技术, 目的是将丰富的实体和关系信息结构化地表示出来,并通过推理和查询来实现知识的获取和应用。 这项技术在搜索、问答、推荐等互联网场景中有着广泛的应用。

知识图谱的优点是可以利用已有的知识进行推理和补充。 知识图谱可以构建一个与搜索结果相关的完整的知识体系。 在用户搜索时,通过知识图谱往往可以遇到意想不到的发现,比如某个新的事实或者新的联系,从而帮助用户发现和发掘额外的信息。 在知识图谱中,用户搜索的次数越多,范围越广,负责搜索的引擎就能获取越多的信息和内容。 由于知识图谱可以融合关键词相关的内容,假设用户搜索「玛丽居里」,利用了知识图谱的搜索引擎不仅会搜索「玛丽居里」这个关键词相关的信息,同时还可以返回居里夫人的其他相关联信息,获得关于其教育背景和科学发现方面的详细介绍。 因此知识图谱可以为用户找出更加准确的信息,作出更全面的总结并提供更有深度的相关信息,把与搜索关键词相关的知识体系化地展示给客户。

最近ChatGPT的出现使得研究人员对知识图谱也产生了反思,大规模语言模型所展现出的出色表现使得研究人员觉得不一定需要完全结构化的传统图谱也能达到一样的目的。 出于大规模语言模型Large Language Model (LLM)语言理解方面的高度能力和影响,未来知识图谱的发展可以考虑结合着LLM去发展。 比如知识图谱的构建往往是抽取式的,而且包含一些知识冲突检测、小节过程,整个过程都能溯源。 如果LLM能以这样的知识作为输入,应该能在相当程度上解决当前ChatGPT的事实谬误问题,并具有可解释性,且增强模型的推理能力。

图1. Linked Open Data示意图。 每个节点是一个图数据库,节点之间的链接代表图数据库之间的语义相连。

大规模语言模型

由于近些年算力和深度学习算法的提高,大规模语言模型取得了巨大的进展。 大规模语言模型是指用深度学习等技术从大规模文本语料库中学习语言的模型。 ChatGPT就是目前最典型的一个。 其背后技术的基本思想是通过巨大规模的文本数据集对模型进行训练,然后再将该模型在各种语言和文本的处理任务上进行微调,从而达到想要的效果。

LLM能够学习到自然语言潜在的规律和语言结构。 它的应用广泛,可以快速并出色地完成文本分类、问答、机器翻译、文本生成,甚至撰写代码等任务。 同时由于模型可以从大规模文本语料库中学习,因此可以适应不同的语言和文化环境,具有较强的泛化能力。

然而LLM同时也存在一些挑战。 比如ChatGPT无法联网使用,因此缺乏最新的信息。 此外ChatGPT目前最公认的问题是偶尔存在「一本正经胡说八道」的事实谬误问题。 由于类似ChatGPT的大规模语言模型是一个「黑盒」模型,可解释性弱,导致了当下在内容的可信性和可控性上存在一定的局限。 另外数据偏差、巨大的计算资源需求、推理计算能力不足,难以给出靠谱的预测推断和潜在的关联等等也同样是LLM当下面临的问题。 目前,研究人员正在努力解决这些问题,并进一步拓展大规模语言模型在自然语言处理领域的应用。

大规模语言模型在改变个人生活生产的同时,也对企业带来了挑战。 研究人员认为,对于大型企业来说,应该有勇气和决心去给ChatGPT带来新的革命性的发展。 对于中型企业老说来说,应该考虑如何定制大规模语言模型,并将其和各种业务系统进行结合,打造自己的领域中间件。 而对于小厂应该想想如何将自身业务嫁接在ChatGPT上,形成相对于其他竞争对手的技术优势。

知识图谱和大规模语言模型在金融领域的实践

1.知识图谱

金融是最早尝试知识图谱技术的行业,在反欺诈、反洗钱、量化分析、产业链因果推断、营销获客、智能投研与投顾等诸多细分领域都有知识图谱的深入应用。

金融行业是多元化的行业,随着市场需求和金融创新的推进,不断涌现出新的金融衍生品产品。 在这样的背景下,可以构建金融中不同领域的知识图谱,从而实现领域知识管理、跨域融合及推理应用等,最终形成多业务图谱构建迭代的企业级知识图谱架构和与之对应的开放平台。

知识图谱同样可以应用于金融中台的建设,将金融数据、知识和业务三者进行整合,形成一个多功能的平台。 其整合的核心是多个工作流,包括知识建模工作流、映射式构建工作流、抽取式构建工作流、知识应用工作流和知识运营工作流。

2.大规模短语模型 法学硕士

凭借LLM强大的自然语言处理和生成能力,可以给金融行业带来更高效、更准确的信息处理和决策分析能力,以及提供更好的客户服务和风险管理能力。 其应用包括但不限于客户服务,风险管理,投资分析等。

金融产品通常涉及很多专业术语和复杂的流程。 针对这一痛点,ChatGPT可以通过智能对话帮助客户更轻松地理解和使用这些产品。 此外,在大规模的金融客户数量下,LLM可以对客户提出的询问和投诉进行自动回答,从而大量节省客服人员的时间和劳动力成本。 且相较于市面上现有的客服机器人,LLM的对话方式更接近于人类,并对客户问题有更针对的响应,提升用户体验。

在金融投资方面,LLM有潜力帮助金融机构进行数据分析和预测。 金融行业数据量大。 LLM可以通过机器学习对这些数据进行分析,预测市场趋势和投资机会。 在投顾领域,传统的投资建议往往是针对所有客户的,但是有了LLM,可以提供智能投顾服务,针对不同客户特定的需求偏好,提供个性化的投资建议。 其次LLM可以评估投资或金融产品的潜在风险,包括分析市场趋势、评估公司的财务状况以及考虑可能影响金融市场的宏观经济因素。

综上所述,LLM在金融领域具有巨大的潜力,而知识图谱在该领域已经取得了一定的成就。 随着LLM推理能力的不断增强以及事实谬误、算力等问题的逐一解决,LLM有望在金融领域占据举足轻重的地位。

本文作者:张清鹏博士



在此感谢InnoHK、香港特别行政区政府及人工智能金融科技实验室对本文的支持。
(AIFT竭力但不能保证内容之准确和可靠,亦不会承担因任何不准确或遗漏而引起的任何损失或损害。 )

分享此內容

宋林琦教授于日内瓦国际发明展获得2项银奖

地址

香港沙田香港科学园科技大道西 19号
11楼 1101-1102 及 1121-1123 室

产品及解决方案

人才

工作机会

关于我们

地址

版权所有 © 2024 人工智能金融科技实验室有限公司