知識圖譜與大規模語言模型 (Chinese Version Only)

知識圖譜(KG)

知識圖譜(Knowledge Graph – KG) 是人工智能的一個重要分支,它基於2001年由萬維網創始人Tim Berners-Lee和Jim Hendler、Ora Lassila提出的語義網(Semantic Web)概念,並由谷歌在2012年進一步改進位知識圖譜的概念,其本質上是基於圖論的知識表示和推理技術,目的是將豐富的實體和關係信息結構化地表示出來,並通過推理和查詢來實現知識的獲取和應用。這項技術在搜索、問答、推薦等互聯網場景中有著廣泛的應用。

知識圖譜的優點是可以利用已有的知識進行推理和補充。知識圖譜可以構建一個與搜索結果相關的完整的知識體系。在用戶搜索時,通過知識圖譜往往可以遇到意想不到的發現,比如某個新的事實或者新的聯繫,從而幫助用戶發現和發掘額外的信息。在知識圖譜中,用戶搜索的次數越多,範圍越廣,負責搜索的引擎就能獲取越多的信息和內容。由於知識圖譜可以融合關鍵詞相關的內容,假設用戶搜索「瑪麗居里」,利用了知識圖譜的搜索引擎不僅會搜索「瑪麗居里」這個關鍵詞相關的信息,同時還可以返回居里夫人的其他相關聯信息,獲得關於其教育背景和科學發現方面的詳細介紹。因此知識圖譜可以為用戶找出更加準確的信息,作出更全面的總結並提供更有深度的相關信息,把與搜索關鍵詞相關的知識體系化地展示給客戶。

最近ChatGPT的出現使得研究人員對知識圖譜也產生了反思,大規模語言模型所展現出的出色表現使得研究人員覺得不一定需要完全結構化的傳統圖譜也能達到一樣的目的。出於大規模語言模型Large Language Model (LLM)語言理解方面的高度能力和影響,未來知識圖譜的發展可以考慮結合著LLM去發展。比如知識圖譜的構建往往是抽取式的,而且包含一些知識衝突檢測、小節過程,整個過程都能溯源。如果LLM能以這樣的知識作為輸入,應該能在相當程度上解決當前ChatGPT的事實謬誤問題,並具有可解釋性,且增強模型的推理能力。

圖1. Linked Open Data示意圖。每個節點是一個圖數據庫,節點之間的連結代表圖數據庫之間的語義相連。

大規模語言模型(LLM)

由於近些年算力和深度學習算法的提高,大規模語言模型取得了巨大的進展。大規模語言模型是指用深度學習等技術從大規模文本語料庫中學習語言的模型。 ChatGPT就是目前最典型的一個。其背後技術的基本思想是通過巨大規模的文本數據集對模型進行訓練,然後再將該模型在各種語言和文本的處理任務上進行微調,從而達到想要的效果。

LLM能夠學習到自然語言潛在的規律和語言結構。它的應用廣泛,可以快速並出色地完成文本分類、問答、機器翻譯、文本生成,甚至撰寫代碼等任務。同時由於模型可以從大規模文本語料庫中學習,因此可以適應不同的語言和文化環境,具有較強的泛化能力。

然而LLM同時也存在一些挑戰。比如ChatGPT無法聯網使用,因此缺乏最新的信息。此外ChatGPT目前最公認的問題是偶爾存在「一本正經胡說八道」的事實謬誤問題。由於類似ChatGPT的大規模語言模型是一個「黑盒」模型,可解釋性弱,導致了當下在內容的可信性和可控性上存在一定的局限。另外數據偏差、巨大的計算資源需求、推理計算能力不足,難以給出靠譜的預測推斷和潛在的關聯等等也同樣是LLM當下面臨的問題。目前,研究人員正在努力解決這些問題,並進一步拓展大規模語言模型在自然語言處理領域的應用。

大規模語言模型在改變個人生活生產的同時,也對企業帶來了挑戰。研究人員認為,對於大型企業來說,應該有勇氣和決心去給ChatGPT帶來新的革命性的發展。對於中型企業老說來說,應該考慮如何定制大規模語言模型,並將其和各種業務系統進行結合,打造自己的領域中間件。而對於小廠應該想想如何將自身業務嫁接在ChatGPT上,形成相對於其他競爭對手的技術優勢。

知識圖譜和大規模語言模型在金融領域的實踐

1.知識圖譜

金融是最早嘗試知識圖譜技術的行業,在反欺詐、反洗錢、量化分析、產業鏈因果推斷、營銷獲客、智能投研與投顧等諸多細分領域都有知識圖譜的深入應用。

金融行業是多元化的行業,隨著市場需求和金融創新的推進,不斷湧現出新的金融衍生品產品。在這樣的背景下,可以構建金融中不同領域的知識圖譜,從而實現領域知識管理、跨域融合及推理應用等,最終形成多業務圖譜構建迭代的企業級知識圖譜架構和與之對應的開放平台。

知識圖譜同樣可以應用於金融中台的建設,將金融數據、知識和業務三者進行整合,形成一個多功能的平台。其整合的核心是多個工作流,包括知識建模工作流、映射式構建工作流、抽取式構建工作流、知識應用工作流和知識運營工作流。

2.大規模語言模型 – LLM

憑借LLM強大的自然語言處理和生成能力,可以給金融行業帶來更高效、更準確的信息處理和決策分析能力,以及提供更好的客戶服務和風險管理能力。其應用包括但不限於客戶服務,風險管理,投資分析等。

金融產品通常涉及很多專業術語和複雜的流程。針對這一痛點,ChatGPT可以通過智能對話幫助客戶更輕鬆地理解和使用這些產品。此外,在大規模的金融客戶數量下,LLM可以對客戶提出的詢問和投訴進行自動回答,從而大量節省客服人員的時間和勞動力成本。且相較於市面上現有的客服機器人,LLM的對話方式更接近於人類,並對客戶問題有更針對的響應,提升用戶體驗。

在金融投資方面,LLM有潛力幫助金融機構進行數據分析和預測。金融行業數據量大。LLM可以通過機器學習對這些數據進行分析,預測市場趨勢和投資機會。在投顧領域,傳統的投資建議往往是針對所有客戶的,但是有了LLM,可以提供智能投顧服務,針對不同客戶特定的需求偏好,提供個性化的投資建議。其次LLM可以評估投資或金融產品的潛在風險,包括分析市場趨勢、評估公司的財務狀況以及考慮可能影響金融市場的宏觀經濟因素。

綜上所述,LLM在金融領域具有巨大的潛力,而知識圖譜在該領域已經取得了一定的成就。隨著LLM推理能力的不斷增強以及事實謬誤、算力等問題的逐一解決,LLM有望在金融領域佔據舉足輕重的地位。

本文作者:張清鵬博士



在此感謝InnoHK、香港特別行政區政府及人工智能金融科技實驗室對本文的支援。
(AIFT竭力但不能保證內容之準確和可靠,亦不會承擔因任何不準確或遺漏而引起的任何損失或損害。 )

Share this content

Address

Units 1101-1102 & 1121-1123,
Building 19W Science Park West Avenue,
Hong Kong Science Park,
Shatin, Hong Kong

Products & Solutions

People

About Us

Address

Copyright © 2024 Laboratory for AI-Powered Financial Technologies Ltd. All Rights Reserved.