用ChatGPT預測股票價格變動,能行嗎?

近來,大型語言模型(LLMs)在各個領域的應用均備受關注,但在金融學領域,使用LLMs預測股票市場回報率仍是相對新興的領域。一方面,市場認為LLMs在此方面提供的價值較小,因為這些模型大多沒有經過針對近日市場資料的專門訓練。另一方面,由於LLMs相比於以往的語言模型能夠更準確地理解自然語言,因此從這個角度來說它們有望成為處理文本資訊並預測股票收益率的有力工具。所以,LLMs在預測金融市場動態方面的表現仍值得研究和討論。

這項研究可以幫助監管機構和政策制定者瞭解LLMs使用在金融市場中可能產生的潛在益處和風險,同時也為市場中的資產管理人員和機構投資者提供了新投資組合構造的靈感,將LLMs納入投資策略可能將目前已有的諸如多因數模型這類傳統量化投資模型進一步優化。此外,以這項研究為起點,可以推進LLMs在金融學界的潛力與局限性的探索,並為將來開發更複雜、專門為金融行業需求度身訂制的LLMs提供有益的經驗參考。但是,值得注意的是,LLMs的推廣與應用本質上仍是AI技術在現實應用中的深度拓展,相較於傳統的NLP(自然語言處理)其擁有了更多的訓練參數。因此使得LLMs在理解和生成自然語言方面有著更為優異的表現。同時,LLMs亦展現出相當程度的邏輯推理能力。

而在目前市場上最成功的LLMs莫過於人工智能研究公司 OpenAI在2022 年 11 月 30 日推出的ChatGPT了。其一經推出,便實現了用戶的爆發性增長:截至 2023 年 1 月,推出短短2個月其總用戶數已經突破 1 億,同時每天有高達 1,300 萬的活躍用戶。更值得關注的是,ChatGPT迅速為各行業帶來了前所未有的應用衝擊,並開始塑造新興的業態場景。因此,討論ChatGPT是否能夠超越傳統模型,在預測股價變動方面展現更為優異的結果是一個相當有趣的話題。

ChatGPT預測股票收益率的資料

Alejandro Lopez-Lira和Yuehua Tang的這篇工作論文[1]是最早評估ChatGPT在預測股票市場收益率的論文之一。通過使用該模型的情感分析功能 1,作者使用新聞標題資料評估了ChatGPT的性能,並將其與領先資料供應商提供的現有情感分析方法進行比較。

在這篇論文中,作者主要使用了兩個資料集:一是CRSP(Center for Research in Security Prices)中的股票收益率資料,二是一家領先資料供應商提供的新聞頭條資料。樣本期從2021年10月2到2022年12月(由於ChatGPT 所採用的訓練資料在2021年9月才可獲得,這樣的樣本時間設置避免了資料洩漏問題)。為了基於資料集中的每個新聞標題生成相應的情感分數3,作者使用了OpenAI開發的大型語言模型ChatGPT 3.5 4的預訓練版本 。


1 其基於深度學習的方法,ChatGPT能夠理解文本的上下文並準確識別情緒。

2 資料洩漏(data leakage)是指在模型訓練過程中,不慎將測試資料的資訊洩漏到訓練過程中,從而對模型預測結果產生不可意識的影響。這種情況下,模型可能會給出一個非常樂觀的結果,但在實際新數據上的預測表現卻可能非常糟糕。由於ChatGPT的訓練資料截至於2021年9月,因此測試樣本在2021年10月或之後可以避免資料洩漏的問題。這意味著,在這個時間點之後,對於新的數據進行測試時,無需擔心資料洩漏對模型性能造成的負面影響。

3 具體計算方法參見下文中情感分析的具體解釋。

4 選擇ChatGPT3.5作為訓練模型是因為它已經被證明在各種自然語言處理任務中表現穩定且良好,包括情感分析。

ChatGPT預測股票收益率的方法

以下介紹具體的基於ChatGPT的情緒分析過程以及相應的實證檢驗結果。首先,作者使用ChatGPT的prompt進行交互對話,並讓ChatGPT從一個財務分析師的視角對每個公司的新聞進行情感分析,並將其轉換為「ChatGPT分數」。例如,將與xxx公司相關的新聞輸入ChatGPT中後並對其進行提問「這對xxx公司而言是好消息還是壞消息?」,如果ChatGPT的回答是「Yes」,則對應記錄為1(表示對該公司是個好消息),「UNKNOWN」則為0(表示對這條新聞的情感傾向不明顯),「NO」則對應記錄為-1(表示對該公司是個壞消息)。如果樣本中的某間公司在同一天有多個新聞標題,則取相應的平均分數作為ChatGPT對該公司的最後打分。然後作者使用滯後一天5的ChatGPT情感得分來預測該公司當天的股票收益率。具體地,作者使用線性回歸來檢驗ChatGPT情感得分對日度股票收益率的預測能力,同時控制了年份固定效應和公司層面的固定效應6。同時作者也將基於ChatGPT的預測結果與基於其他資料供應商提供的傳統情感分析方法的預測結果進行了比較。

 每日收益率(%)新聞標題長度ChatGPT的回覆長度GPT的情緒得分事件情緒得分
每日收益率(%)1
新聞標題長度0.001
ChatGPT的回覆長度0.000.261
GPT的情緒得分0.020.080.441
事件情緒得分0.00-0.080.100.271
表 1  主要變數相關係數矩陣
圖 1 投資$1美元的累計回報 (在沒有交易成本的情況下)

5 確保回歸中不會使用到未來資料。回歸是一種統計分析方法,用於探究因變數(在本文中指股票的日度收益率)與一個或多個引數(本文中只有一個,指ChatGPT生成的新聞情感得分)之間的線性相關關係。

6 通過引入年份的虛擬變量或固定效應,模型可以捕捉到這些隱含的年份效應,從而控制了這些年份相關的未觀察到的因素對結果變量的干擾。具體而言,模型為每個年份引入一個二元變量(dummy variable)。同樣地,引入公司虛擬變量或固定效應可以控制這些公司未觀察到因素對結果變量的干擾。這意味著模型將每個公司視為一個獨立的類別,並為每個公司引入一個二元變量。

ChatGPT預測股票收益率的表現

作者首先發現ChatGPT的情緒得分與樣本股票隨後的每日回報之間存在最強的相關性(見表1)。所以使用情緒得分去預測未來股票收益率有其合理性。

圖一直觀地向我們展示了在不考慮交易成本的情況下,假設在2021年的10月份初始資金只有1塊錢,各個不同投資組合在交易策略回測下的淨值變化情況。黑線對應於前一天有新聞的所有公司的等權重投資組合的淨值,在歷史回測的時間終點其投資組合收益率是最低的。綠線對應於根據ChatGPT得分購買有好消息公司的等權重組合的歷史淨值。紅線對應於根據ChatGPT得分只賣空有壞消息公司的等權重組合。藍線對應於根據ChatGPT得分構造的等權重的零成本投資組合,具體含義是同時買入有好消息的公司並賣空有壞消息的公司。顯然在上述所有的投資組合構造方法中,基於ChatGPT 情緒得分構造的多空組合獲得了最優異的表現,在樣本區間內獲得了初始資金約4倍的收益7。這說明ChatGPT情感得分在預測每日股市收益方面具有統計學意義上的顯著能力。通過利用新聞頭條資料和生成的情感得分,發現ChatGPT評估與樣本股票隨後的每日回報之間存在強相關性。這個結果突顯了ChatGPT作為一種基於情感分析預測股市走向的有價值工具的潛力。

同時作者為進一步增強研究結果的穩健性,將ChatGPT的表現與一個主要資料供應商提供的傳統情感分析方法進行比較。結果表明,在控制ChatGPT所生成的情感得分後,其他情感得分對每日股市收益率的預測能力降至零。這表明,基於ChatGPT得到的情感得分在預測股市回報方面優於現有的其他情感分析方法。換句話說,ChatGPT相比其他模型能捕捉到額外的資訊。


7 左軸表示投資組合的單位淨值的變化,測試開始時被標準化為1美元,所以當最終淨值達到5美元時,收益率為400%。

ChatGPT預測股票收益率的展望

為金融行業專門設計的大型語言模型的發展非常重要,並且未來的研究中應該關注瞭解這些模型的預測能力機制。此外,隨著大型語言模型在金融行業中的普及,必須調查它們對市場動態、價格形成、資訊傳播和市場穩定性的潛在影響。未來的研究可以探索將大型語言模型與其他機器學習技術和量化模型相結合,以創建表現更為優異的智能投資系統,進一步提高AI驅動模型在金融經濟學中的預測能力。

參考文獻:

[1] Lopez-Lira, A., & Tang, Y. (2023). Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models. arXiv preprint arXiv:2304.07619.

本網頁內容並非投資意見,亦不構成任何投資產品之要約、要約招攬或建議。本資料只作為一般用途,它並沒有考慮您的個人需要、投資目標及特定財政狀況。投資附帶風險。

在此感謝 InnoHK、香港特別行政區政府及人工智能金融科技實驗室對本文的支持。
(AIFT 竭力但不能保證內容之準確和可靠,亦不會承擔因任何不準確或遺漏而引起的任何損失或損害。 )

分享此內容

閱讀更多

地址

香港沙田香港科學園科技大道西 19 號
11樓 1101-1102 及 1121-1123 室

產品及解決方案

人才

工作機會

關於我們

地址

版權所有 © 2024 人工智能金融科技實驗室有限公司