CityU logo

用ChatGPT预测股票价格变动,能行吗?

近来,大型语言模型(LLMs)在各个领域的应用均备受关注,但在金融学领域,使用LLMs预测股票市场回报率仍是相对新兴的领域。一方面,市场认为LLMs在此方面提供的价值较小,因为这些模型大多没有经过针对近日市场资料的专门训练。另一方面,由于LLMs相比于以往的语言模型能够更准确地理解自然语言,因此从这个角度来说它们有望成为处理文本信息并预测股票收益率的有力工具。所以,LLMs在预测金融市场动态方面的表现仍值得研究和讨论。

这项研究可以帮助监管机构和政策制定者了解LLMs使用在金融市场中可能产生的潜在益处和风险,同时也为市场中的资产管理人员和机构投资者提供了新投资组合构造的灵感,将LLMs纳入投资策略可能将目前已有的诸如多因子模型这类传统量化投资模型进一步优化。此外,以这项研究为起点,可以推进LLMs在金融学界的潜力与局限性的探索,并为将来开发更复杂、专门为金融行业需求度身订制的LLMs提供有益的经验参考。但是,值得注意的是,LLMs的推广与应用本质上仍是AI技术在现实应用中的深度拓展,相较于传统的NLP(自然语言处理)其拥有了更多的训练参数。因此使得LLMs在理解和生成自然语言方面有着更为优异的表现。同时,LLMs亦展现出相当程度的逻辑推理能力。

而在目前市场上最成功的LLMs莫过于人工智能研究公司 OpenAI在2022 年 11 月 30 日推出的ChatGPT了。其一经推出,便实现了用户的爆发性增长:截至 2023 年 1 月,推出短短2个月其总用户数已经突破 1 亿,同时每天有高达 1,300 万的活跃用户。更值得关注的是,ChatGPT迅速为各行业带来了前所未有的应用冲击,并开始塑造新兴的业态场景。因此,讨论ChatGPT是否能够超越传统模型,在预测股价变动方面展现更为优异的结果是一个相当有趣的话题。

ChatGPT预测股票收益率的资料

Alejandro Lopez-Lira和Yuehua Tang的这篇工作论文[1]是最早评估ChatGPT在预测股票市场收益率的论文之一。通过使用该模型的情感分析功能 1,作者使用新闻标题数据评估了ChatGPT的性能,并将其与领先数据供货商提供的现有情感分析方法进行比较。

在这篇论文中,作者主要使用了两个数据集:一是CRSP(Center for Research in Security Prices)中的股票收益率数据,二是一家领先数据供货商提供的新闻头条数据。样本期从2021年10月2到2022年12月(由于ChatGPT 所采用的训练数据在2021年9月才可获得,这样的样本时间设置避免了数据泄漏问题)。为了基于数据集中的每个新闻标题生成相应的情感分数3,作者使用了OpenAI开发的大型语言模型ChatGPT 3.5 4 的预训练版本 。


1 其基于深度学习的方法,ChatGPT能够理解文本的上下文并准确识别情绪。

2 数据泄漏(data leakage)是指在模型训练过程中,不慎将测试数据的信息泄漏到训练过程中,从而对模型预测结果产生不可意识的影响。这种情况下,模型可能会给出一个非常乐观的结果,但在实际新数据上的预测表现却可能非常糟糕。由于ChatGPT的训练数据截至于2021年9月,因此测试样本在2021年10月或之后可以避免数据泄漏的问题。这意味着,在这个时间点之后,对于新的数据进行测试时,无需担心数据泄漏对模型性能造成的负面影响。

3 具体计算方法参见下文中情感分析的具体解释。

4 选择ChatGPT3.5作为训练模型是因为它已经被证明在各种自然语言处理任务中表现稳定且良好,包括情感分析。

ChatGPT预测股票收益率的方法

以下介绍具体的基于ChatGPT的情绪分析过程以及相应的实证检验结果。首先,作者使用ChatGPT的prompt进行交互对话,并让ChatGPT从一个财务分析师的视角对每个公司的新闻进行情感分析,并将其转换为「ChatGPT分数」。例如,将与xxx公司相关的新闻输入ChatGPT中后并对其进行提问「这对xxx公司而言是好消息还是坏消息?」,如果ChatGPT的回答是「Yes」,则对应记录为1(表示对该公司是个好消息),「UNKNOWN」则为0(表示对这条新闻的情感倾向不明显),「NO」则对应记录为-1(表示对该公司是个坏消息)。如果样本中的某间公司在同一天有多个新闻标题,则取相应的平均分数作为ChatGPT对该公司的最后打分。然后作者使用滞后一天5的ChatGPT情感得分来预测该公司当天的股票收益率。具体地,作者使用线性回归来检验ChatGPT情感得分对日度股票收益率的预测能力,同时控制了年份固定效应和公司层面的固定效应6。同时作者也将基于ChatGPT的预测结果与基于其他数据供货商提供的传统情感分析方法的预测结果进行了比较。

 每日收益率(%)新闻标题长度ChatGPT的回复长度GPT的情绪得分事件情绪得分
每日收益率(%)1
新闻标题长度0.001
ChatGPT的回复长度0.000.261
GPT的情绪得分0.020.080.441
事件情绪得分0.00-0.080.100.271
表 1  主要变量相关系数矩阵
图 1 投资$1美元的累计回报 (在没有交易成本的情况下)

5 确保回归中不会使用到未来数据。回归是一种统计分析方法,用于探究因变量(在本文中指股票的日度收益率)与一个或多个自变量(本文中只有一个,指ChatGPT生成的新闻情感得分)之间的线性相关关系。

6 通过引入年份的虚拟变量或固定效应,模型可以捕捉到这些隐含的年份效应,从而控制了这些年份相关的未观察到的因素对结果变量的干扰。具体而言,模型为每个年份引入一个二元变量(dummy variable)。同样地,引入公司虚拟变量或固定效应可以控制这些公司未观察到因素对结果变量的干扰。这意味着模型将每个公司视为一个独立的类别,并为每个公司引入一个二元变量。

ChatGPT预测股票收益率的表现

作者首先发现ChatGPT的情绪得分与样本股票随后的每日回报之间存在最强的相关性(见表1)。所以使用情绪得分去预测未来股票收益率有其合理性。

图一直观地向我们展示了在不考虑交易成本的情况下,假设在2021年的10月份初始资金只有1块钱,各个不同投资组合在交易策略回测下的净值变化情况。黑线对应于前一天有新闻的所有公司的等权重投资组合的净值,在历史回测的时间终点其投资组合收益率是最低的。绿线对应于根据ChatGPT得分购买有好消息公司的等权重组合的历史净值。红线对应于根据ChatGPT得分只卖空有坏消息公司的等权重组合。蓝线对应于根据ChatGPT得分构造的等权重的零成本投资组合,具体含义是同时买入有好消息的公司并卖空有坏消息的公司。显然在上述所有的投资组合构造方法中,基于ChatGPT 情绪得分构造的多空组合获得了最优异的表现,在样本区间内获得了初始资金约4倍的收益7。这说明ChatGPT情感得分在预测每日股市收益方面具有统计学意义上的显著能力。通过利用新闻头条数据和生成的情感得分,发现ChatGPT评估与样本股票随后的每日回报之间存在强相关性。这个结果突显了ChatGPT作为一种基于情感分析预测股市走向的有价值工具的潜力。

同时作者为进一步增强研究结果的稳健性,将ChatGPT的表现与一个主要数据供货商提供的传统情感分析方法进行比较。结果表明,在控制ChatGPT所生成的情感得分后,其他情感得分对每日股市收益率的预测能力降至零。这表明,基于ChatGPT得到的情感得分在预测股市回报方面优于现有的其他情感分析方法。换句话说,ChatGPT相比其他模型能捕捉到额外的信息。


7 左轴表示投资组合的单位净值的变化,测试开始时被标准化为1美元,所以当最终净值达到5美元时,收益率为400%。

ChatGPT预测股票收益率的展望

为金融行业专门设计的大型语言模型的发展非常重要,并且未来的研究中应该关注了解这些模型的预测能力机制。此外,随着大型语言模型在金融行业中的普及,必须调查它们对市场动态、价格形成、信息传播和市场稳定性的潜在影响。未来的研究可以探索将大型语言模型与其他机器学习技术和量化模型相结合,以创建表现更为优异的智能投资系统,进一步提高AI驱动模型在金融经济学中的预测能力。

参考文献:

[1] Lopez-Lira, A., & Tang, Y. (2023). Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models. arXiv preprint arXiv:2304.07619.

本网页内容并非投资意见,亦不构成任何投资产品之要约、要约招揽或建议。本数据只作为一般用途,它并没有考虑您的个人需要、投资目标及特定财政状况。投资附带风险。

在此感谢 InnoHK、香港特别行政区政府及人工智能金融科技实验室对本文的支持。
(AIFT 竭力但不能保证内容之准确和可靠,亦不会承担因任何不准确或遗漏而引起的任何损失或损害。)

分享此內容

张昕之博士

人工智能驱动的供应链优化:应对动态世界的需求

阅读更多

地址

香港沙田香港科学园科技大道西 19号
11楼 1101-1102 及 1121-1123 室

产品及解决方案

人才

工作机会

关于我们

地址

版权所有 © 2024 人工智能金融科技实验室有限公司