中山大学林建浩团队|| 多源数据驱动的金融大语言模型文本分析与交易策略

多源数据驱动的金融大语言模型文本分析与交易策略
作者:
樊嘉诚:中山大学岭南学院
吴俊樊:招商证券资产管理有限公司
林建浩:中山大学岭南学院
文章刊发:《计量经济学报》2026年 第2期
摘要:金融市场中信息来源多元且结构复杂, 如何对其系统整合并形成可交易的投资信号, 已成为资产定价研究与实践中的核心问题. 本文基于多源数据和金融大语言模型, 构建了一个涵盖新闻、股价、宏观分析及信号生成模块的智能决策系统, 以 2020–2024 年沪深300 指数成份股为样本, 系统评估了大语言模型生成的投资决策信号的预测能力. 首先, 根据买入、持有和卖出信号构建了三类投资组合, 净值曲线与风险收益指标分析表明, 买入信号组合的超额收益 (23.83%) 显著优于持有信号 (6.96%) 和卖出信号 (-15.08%), 验证了方向性信号具备有效的收益预测能力. 其次, 本文引入买入评分机制, 对买入信号进行细粒度分类并构建投资组合. 结果显示, 高评分的多头组合累计超额收益高达 99.20%, 夏普比率为 0.65, 换手率仅为 41.16%, 表明买入评分对未来收益具有显著的增量预测能力且具有一定的持仓持续性. 最后, 本文利用券商深度研究报告对大语言模型进行微调, 进一步实现了投资策略性能的显著提升. 本文系统展示了金融大语言模型在实证资产定价中的应用潜力, 验证了其在投资信号识别、策略构建及模型微调方面的有效性, 为人工智能赋能金融决策提供了可行路径.
关键词:大语言模型,实证资产定价,经济金融文本分析
1.研究背景及意义
在金融市场中,投资者情绪与市场预期往往蕴含于新闻报道、研究报告等非结构化文本中。随着信息来源日益多元、数据结构日趋复杂,如何系统整合海量信息并形成可交易的投资信号,已成为资产定价领域的核心难题。传统文本分析方法依赖预设情感词典或词频统计,将高维语义压缩为低维特征,不仅难以捕捉跨渠道、跨时间的信息联动,更无法充分刻画文本的复杂性与时变性,难以适应市场叙事的动态演化。与此同时,我国正在加快建设全国统一大市场,深化要素市场化改革。作为要素市场的重要组成部分,金融市场是经济运行的“血液系统”,对于实体经济发展的影响直接且重要。随着改革深化以及逐步开放,我国资本市场与外部市场的联动性日趋增强,但市场内部的信息处理效率和资源配置效率仍有待提升。在此背景下,如何有效利用前沿人工智能技术提升金融市场的信息处理能力和定价效率,具有重要的理论价值和现实意义。
作为人工智能技术的代表性成果,大语言模型在自然语言处理领域展现出卓越性能,为经济金融文本分析提供了新的研究视角与方法路径。借助大语言模型,从海量、多源、异构文本中提取投资相关信息成为可能,其优势主要体现在三类互补能力上:一是对经济叙事和市场预期的近似刻画能力,使模型能够从新闻、公告、研究报告及宏观评论中提取有效信息;二是对多源信息的整合能力,使模型能够将分散的、多样化的文本信息映射到统一的语义空间,并在零样本或少样本条件下对新文本进行分析和理解;三是推理与规则归纳能力,使模型能够识别事件之间的因果联系,总结一般性规则或模式。因此,构建基于大语言模型的智能投资决策系统,不仅有助于提升资产定价的效率和准确性,也为深化金融要素市场化改革、促进资本市场高质量发展提供了新的技术路径。
2.主要内容
本文基于2020—2024年沪深300指数成份股数据,围绕多源信息驱动的金融大语言模型在投资决策中的应用展开系统研究,并从信号预测能力、评分机制有效性及模型微调优化等多个维度进行深入探讨。在方法层面,文章首先构建了涵盖新闻分析、股价分析、宏观经济分析和信号生成的模块化智能决策系统,通过文本嵌入与大语言模型技术对海量财经新闻、市场数据及宏观研报进行结构化处理与语义整合。其中,新闻模块对财经报道进行主题分类与去重摘要,生成结构化的月度新闻总结,有效捕捉市场情绪和企业动态的变化趋势。股价模块识别关联公司并计算风险收益指标,通过对比目标公司与关联公司及市场指数的表现差异,模块生成月度股价总结,为投资决策提供量化的市场依据。宏观经济模块负责捕捉宏观环境变化对投资决策的影响,从通货膨胀、经济增长、货币和财政政策等维度提炼关键信息,生成宏观背景总结。信号生成模块则整合上述信息输出投资决策和建议,并对投资建议进行量化评估。
在实证检验层面,文章首先介绍了样本数据构成及模型设定,随后运用投资组合分析方法系统评估大语言模型生成信号的实际预测能力。具体而言,实证检验涵盖以下内容:第一,基于三类投资信号构建等权与市值加权投资组合进行基准检验,验证方向性信号对市场收益的区分能力。第二,引入买入评分机制构建高评分多头与低评分空头组合,检验细粒度评分的增量预测能力及持仓持续性。第三,基于评分排序构建沪深300指数增强策略,并在考虑交易成本与实际调仓约束下评估策略稳健性。第四,开展多源数据消融实验与稳健性检验:通过依次剔除新闻、股价及宏观信息评估各数据源贡献度;替换大语言模型基座、调整文本去重阈值及变换样本筛选标准,强化结论可靠性。第五,利用券商深度研究报告进行金融领域微调,对比无监督预训练与有监督问答微调对模型决策能力的提升效果,深入探讨金融知识增强对信号质量的优化机制。
3. 主要结论与政策建议
本文的研究得出以下主要结论:一是基于大语言模型的智能投资决策系统能够有效整合新闻、股价和宏观经济等多维度信息,生成具有显著预测能力和区分度的投资信号。二是买入评分机制对未来收益具有显著的增量预测能力,且高评分组合具有良好的持仓持续性。三是消融实验表明,新闻和股价信息对策略效果影响最大,而宏观经济信息作用相对有限。四是经过无监督预训练微调和有监督问答微调后,买入与卖出信号的累计收益差进一步提升,表明金融知识增强有效提升了模型的市场判断能力和信号识别精度。
基于上述研究发现,本文提出以下政策建议:第一,构建高质量、可共享的金融微调语料库,推动人工智能技术在金融领域的应用。建议监管机构和行业协会牵头,整合券商研究报告、财经新闻、公司公告等多源数据,构建标准化、高质量的金融语料库,支持科研机构和市场参与者开展模型训练与优化。第二,制定针对智能投资决策系统的透明度和可解释性标准。人工智能技术面临着算法黑箱问题,应建立完整的“人工智能+金融”披露制度,要求机构投资者在使用智能投顾或算法交易系统时,充分披露模型的决策逻辑、数据来源和风险特征,保障投资者的知情权和选择权,维护市场公平与稳定。第三,加强对中小投资者的教育和保护,促进智能投顾服务的普惠发展。大语言模型等AI技术不仅能够服务机构投资者,也能够通过智能投顾等形式帮助个人投资者提升决策质量,降低非理性交易行为。建议监管部门在规范行业发展的同时,鼓励金融机构开发适用于个人投资者的智能投顾工具,推动金融信息服务的智能化升级,实现金融科技发展成果的更广泛共享。
4. 边际贡献与未来拓展
本文的边际贡献主要体现在以下两个方面:在方法论层面,本文设计并实现了一个基于大语言模型的模块化智能投资决策系统。该系统将新闻分析、股价分析、宏观经济分析和信号生成功能模块化解耦,不仅具备良好的可扩展性和用户适配性,还引入了具有可解释性的投资信号与细粒度评分机制。这种架构设计突破了传统文本分析方法的局限,实现了对多源异构数据的系统性整合。在应用层面,本文构建了针对金融语境的大语言模型微调方案。利用深度研究报告生成的问答数据对模型进行微调,显著增强了其对金融文本的理解和投资信号识别能力。这一方案为金融领域的模型定制化提供了可复现的技术路径,有助于推动通用大语言模型向专业金融模型的转化。
未来研究可从以下方向深入推进:首先,构建跨语言、跨市场的全球化资产配置模型,提取跨市场共性特征,提升智能投资决策系统的多语言与跨市场泛化能力,为投资者提供全球资产配置建议。其次,结合更大规模、更高质量的金融微调语料库,进一步增强大语言模型的金融知识。同时,探索提示词工程、检索增强生成等技术对策略稳定性的影响,以在更大样本规模和更长时间跨度下检验模型的泛化性与稳健性。最后,加强模型可解释性研究和人机协同决策机制探索。
5.写作、投稿、修改的过程和心得体会
在生成式人工智能技术与金融多源数据分析创新融合的背景下,我们聚焦于大语言模型在多源异构数据整合与资产定价中的应用,围绕智能投资决策系统的构建展开了系统性研究。写作过程中,团队反复推敲与打磨,从提示词逻辑设计到模块化架构搭建,力求精准刻画多源信息融合的决策机制。鉴于《计量经济学报》在计量经济学领域的权威性和严谨标准,我们选择向该刊投稿。论文返修期间,编辑部老师展现出专业和细致的工作态度,外审专家的修改意见直击问题核心,从智能体概念的明确界定、前沿文献的系统梳理到讨论分析的深度拓展提出了富有建设性的指导,对我们完善研究框架提供了重要帮助。衷心感谢《计量经济学报》编辑部的辛勤付出!期待贵刊在人工智能与计量经济学的交叉领域继续深耕,不断提升学术影响力。
樊嘉诚 , 吴俊樊 , 林建浩. 多源数据驱动的金融大语言模型文本分析与交易策略. 计量经济学报, 2026, 6(2): 304-324.
Jiacheng FAN , Junfan WU , Jianhao LIN. Text Analysis and Trading Strategies with Multi-Source Financial Large Language Models. China Journal of Econometrics, 2026, 6(2): 304-324.

