我院林建浩教授团队编撰《经济金融文本分析》正式出版

      诺奖得主Shiller提出的“叙事经济学”认为,公众预期不仅源于经济数据和理性推断,更广泛受到流行叙事、社会情绪和文化故事传播的影响。因此,经济金融文本数据蕴含着诸多传统结构化数据所缺失的信息,通过剖析新闻报道、社交媒体、政策文件和企业财报等文本资料,研究者能够考察市场情绪、政策不确定性,预测宏观经济指标以及解读投资者心理等。此类分析不仅使经济决策更趋于数据驱动且实时化,而且为政策制定者提供了政策效应评估的崭新工具。在此背景下,中山大学岭南学院林建浩教授团队编撰《经济金融文本分析》,由高等教育出版社正式出版,为读者提供关于如何运用文本数据的详尽介绍与操作指南。

      第一,相较于计算机领域的自然语言分析技术,本书更侧重于文本分析在经济学与金融学领域的应用,从经济学视角阐释了文本分析方法的基本处理思路。本书囊括了文本分析领域普遍适用的基础理论和方法,诸如文本预处理、构建文档词条矩阵、训练词向量等内容。

      第二,本书将前沿文本分析方法与经济学研究问题相融合,注重计算机科学与人文社会学科相互渗透。书中介绍了基于计量经济学模型和基于机器学习的文本情绪提取,这些方法与计算机科学领域关注的文本翻译、问答系统等任务显著不同。基于计量经济学的方法将文本分析与计量经济学相结合,是经济学研究者结合高维建模方法对文本数据提出的创新性应用。基于机器学习的方法则是将一般化的机器学习算法与文本信息提取相融合。通过高维数据模型或机器学习算法,实现有效降维,从而助力识别重要解释变量或预测变量,提升计量经济学模型的可解释性、统计推断效率以及样本外预测能力。

      第三,本书紧扣当前人工智能发展前沿,探讨了人工智能对经济学研究范式将产生的深远影响。书中详细介绍了以ChatGPT为代表的大语言模型的基础概念,以及大模型在主题建模、文本情绪、模拟预期等方面的广泛应用。目前,经济学实证研究通常采用参数较少、可解释性较强的小模型。然而,经济金融系统是一个超高维动态复杂系统,大模型为刻画这种复杂系统提供新的可能性,但其具体应用研究目前仍处于探索阶段。本书广泛介绍了大模型在经济学与金融学中的应用,也对大模型的优势和局限性进行了探讨,为当下推动人工智能与经济学研究融合奠定了坚实的方法论基础,并提供了技术支撑。

      经济学的研究范式和研究方法并非一成不变,而是随时代变迁不断演进。在数字经济时代,经济金融文本数据为经济学的研究范式和研究方法带来诸多机遇与挑战。本书致力于推动大数据特别是经济金融文本数据分析的方法创新与应用,全面、系统地阐述了文本分析的基本概念、常用方法及其实践应用,通过具体应用案例实现理论与实践有机结合。希望本书能够为经济金融领域的研究者、从业者及广大读者提供有价值的参考与启发。

 

作者简介