文件名称:大规模分析文本信息-研究论文
文件大小:663KB
文件格式:PDF
更新时间:2024-06-29 08:38:32
Big Data Machine
我们概述了社会科学文本分析的最新进展。 基于计数的经济模型、结构化统计工具和普通机器学习设备各有优缺点。 为了采用数据驱动的方法来捕获复杂的语言结构,同时确保计算可扩展性和经济可解释性,需要一个用于分析大规模文本数据的通用框架。 我们讨论了最近结合神经网络语言模型(如词嵌入)和生成统计建模(如主题建模)的优势的尝试。 我们还描述了典型的文本来源、这些方法论在金融和经济问题上的应用,以及有希望的未来方向。