文件名称:创意内容总结-研究论文
文件大小:2.05MB
文件格式:PDF
更新时间:2024-06-29 12:33:28
Bayesian Estimation Innovations
我们研究并模拟人类总结创意文档的过程(例如,从电影剧本到概要)。 我们开发了一个基于泊松分解的定制主题模型,并受到创造性文献的启发,将摘要中的文本链接到原始文档中的文本。 传统的泊松分解将文档近似为主题的正组合,即作为由一组主题定义的锥体中的点(在由词汇表中的单词定义的欧几里德空间中)。 这里提出的模型不仅捕获了文档的“锥内”部分,还捕获了未通过共同主题组合解释的“锥外”部分。 与完整文档相比,该模型捕获了如何在摘要中权衡这两种类型的内容。 此外,与完整文档相比,它捕获了影响每个主题在摘要中出现的程度的写作规范。 我们将此模型应用于营销学术论文及其摘要的数据集,以及电影剧本及其概要的数据集。 我们通过创建一个公共的在线交互式工具来说明我们研究的实际应用,该工具旨在为有兴趣编写创意文档摘要的用户提供“共鸣板”。