文件名称:重点概念矿工(FCM):可解释的深度学习,用于文本探索-研究论文
文件大小:5.25MB
文件格式:PDF
更新时间:2024-06-08 23:49:00
Interpretable Machine Learning Deep Learning
我们引入了焦点概念挖掘器(FCM),这是一种可解释的深度学习文本挖掘算法,用于(1)从文本数据中自动提取一致的语料库级别的概念,(2)关注概念的发现,以便它们与用户高度相关。指定的结果,以及(3)量化概念对结果的重要性。 FCM用于探索和潜在地从可能解释业务成果的文本中提取先验未知概念。 FCM是一个自定义的神经网络模型,已明确配置为无需提供任何训练数据即可增加语料库级别的见解和恢复的概念多样性。 我们使用包含每个消费者阅读的评论的在线购买数据集来评估FCM。 与4个可解释的基准相比,FCM获得了更高的可解释性(由2个人工判断的度量标准和1个自动度量标准量化),并且在多个实验的支持下,对独特概念的调用率更高。 另外,FCM提取了与产品质量有关的构建体,这些构建体在理论上影响了文献中的转化,而没有经过明确的培训。 与4个可解释的基准相比,FCM还实现了卓越的预测性能,而与8个黑盒分类器相比,FCM则保持了出色或具有竞争性的预测性能。 在进一步的实验中,我们根据在线新闻组和众筹平台上的文本数据评估FCM,研究关注概念发现的影响,并研究可解释性-准确性的权衡。 在应用标准因果推断技术之前,我们将FCM作为一种补充技术来探索和理解文本数据。 最后,我们讨论管理的含义,潜在的业务应用,局限性和未来发展的想法。