文件名称:enron-spam-detection
文件大小:15.36MB
文件格式:ZIP
更新时间:2024-06-14 07:58:15
DIGITALCommandLanguage
输出 pdf_document 从安然电子邮件和财务数据中识别欺诈 介绍 在2000年,安然(Enron)是美国最大的公司之一。 到2002年,由于广泛的公司欺诈行为,该公司破产了。 在最终的联邦调查中,有大量通常是机密信息输入公共记录,包括成千上万封电子邮件和给高管的详细财务数据。 利用“机器学习课堂”中教授的分类器和技术,我建立了一个分类器来检测一个人是否应受惩罚。 简短问题 为我们总结该项目的目标以及机器学习在完成该项目中的作用。 作为答案的一部分,请提供有关数据集的背景知识以及如何将其用于回答项目问题。 当您获得数据时,数据中是否存在异常值,您如何处理这些异常值? 数据中的功能分为三种主要类型,即财务功能,电子邮件功能和POI标签。 财务特征:工资,延期付款,总付款,借贷预付款,奖金,受限股票递延,递延收入,总计股票价值,费用,已行使的股票期权,其他,长期激励,受限股票,di