文件名称:project-matt:马特计划
文件大小:849KB
文件格式:ZIP
更新时间:2024-06-06 03:07:08
redis elasticsearch machine-learning scala aws-s3
项目Matt:AWS S3 PII扫描仪 创建该项目是为了帮助您扫描AWS S3存储桶中的PII数据。 该应用程序利用了AWS服务的规模和成本,确保您只为使用的商品付费。 部署后,它将扫描您的AWS S3存储桶(您也可以设置前缀以将扫描限制为特定路径),并自动检测文件类型并使用正则表达式提取可能的PII。 扫描摘要已加载到您的Elasticsearch群集中,您可以使用该群集创建Kibana仪表板来报告DLP暴露。 分类器 正则表达式:当前,该应用程序检测到一些关键的欧洲个人数据正则表达式模式。 但是,您可以派生项目并添加更多正则表达式。 您可以在阅读更多关于可用分类器的。 关键字匹配:目前正在开发中。 尚未发布。 这是因为在此主题上需要大量的领域专业知识。 卷积神经网络:这是一个积极的开发,将在下一个主要更新中发布。 该项目将使用CNN来检测扫描文件中的敏感词或PII词。 支持