文件名称:Euclid:欧几里得文本的基本统计和解析
文件大小:108KB
文件格式:ZIP
更新时间:2024-07-27 06:56:50
OpenEdgeABL
数学 163 项目 机器学习和数据科学是 CS 的两个快速发展的子领域,它们使用算法来理解大量数据、发现隐藏模式并预测未来事件。 在 Project Euclid 中,我们迈出了使用数据科学工具分析古希腊数学的第一步。 这个项目的贡献有两个方面。 首先,我们开发了一个 Web 解析器来自动抓取欧几里德元素并将命题和定义存储在矩阵/对象中,从而使分析文本和证明定义网络变得更加容易,并为其他学生(可能在本课程的未来产品中)节省大量数据处理开销。 其次,我们通过简单的统计、KMeans 聚类和奇异值分解来分析这些命题,并提供有关潜在模式和结构的一些想法。 这个项目在 github.com/anshulsamar/euclid 上发布,在 MIT 许可下,是为斯坦福大学的 Math 163:希腊数学发明而构建的。 开发是在 python 中使用 numpy、scipy 和 beautifulsou
【文件预览】:
Euclid-master
----matrix.p(3.12MB)
----LICENSE(1KB)
----euclid.py(14KB)
----README.md(1KB)
----collection.p(502KB)
----concept.py(301B)
----link.py(144B)
----results.txt(97KB)