文件名称:sciml:这包含了蔚蓝python流数据实验中使用的所有代码
文件大小:31KB
文件格式:ZIP
更新时间:2024-05-22 18:11:14
Python
科学 其中包含用于和的博客中描述的蔚蓝python流数据实验中使用的所有代码。 该代码已被重写为没有所有天蓝色的依赖关系,除了使用Azure Tables作为来自表Web服务的最终存储之外。 当然可以重写它以使用另一个数据库。 ##数据 有四种类型 arxiv配置文件。 它们采取config_name.json的形式,其中名称可以是all4(顶层),bio(arxiv q-bio对象),compsci(计算机科学),数学,phy(物理),金融(财务)。 机器学习模型文件(由doc_analysis_final.py生成,如下所述) 来自溪流的原始daa。 其中有三个。 sciml_data_arxiv是arxiv的原始数据集。 sciml_data_arxiv_new_9_28_15是训练中未使用的arxiv数据的最新快照,其中一部分用于训练集。 sciml_data_scimags
【文件预览】:
sciml-master
----.gitignore(3KB)
----classifier()
--------Dockerfile(305B)
--------classifier.py(22KB)
----main_classifier.py(22KB)
----run_sciml_services.ipynb(10KB)
----README.md(5KB)
----doc_analysis_final.py(16KB)
----predictor8big.py(18KB)
----scimlservice()
--------scimlservice.py(7KB)
--------Dockerfile(310B)