文件名称:Scrape_PDB_data_with_Python
文件大小:289KB
文件格式:ZIP
更新时间:2024-04-20 03:05:26
Python
Scrape_PDB_data_with_Python 目的 在我的研究中,我需要通过溶剂含量,分辨率,空间组等来过滤。 网站上的搜索选项对我来说还不够好,所以我想在我的自定义条件中过滤这些结构。 阅读《 Ryan Mitchell-使用PythonO'Reilly Media进行Web爬网(2018)》一书后,这是一个很好的机会,可以利用这些知识来实现我的目标。 文件说明 scrap_pdb_improv_thread_mem.py是我使用的最终python代码。 因为有160k +数据,所以我需要逐步进行抓取,输出文件如下所示: pdb_info_0_999.xlsx , pdb_info_1000_2799.xlsx 。 为了释放笔记本电脑,我在群集上运行了代码,文件job_py.slurm用于将作业提交到群集。
【文件预览】:
Scrape_PDB_data_with_Python-main
----scrap_pdb_final2.py(5KB)
----scrap_pdb_improv_thread_mem.py(5KB)
----pypdb.py(46KB)
----job_py.slurm(306B)
----pdb_info_1000_2799.xlsx(436KB)
----scrap_pdb_improv_thread.py(5KB)
----pdb_info_0_999.xlsx(423KB)
----README.md(789B)