文件名称:Financial-data-collection-from-web--master
文件大小:35.73MB
文件格式:ZIP
更新时间:2023-11-23 17:38:07
年报自动获取
利用Python爬取巨潮网页上的年报等数据,通过解析下载的PDF文件,提取其中有用的数据,并写入到本地文件中。
【文件预览】:
Financial-data-collection-from-web--master
----download_files()
--------000004国农科技2015年年度报告.(2178k).PDF(2.13MB)
--------000002万科A2012年年度报告.(1848k).PDF(1.8MB)
--------000005世纪星源2012年年度报告(更新后).(2265k).PDF(2.21MB)
--------000002万科A2014年年度报告.(1613k).PDF(1.57MB)
--------000004国农科技2014年年度报告(更新后).(2091k).PDF(2.04MB)
--------000005世纪星源2013年年度报告.(2338k).PDF(2.28MB)
--------000002万科A2015年年度报告(更新后).(5100k).PDF(4.98MB)
--------000004国农科技2016年年度报告(更新后).(2233k).PDF(2.18MB)
--------000002万科A2015年年度报告.(5100k).PDF(4.98MB)
--------000004国农科技2013年年度报告.(3358k).PDF(3.28MB)
--------000002万科A2013年年度报告.(5883k).PDF(5.75MB)
--------000002万科A2016年年度报告.(7094k).PDF(6.93MB)
--------000004国农科技2012年年度报告.(4763k).PDF(4.65MB)
----process_all.py(794B)
----original_data()
--------Audit Independence 1.xlsx(178KB)
--------hello.pdf(44KB)
--------全新好:深达声A2004年年度报告.PDF(250KB)
--------深康佳A:深康佳A2003年年度报告.PDF(343KB)
--------东阿阿胶:2017年年度报告(更新后).PDF(3.49MB)
--------深赤湾A:深赤湾A2003年年度报告.PDF(2.48MB)
--------沙河股份:沙河股份2003年年度报告.PDF(281KB)
----parase_data_pdfplumber_wyk.py(4KB)
----download_filesFromcsv_wyk.py(2KB)
----del_test.py(408B)
----read_csv_stockids_wyk.py(2KB)
----get_tableData_pdfplumber_example2.py(1KB)
----singal_parase_data_from_download.py(13KB)
----parase_data_pdfminer_example.py(2KB)
----get_url_example.py(6KB)
----readme_wyk.txt(260B)
----get_urlOfpdf_wyk.py(7KB)
----parase_data_from_download.py(14KB)
----README.md(5KB)
----get_tableData_pdfplumber_example.py(3KB)
----multi_thread_pro.py(16KB)
----output_files()
--------part_data_wyk.csv(1KB)
--------2018年度报告_20130101-20180101.csv(720KB)