文件名称:RU-Crime-Alerts:将 RUPD 犯罪警报抓取为 JSON
文件大小:3KB
文件格式:ZIP
更新时间:2024-06-18 09:12:51
Python
罗格斯犯罪警报 API 一个非常粗略的 API,它抓取了,用正则表达式去除了 HTML 和官僚样板,将 json 数组保存到文件中。 使用正则表达式提取时间和位置。 去做 由于这些警报的结构是如此重复,因此从它们中提取结构化数据应该很容易。 我想可能需要一定程度的 NLP 并且不是绝对必要的。 值得注意的是:犯罪,肇事者描述。 位置提取目前无法捕获像Mason and Pine Streets或on Robinson Street between Hamilton Street and Central Avenue Robinson Street, Hamilton Street分别只报告Pine Street或Robinson Street, Hamilton Street 。 还需要加载本地数据库并与新请求合并,而不是在 RUPD 取消旧警报的情况下进行破坏。 Python要
【文件预览】:
RU-Crime-Alerts-master
----ugly_parser.py(2KB)
----crime.html(2KB)
----json_assembler.py(593B)
----README.md(966B)
----.gitignore(17B)