【文件属性】:
文件名称:dmoz_csv:将 DMOZ content.rdf.u8.gz 转换为 CSV 文件的简单脚本
文件大小:4KB
文件格式:ZIP
更新时间:2021-06-07 20:14:48
Python
dmoz_csv
将 DMOZ content.rdf.u8.gz 转换为 CSV 文件的 Python 脚本。 它还包括从中生成的输出 CSV 文件。
文件的结构是
“网址”、“类别 1”、“类别 2”、…………
例子:
在
DMOZ 类别(第 1-4 个,共 4 个) 业务:食品及相关产品:饮料:咖啡 (1) 区域:欧洲:意大利:区域:弗留利-威尼斯朱利亚:地区:的里雅斯特:商业和经济 (1) 世界:意大利:Affari :食品及相关产品:饮料:咖啡 (1) 世界:意大利:区域:欧洲:意大利:弗留利-威尼斯朱利亚:的里雅斯特省:地区:的里雅斯特:商业和经济 (1)
它的相应行将生成为:
" ”
【文件预览】:
dmoz_csv-master
----.pydevproject(423B)
----.project(362B)
----url_classifier.py(4KB)
----README.md(1KB)
----dmoz_fileparser.py(3KB)