文件名称:lagasafn-xml:用于将发布冰岛法律HTML转换为机器可读XML的工具
文件大小:15.48MB
文件格式:ZIP
更新时间:2024-05-21 15:57:52
HTML
Lagasafn XML 用于将发布了冰岛法律HTML转换为机器可读XML的工具。 关于 冰岛法律目前以PDF和HTML格式发布,而这两种方法都不容易或以编程方式方便地进行管理。 该工具解析HTML版本的冰岛法律,并生成有序的XML文件,然后可以将其以编程方式使用。 示例(冰岛宪法): 格式 网址 HTML PDF格式 XML格式 可以在的zip文件中以HTML格式下载整个法律。 版本以国会编号表示,编号越高表示版本越新。 例如,版本号“ 148c”表示“第148届议会”,字母“ a”表示这是该议会召集时有效的法律食典的版本。 它是在Ubuntu上开发和测试的,但是可以在运行Python 3的任何设备上运行。这些说明假定使用基于Unix的操作系统。 跑步 该脚本在命令行中运行。 按照Pythonic的传统,所需的Python软件包会在一个名为requirements.txt