文件名称:parse_wiki_text:将MediaWiki中的Wiki文本解析为元素树
文件大小:59KB
文件格式:ZIP
更新时间:2024-06-13 16:11:45
rust parser mediawiki Rust
解析维基文字 将来自Mediawiki的Wiki文本解析为元素树。 介绍 Wiki文本是一种遵循PHP格言“使所有内容尽可能不一致和混乱”的格式。 有成千上万以这种格式编写的有趣文档,这些文档以免费许可证的形式分发在使用Mediawiki软件(主要是Wikipedia和Wiktionary)的网站上。 能够解析Wiki文本并处理这些文档将使您能够获取世界知识的很大一部分。 Mediawiki软件本身将Wiki文本文档转换为过时格式HTML文档,以在浏览器中显示给人类读者。 它是通过字符串替换的来完成的,其中某些步骤取决于先前步骤的结果。 包含6200行代码, 包含2000行代码,然后有仅用于解析器选项。 更为有趣的是将Wiki文本文档解析为一种结构,计算机程序可以使用该结构来推理文档中的事实,并以不同的方式展示它们,从而使它们可用于多种应用程序。 有些人试图使用正则表达式来解析Wik
【文件预览】:
parse_wiki_text-master
----.gitignore(30B)
----Cargo.toml(304B)
----examples()
--------test()
----LICENSE(917B)
----src()
--------configuration.rs(5KB)
--------comment.rs(4KB)
--------table.rs(24KB)
--------template.rs(9KB)
--------character_entity.rs(871B)
--------html_entities.rs(7KB)
--------redirect.rs(3KB)
--------line.rs(9KB)
--------lib.rs(23KB)
--------bold_italic.rs(1KB)
--------default.rs(2KB)
--------heading.rs(3KB)
--------trie.rs(6KB)
--------case_folding_simple.rs(59KB)
--------link.rs(7KB)
--------magic_word.rs(1KB)
--------parse.rs(8KB)
--------state.rs(5KB)
--------positioned.rs(4KB)
--------warning.rs(4KB)
--------external_link.rs(2KB)
--------tag.rs(13KB)
--------list.rs(8KB)
----readme.md(9KB)