【文件属性】:
文件名称:dartXmlParse:Dart代码示例
文件大小:601KB
文件格式:ZIP
更新时间:2021-04-19 17:23:06
Dart
已经实施
已实现从SPDX主文件中获取许可证。
实现了对xml文件的解析,并提取了许可证名称,SPDX标识符和许可证主体。
实现了从pub获取包的压缩文件并找到其LICENSE的代码。 将用于测试和极端情况检测
根据License Classifer v2和SPDX指南,实现了规范化器类来规范许可。
删除新行和回车
带状空间
删除所有标点,引号和括号
修剪版权符号和注意事项
修剪多余的空白
替换等效词
删除评论
删除任何其他可选文本
实现了一个类,以基于定界符对提供的字符串进行标记化。
实现了对LicenseClassifier v2语料库的阅读
将要执行
Jaccard索引计算器确定可能的匹配项。 (这是通过仅匹配一组令牌并忽略顺序来完成的)
编辑距离(Levenshtein距离)计算器,以确定可能匹配的置信度。 (这样做是为了考虑非可选文本的顺序,类似于LicenseClas