golf:基于样本的正则表达式学习器

时间:2021-06-18 00:47:16
【文件属性】:
文件名称:golf:基于样本的正则表达式学习器
文件大小:6KB
文件格式:ZIP
更新时间:2021-06-18 00:47:16
Scala 高尔夫球 该项目旨在从作为输入提供的已知样本集生成正则表达式。 这并不是正则表达式高尔夫问题所期望的。 对于不熟悉的人,regex Golf 希望用户提出一个与允许列表中的一组单词相匹配的正则表达式,而不应该与不允许列表中的一组单词相匹配。 而且,有一些有趣的尝试来看看计算机是否有可能解决这个问题。 回到我们的问题,为已知的样本集生成“最优(更短/高效)”正则表达式是一个有趣的研究领域,并且已经有大量的学术工作投入其中。 从基因测序到实体识别再到其他工作流,都有很强的用例。 通常,像这样的系统的目标是帮助进行数据分析并减少创建正则表达式(作为规则)以帮助构建更大的学习系统可能需要的手动工作量。 攻击计划 预计第一个版本会产生朴素的正则表达式,这些正则表达式是有限的并且特定于算法看到的输入。 因此,如果我们想将其概括为各种模式,则消费者有责任提供涵盖各种模式的系统输入。 将使用 * 或
【文件预览】:
golf-master
----.gitignore(25B)
----src()
--------main()
--------test()
----pom.xml(7KB)
----README.md(2KB)

网友评论