tinker:文件和目录管理系统

时间:2024-06-13 09:47:33
【文件属性】:

文件名称:tinker:文件和目录管理系统

文件大小:85KB

文件格式:ZIP

更新时间:2024-06-13 09:47:33

Scala

修补匠 Tinker是默认情况下的并行文件/多文件/数据管理系统,具有与NLP和ML库的附加接口。 Tinker现在使用Scala令人敬畏的Stackable Trait Pattern,并与强大的Akka Stream紧密集成,以处理任务并行化和流水线操作。 它使您可以轻松读取多个格式化文件并进行合并/处理,并并行化常规文件操作(其中一些与NLP相关),例如过滤,标记化,压缩/聚合行等。 主要用法 将极端文件从一种格式转换为另一种格式,类似于Canova( ),但Tinker的性能要快得多(由于使用了默认的并行处理),并且更容易(我们不依赖外部标记语言来定义数据结构)。 选区解析:使用Stanford选区解析器( ) Tregex匹配:使用特定的类似于regex的语言搜索斯坦福选区树( ) 将来的分类:对于心理语言学研究人员,他们可能想查看这篇论文( )。 设计哲学 我们


【文件预览】:
tinker-master
----project()
--------build.properties(20B)
--------plugins.sbt(22B)
----src()
--------test()
--------main()
----build.sbt(2KB)
----README.md(11KB)
----dist()
--------tinker.bat(17B)
----.gitignore(405B)

网友评论