TextAnalyze:该存储库保存使用Java和Spark框架构建的API的代码库,以处理文本

时间:2024-06-01 07:48:10
【文件属性】:

文件名称:TextAnalyze:该存储库保存使用Java和Spark框架构建的API的代码库,以处理文本

文件大小:31KB

文件格式:ZIP

更新时间:2024-06-01 07:48:10

Java

文字分析 概述 该API是使用Spark Framework和Maven构建的。 我过去曾经使用过SpringBoot,但是想尝试一下新的东西。 我能够实现5个端点中的3个。 平均长度,最常见的单词和中位单词。 假设条件 如分配说明中所述,每个端点都希望有一个包含一个标签“文本”的JSON正文。 如果未在JSON主体中提供此标记,或者提供了格式错误的JSON语法作为输入,则端点将返回,但带有错误消息。 单词定义:有效的单词包含字符az,也可以包含破折号(-)或撇号(')。 我允许使用这些字符,因为“无糖”和“不”等字词是有效的。 在“无糖”和“不”之类的单词中,我在单词的长度中包括特殊字符('或-)。 我考虑使用外部字典API来确定单词是否有效,因为我不想对用户的语言做任何假设。 如果该库专用于英语,则添加此功能将轻松过滤掉无效单词。 目前,像“ asdfjkl”这样的胡言乱语会通过,因


【文件预览】:
TextAnalyze-master
----src()
--------main()
----target()
--------dependency-reduced-pom.xml(1017B)
--------maven-status()
--------classes()
--------maven-archiver()
----text-analyze.iml(3KB)
----.idea()
--------libraries()
--------misc.xml(443B)
--------compiler.xml(634B)
--------workspace.xml(11KB)
--------.name(12B)
--------modules.xml(264B)
--------vcs.xml(180B)
----textanalyze.iml(80B)
----README.md(6KB)
----pom.xml(2KB)
----.gitignore(278B)

网友评论