文件名称:spark-nlp:最先进的自然语言处理
文件大小:137.81MB
文件格式:ZIP
更新时间:2024-02-24 09:01:49
nlp natural-language-processing spark sentiment-analysis tensorflow
Spark NLP:最先进的自然语言处理 Spark NLP是建立在Apache Spark ML之上的自然语言处理库。 它为机器学习管道提供了简单,高性能和准确的NLP注释,这些注释在分布式环境中易于扩展。 Spark NLP带有1100多种预训练的管道和模型,支持192多种语言。 它支持可在集群中无缝使用的最新转换器,例如BERT , XLNet , ELMO , ALBERT和Universal Sentence编码器。 它还提供令牌化,分词,词性标记,命名实体识别,依赖性分析,拼写检查,多类文本分类,多类情感分析,机器翻译(+180种语言),摘要和问题解答( Google T5)和更多。 项目网站 查看我们的官方Spark NLP页面: : 以获取用户文档和示例 社区支持 与Spark NLP社区和团队进行实时讨论 Bug报告,功能请求和贡献 与其他社区成员互动,分享想法,并展示您如何使用Spark NLP! Spark NLP文章 Spark NLP视频教程 目录 产品特点 代币化 可训练的分词 停止单词删除 令牌规范化器 文件规范化器 干mm 脱胶机 NGram