HashTagSplitter:一个Python函数,用于分解通过组合多个单词而创建的主题标签或复合单词

时间:2024-06-09 17:49:47
【文件属性】:

文件名称:HashTagSplitter:一个Python函数,用于分解通过组合多个单词而创建的主题标签或复合单词

文件大小:2KB

文件格式:ZIP

更新时间:2024-06-09 17:49:47

Python

HashTagSplitter 递归的python函数,用于分解由多个单词组合而成的主题标签或复合单词 我在自然语言处理(NLP)中使用的最大匹配算法的实现,用于将复合词或主题标签拆分为多个词。 用法示例: >>> split_hashtag_to_words_all_possibilities("edgeofentertainment") [['edge', 'of', 'entertainment']] >>> split_hashtag_to_words_all_possibilities("playtowin") [['play', 'tow', 'in'], ['play', 'to', 'win']] >>> split_hashtag_to_words_all_possibilities("datascience") [['data', 'science'], ['


【文件预览】:
HashTagSplitter-master
----.gitattributes(483B)
----split_hashtags.py(1KB)
----README.md(1KB)
----.gitignore(485B)

网友评论