jieba-slidingw:中文滑动窗口改进了jieba标签提取

时间:2024-07-08 10:02:24
【文件属性】:

文件名称:jieba-slidingw:中文滑动窗口改进了jieba标签提取

文件大小:12.14MB

文件格式:ZIP

更新时间:2024-07-08 10:02:24

Python

Jieba with sliding windows 本程式主要base on . "结巴"中文分词:做最好的Python 中文分词组件"Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best Python Chinese word segmentation module. About sliding windows 在tags extraction 的funcation 新增一个funcation -> extract_tags_custom程式位置:[./jieba/analyse/ init .py] sliding windows 例子(以下这三段字的文章):我们都是轮班星人每天都在快乐爆肝的轮班星人轮班星人的酸甜苦辣在正常的断字下:轮班& 星人会被抓成不同的tag透过s


网友评论