典型相关分析matlab实现代码-HanLP:中文处理

时间:2024-06-09 06:22:25
【文件属性】:

文件名称:典型相关分析matlab实现代码-HanLP:中文处理

文件大小:21.52MB

文件格式:ZIP

更新时间:2024-06-09 06:22:25

系统开源

典型相关分析matlab实现代码 HanLP: Han Language Processing DemoAtFirstSight是基本例子,DemoTrainCWS是训练的感知机模型 汉语言处理包 HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍已经出版。目前,基于深度学习的正处于alpha测试阶段,未来将实现知识图谱、问答系统、自动摘要、文本语义相似度、指代消解、三元组抽取、实体链接等功能。 HanLP提供下列功能: 中文分词 HMM-Bigram(速度与精度最佳平衡;一百兆内存) 、 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 、 词典分词(侧重速度,每秒数千万字符;省内存) 所有分词器都支持: 词性标注 (速度快) 、(精度高) 命名实体识别 基于HMM角色标注的命名实体识别 (速度快) 、、、、 基于线性模型的命名实体识别(精度高) 、 关键词提取 自动摘要 短语提取 多音字、声母、韵母、声调 简繁分歧词


网友评论