新闻语料的标记与分词——自然语言处理

时间:2012-11-30 10:29:50
【文件属性】:
文件名称:新闻语料的标记与分词——自然语言处理
文件大小:2.57MB
文件格式:RAR
更新时间:2012-11-30 10:29:50
C++ 语料处理 该函数通过标记的机构名,人名,地名,然后来辨别大陆,港澳台,西方,日本,韩国的国籍
【文件预览】:
BasedMaxentNOR
----BasedMaxentNOR.sln(907B)
----BasedMaxentNOR.ncb(627KB)
----BasedMaxentNOR()
--------resource.h(393B)
--------ChineseName.txt(57KB)
--------stdafx.h(276B)
--------*Name.txt(5KB)
--------BasedMaxentNOR.vcproj.SUDA-A5D09C672C.fanglu.user(1KB)
--------BasedMaxentNOR.cpp(1KB)
--------BasedContextNOR.h(633B)
--------BasedMaxentNOR.rc(1KB)
--------BasedMaxentNOR.vcproj.WWW-06EA771B265.Administrator.user(1KB)
--------SourceNameDealwith.cpp(6KB)
--------Predict.class(3KB)
--------BasedMaxentNOR.vcproj.WWW-0BC2E5158E3.Administrator.user(1KB)
--------BasedMaxentNOR.aps(17KB)
--------KoreaName.txt(848B)
--------BasedMaxentNOR.vcproj.BFB6F043579349F.Administrator.user(1KB)
--------JavaProgram()
--------model.txt(16B)
--------BasedMaxentNOR.vcproj.WWW-213E5BD59B9.Administrator.user(1KB)
--------PredictArea.class(4KB)
--------Debug()
--------stdafx.cpp(219B)
--------ReadMe.txt(992B)
--------BasedMaxentNOR.vcproj(5KB)
--------JapaneseName.txt(2KB)
--------BasedContextNOR.cpp(10KB)
--------ChineseArea.txt(16KB)
--------CreatModelArea.class(2KB)
--------BasedMaxentNOR.vcproj.WWW-6B745A85671.Administrator.user(1KB)
--------KoreaArea.txt(7KB)
--------EnglishArea.txt(11KB)
--------data()
--------SourceNameDealwith.h(842B)
--------HMTArea.txt(3KB)
--------PlaceRecognition.cpp(28KB)
--------JapaneseArea.txt(1KB)
--------CreateModel.class(2KB)
--------PlaceRecognition.h(3KB)
--------EnglishName.txt(7KB)
----debug()
--------BasedMaxentNOR.ilk(828KB)
--------BasedMaxentNOR.pdb(1.27MB)
--------BasedMaxentNOR.exe(236KB)
----BasedMaxentNOR.suo(80KB)

网友评论