文件名称:python 数据挖掘概念、方法与实践代码
文件大小:17.43MB
文件格式:ZIP
更新时间:2021-04-10 02:31:33
文本处理
《python 数据挖掘概念、方法与实践》和开源代码,包含各个章节的代码。
【文件预览】:
masteringDM-master
----ch9()
--------boxplot.py(459B)
--------sloc.txt(3KB)
--------zscore.py(670B)
--------slocbool.txt(5KB)
--------clusters.py(828B)
----ch5()
--------sumCompounds.py(854B)
--------scoreLinusEmail.py(2KB)
--------data()
--------scoreSentences.py(714B)
----ch4()
--------basicNetworkMetrics8.py(790B)
--------basicNetworkMetrics3.py(1KB)
--------basicNetworkMetrics4.py(799B)
--------basicNetworkMetrics6.py(686B)
--------bonusWeightedGraph.py(1KB)
--------basicNetworkMetrics5.py(1KB)
--------bonusWeightedGraph.png(232KB)
--------basicNetworkMetrics.py(965B)
--------basicNetworkMetrics2.py(898B)
--------errata.md(392B)
--------basicNetworkMetrics9.py(798B)
--------basicNetworkMetrics7.py(741B)
--------data()
----ch7()
--------gensimSummarize.py(3KB)
--------errata.md(330B)
--------sampleText.txt(3KB)
--------sumySummarize.py(2KB)
--------simpleTextSummNLTK.py(5KB)
----ch6()
--------djangoIRCchat.txt(44KB)
--------lkmlEmails.txt(66KB)
--------gnueIRCsummary.txt(3KB)
--------findNEinFile.py(1KB)
--------lkmlEmailsReduced.txt(48KB)
--------apacheMeetingMinutes.txt(4KB)
----README.md(70B)
----ch8()
--------gensimTopicModel.py(2KB)
--------data()
----ch3()
--------RFRGdata.sql.gz(7.12MB)
--------book_entity_matches.sql(648B)
--------entityAttributeMetrics.py(5KB)
--------soundex.py(938B)
----ch2()
--------ws_assocPairsOnly.py(5KB)
--------assoc.py(7KB)
--------assocSpecific.py(2KB)
--------errata.md(1KB)
--------fc_createPairsTriplesTables.sql(473B)
--------fc_project_tags.sql.gz(1.4MB)