classify-inspiration

时间:2021-06-15 06:47:05
【文件属性】:
文件名称:classify-inspiration
文件大小:26KB
文件格式:ZIP
更新时间:2021-06-15 06:47:05
Java 分类灵感 用于完成波莫纳学院的高级练习。 提取包含引文的推文,以供以后处理和在分类任务中使用。 hash_quote-- #quotes, -filter:links, 1/3/15 hash_overheard -- #overheard, -filter:links 摆脱转发: egrep -v '@|(\s|^|[.:,!?#";| /]) (\s|$|[.:!/?,";| ])' hash_quote > quote.noRT 修复引号: sed 's/[“”❝¨]/"/g' quote.noRT > quote.noRT.1 sed "s/['']/'/g" quote.noRT.1 > quote.noRT .2 从推文中提取引文。 提取报价.py Uniq & Sort: LC_ALL=C sort -u --ignore-case quote.noRT.e >
【文件预览】:
classify-inspiration-master
----WriteDictionary.java(10KB)
----mt_consolidate.py(830B)
----search.py(2KB)
----write_labels.py(3KB)
----unique_containment.py(955B)
----MakePOS.java(3KB)
----get_best.py(2KB)
----extract_overheard.py(4KB)
----calc_amb.py(2KB)
----StoplistPercentExperimenter.java(3KB)
----extract_results.py(2KB)
----clean_quotes.py(3KB)
----MultiClassify.java(3KB)
----BestWords.java(5KB)
----extract_quote.py(3KB)
----FeatureSelector.java(12KB)
----.gitignore(169B)
----accuracy.py(1KB)
----uniquify.py(624B)
----ExperimentStoplist.java(3KB)
----README.md(2KB)

网友评论