文件名称:TASC-FeatureExtraction:介绍如何从推文中提取功能
文件大小:529KB
文件格式:ZIP
更新时间:2024-06-14 13:19:58
Python
TASC-FeatureExtraction TASC-FeatureExtraction repository包含针对社会媒体数据集抽取特征的过程 代码包含了两部分,其中一部分描述了从社会媒体数据中提取文本特征以及非文本特征的基本流程,第二部分描述了针对开放社会媒体数据处理的具体处理流程。 目录结构及文件介绍 feature extraction for weka version Dictionary 1)主要包含了两个公共情感词库:hownet和wordnet 2)由PMI-IR计算共现次数,得到的hownetPMI值和wordnetPMI 3)合并两个PMI文件,得到情感词的WORDPMI 4)选择得到公共情感词的PMI文件 由于公共情感词基本不变,所以该目录的结构和文件也无需修改。 hownet hownetPMI wordnet wordnetPMI publicwordPMI
【文件预览】:
TASC-FeatureExtraction-master
----publicword(58KB)
----Input()
--------all_asc_tweets_label.txt.sample(42KB)
--------topicwordPMI(94KB)
--------all_asc_tweets.txt.sample(40KB)
----DivideData()
--------divide.py(5KB)
--------__init__.py(47B)
----ProcessingData()
--------__init__.py(47B)
--------PreprocessandgetFrequency.py(5KB)
----RelationProcess()
--------__init__.py(47B)
--------relationsentiment.py(2KB)
----FilterData()
--------filterData.py(2KB)
----LICENSE(11KB)
----README.md(8KB)
----Dictionary()
--------mergeWordnetandhownet.py(2KB)
--------publicword(58KB)
--------公共情感词权重排序.xlsx(173KB)
--------publicwordPMI(103KB)
--------wordnet(14KB)
--------hownet(53KB)
--------wordnetPMI(26KB)
--------__init__.py(703B)
--------WORDPMI(194KB)
--------publicword.sample(13B)
--------hownetPMI(93KB)
----publicwordFreq(3KB)
----SentimentDiffusion()
--------__init__.py(47B)
--------checkpostrelation.py(5KB)
----FeatureProcess()
--------MergeToGetFM.py(9KB)
--------gettopicwordPMI.py(3KB)
--------getRelationAtt.py(3KB)
--------__init__.py(47B)
----StatisticData()
--------checkhyperlinkgraph.py(6KB)
--------check@relationsentiment.py(10KB)
--------__init__.py(47B)
--------allusersametweetvar.py(5KB)
--------getEachAuthorSentiment.py(2KB)