文件名称:word2vec:Word2vec的火炬实现和情感分析
文件大小:27.89MB
文件格式:ZIP
更新时间:2024-05-24 07:02:21
Lua
火炬的实现word2vec和情感分析,如assignment1.pdf中所述。 负采样丢失函数和最大余量学习用于word2vec。 在Terminal.app中,运行python extract_datasets_for_torch.py来为sentiment_analysis.lua生成数据集。 运行th filter_sentences.lua生成单词词汇,然后使用该词汇将句子写到文件中 运行th word2vec.lua训练word2vec模型。 您不需要复杂的多层网络即可在此处生成嵌入。 我们的任务是简单地基于同现来分离单词嵌入。 如果在这里有文档,我们将需要一个复杂的系统(例如,用于文档的convnet)来生成嵌入,因为没有明显的方法可以在一个简单的嵌入中组合多个文档。 在这里,我们仅具有单词的词汇表,并将嵌入映射到每个单词。 您可以自己尝试:在网络中添加几层,并使用最后一层
【文件预览】:
word2vec-master
----vocabulary_raw(273KB)
----trainSentences(892KB)
----te1.lua(141B)
----inv_vocabulary_raw(273KB)
----softmax1.lua(1KB)
----.gitignore(194B)
----README.md(6KB)
----sentiment_labels.txt(3.11MB)
----datasetSentences.txt(1.23MB)
----linear1.lua(1KB)
----gen_sentiment_files_dictionary.lua(2KB)
----replicate_check.lua(119B)
----devSentences(116KB)
----margincriterion_check.lua(944B)
----y_dev(2KB)
----softmax_check.lua(405B)
----filter_sentences_check.lua(113B)
----X_dev(81KB)
----trainSentences_raw(865KB)
----gmodule_check1.lua(658B)
----original_rt_snippets(1.2MB)
----gen_sentiment_files.lua(3KB)
----Embedding.lua(1019B)
----wordvec_sentiment.ipynb(46KB)
----sentiment_labels(4.71MB)
----dictionary1(345B)
----Result_example.png(22KB)
----visualize_word_vectors.lua(1KB)
----datasetSentences(1.27MB)
----plot_check.lua(349B)
----extract_datasets_for_torch.py(815B)
----filter_sentences.lua(9KB)
----dictionary(13.38MB)
----sigmoid1.lua(0B)
----dictionary_sorted_by_index(5.44MB)
----sigmoid_test.lua(0B)
----devLabels(2KB)
----filtered_datasetSentences_indexes_en1(728B)
----trainSentences1(12KB)
----filter_sentences_output(6.14MB)
----datasetSentences1(11KB)
----linear_check.lua(493B)
----sentiment_labels1(161B)
----extract_datasets_for_torch1.py(1KB)
----original_rt_snippets.txt(1.14MB)
----gmodule_check.lua(473B)
----cs224d()
--------assignment1.pdf(44KB)
--------data_utils.pyc(7KB)
--------datasets()
--------__init__.pyc(105B)
--------__pycache__()
--------data_utils.py(7KB)
--------__init__.py(0B)
----requirements.txt(299B)
----word2vec.lua(4KB)
----trainLabels_raw(17KB)
----word2vec1.lua(4KB)
----sentiment_analysis.lua(4KB)
----devSentences_raw(112KB)
----margincritetion_check1.lua(873B)
----trainLabels(17KB)
----y_train(17KB)
----X_train(626KB)
----table_utils.lua(3KB)
----gmodule_check2.lua(1KB)
----model_utils.lua(5KB)
----trainLabels1(202B)
----sentiment_features_and_labels(10.62MB)
----dictionary.txt(11.45MB)
----word2vec2.lua(5KB)