文件名称:KNN:kNN((k-nearest neighbors algorithm),此专案以ETtoday新闻进行kNN范例之实作
文件大小:605KB
文件格式:ZIP
更新时间:2024-05-30 18:06:58
news tf-idf cosine-similarity knn Python
kNN(k-nearest neighbors algorithm) 此专案以新闻分类进行kNN范例之实作 kNN Introduction: 最近鄰居法(KNN演算法,又譯K-近鄰演算法)是一種用於分類和回歸的無母數統計方法,KNN常用來做資料分類。 KNN是一種監督式學習(Supervised Learning),監督式學習需透過資料訓練出一個model,但KNN沒有做training的動作。 K為使用者自己定義的常數,KNN就是選擇離自己最近的K的鄰居(Data),之後觀察哪一種類別(Tag)的鄰居最多就將自己也當成該類別。 Input: 测试文章: 1.使用ETtoday新聞作為訓練集分類。 2.使用Jieba作為分詞,取出Top 100 Words 作為每篇文章的關鍵詞。 3.取出k=3個最近鄰居作為分類依據,此外對最近的第一個鄰居作為加權*2 Output:
【文件预览】:
KNN-master
----1.jpg(118KB)
----kNN.py(6KB)
----README.md(1KB)
----data()
--------ettoday.news.json(1.03MB)