文件名称:InstagramAPICrawler:使用Instagram API查找关联的主题标签
文件大小:3.26MB
文件格式:ZIP
更新时间:2024-06-08 23:11:05
Java
InstagramAPI爬虫 ============== 概括 该Java应用程序使用Instagram API搜索标签和共同出现的标签。 对于给定的标签(例如#cat ),此应用程序查找并计数同时出现的标签的数量(例如,如果#cat和#dog出现在它们被视为同时出现的同一张照片上,则该应用程序将进行查询以查找同时搜索与搜索种子一起找到的最频繁的标签。 示例: #cat是搜索种子。 #dog,#catlady,#meow是三种最常见的共同发生的标签发现#cat。 然后,应用程序将使用#dog , #catlady和#meow作为搜索种子,以查找经常与这些标签同时出现的标签。 此过程将持续一定的度数(其中#cat和#dog相距1度)。 结果被写入文件(例如instagramJSONData-catTAGS.txt )。 代码 这段代码中的主要类是src.crawler.Crawler.
【文件预览】:
InstagramAPICrawler-master
----instagramJSONData-wineholderTAGS.txt(2.67MB)
----instagramJSONData-wineTAGS.txt(2.29MB)
----src()
--------objects()
--------crawler()
--------tests()
----hs_err_pid1214.log(33KB)
----README.md(2KB)
----instagramJSONData-winerackTAGS.txt(2.73MB)
----bin()
--------objects()
--------crawler()
--------tests()