hitsz_news_serach.zip

时间:2023-09-07 06:01:39
【文件属性】:

文件名称:hitsz_news_serach.zip

文件大小:17.01MB

文件格式:ZIP

更新时间:2023-09-07 06:01:39

爬虫 搜索引擎 jieba+whoosh

搜索引擎 爬虫 python实现 scrapy+jieba+whoosh,具体看我的blog scrapy分布式爬虫+jieba+whoosh实现搜索引擎


【文件预览】:
articleexport.json
ArticleSpider
----articleexport.json(5.19MB)
----ArticleSpider()
--------spiders()
--------items.py(509B)
--------pipelines.py(3KB)
--------middlewares.py(4KB)
--------settings.py(3KB)
--------models()
--------__pycache__()
--------__init__.py(0B)
----main.py(159B)
----scrapy.cfg(269B)
----.idea()
--------.gitignore(184B)
--------workspace.xml(10KB)
--------misc.xml(199B)
--------modules.xml(285B)
--------ArticleSpider.iml(335B)
--------inspectionProfiles()
----article.json(48KB)
----try.py(0B)
.idea
----workspace.xml(4KB)
----misc.xml(304B)
----modules.xml(285B)
----school_search.iml(334B)
----inspectionProfiles()
--------Project_Default.xml(484B)
--------profiles_settings.xml(174B)
whoosh_try.py
tmp
----MAIN_x8boacqad7qom1ur.seg(19.37MB)
----_MAIN_6.toc(2KB)
----MAIN_WRITELOCK(0B)
hitsz_news_serach
----.git()
--------HEAD(23B)
--------objects()
--------description(73B)
--------config(314B)
--------info()
--------hooks()
--------refs()

网友评论