search-rattailcollagen1:GitHub Classroom创建的search-rattailcollagen1

时间:2024-06-16 10:48:22
【文件属性】:

文件名称:search-rattailcollagen1:GitHub Classroom创建的search-rattailcollagen1

文件大小:561KB

文件格式:ZIP

更新时间:2024-06-16 10:48:22

Python

ScienceSearcher 系统介绍 | | 一款支持增量式数据更新的科技论文检索系统 系统说明 系统特性 一行代码即可完成服务端部署 一行代码即可完成客户端安装 简易的客户端接口使用 系统增量式动态更新 可同时与多个爬虫模块实现交互 检索系统快速恢复 检索系统支持多视频内容同时搜索定位 PDF多线程并发解析 PDF和视频文件采用“线下处理+线上取用”方案,复用数据解析结果,利于系统的快速响应 系统架构 整体架构 本系统的整体架构如下图所示: 接口约定情况 在接口约定方面,我们以数据流的形式为基础,通过json的格式实现了接口约定: 组内接口约定 : 该文件定义了数据在elasticsearch内索引中的存储结构 组间接口约定 : 该文件定义了从爬虫模块MongoDB server中取出来的数据结构 : 该文件定义了展示模块发出请求的数据类型 : 该文件定义了向展示模块反馈的数据类型


【文件预览】:
search-rattailcollagen1-master
----ScienceSearcher()
--------VideoProcessor.py(11KB)
--------ESClient.py(11KB)
--------DataProcess.py(7KB)
--------DownloadClient.py(4KB)
--------DownloadServer.py(3KB)
--------SearchEngine.py(4KB)
--------__init__.py(0B)
--------grobid_client()
--------DatabaseAccess.py(6KB)
--------data()
--------PDFProcessor.py(4KB)
----images()
--------architecture.png(114KB)
--------logo.png(405KB)
----main.py(7KB)
----run.py(11KB)
----requirements.txt(166B)
----LICENSE(1KB)
----config.json(294B)
----setup.py(617B)
----README.md(16KB)
----about.md(9KB)
----.gitignore(570B)
----example.py(617B)

网友评论