tiny_search_engine

时间:2024-03-02 11:31:32
【文件属性】:

文件名称:tiny_search_engine

文件大小:8.12MB

文件格式:ZIP

更新时间:2024-03-02 11:31:32

C++

去做 log_util完善 [-] xgboost_manager 标题多样性 特征计算部分并行化改造 多种族召回 [-]机器学习在搜索中的应用介绍 深度学习在搜索中的应用介绍 这是什么? 一个简单的搜索引擎。优化排序算法,通过NDCG评估排序效果。 主要主要关注搜索排序,不涉及其他部分,如爬虫,建库,前端展现等 主要实现检索功能,架构设计较简单,不涉及分布式,多线程等 为简单起见,除( jiebacpp )[]外,基本不依赖其他第三方库,以此的目的是聚焦于搜索引擎本身,够用即可,不必被其他复杂的功能束缚住。实际应用中,需要使用成熟的组件,如boost , glog , gflags , gtest , protobuf , RapidJson等 整理了常见的停用词词表,包括中文,英文,标点符号,在dict/stopword.chinese , dict/stopword.englis


网友评论