文件名称:crawl-google-results:使用 Java 库 Jsoup 的 Google 搜索结果
文件大小:4.43MB
文件格式:ZIP
更新时间:2024-07-22 07:20:31
Java
使用 Jsoup-Java 库的 Google 搜索爬虫 该程序使用了库,它可以抓取和解析 HTML。 它为您提供以下内容: 标题 地点 简短摘要 脚步: 克隆这个 repo。 在构建路径中添加 jar。 在源文件中,将“自然语言处理”替换为您的搜索查询,将“10”替换为您想要的结果数。 运行程序。 样本输出 标题 : 斯坦福 NLP(自然语言处理)小组网站:nlp.stanford.edu/ 摘要:斯坦福自然语言处理和计算语言学组。 标题 : 自然语言处理 - Google 研究网站:research.google.com/pubs/NaturalLanguageProcessing.html 摘要:大多数 NLP 应用程序,如信息提取、机器翻译、情感分析和问答,都需要.... 2014 年自然语言处理经验方法会议 (EMNLP '14) 的论文集。 标题:自然语言处理博客