操作步骤-tinyxml指南[中文]

时间:2024-07-04 16:39:34
【文件属性】:

文件名称:操作步骤-tinyxml指南[中文]

文件大小:6.46MB

文件格式:PDF

更新时间:2024-07-04 16:39:34

RapidMiner

13.5 获取数据 本章使用生物医学期刊网站进行演练: http://www.ncbi.nlm.nih.gov/pubmed/ 13.6 操作步骤 第一步:检索地址 登录该网站后,在检索栏输入“dkk1”检索蛋白质信息,将地址 http://www.ncbi.nlm.nih.gov/pubmed/?term=dkk1 复制后,调用“Get Page”操作符,该操作符通过输入地址,向网络发送请求,将网页上所 包含的文本信息取到。 第二步:爬取信息 选择网页每一页显示 200 条搜索记录,且网页显示格式改为 XML 格式,调用获取信息操作 符“Extract Information”,其功能是从文档中获取有规则的信息,我们需要用它来获取记录 条数,在参数设置中我们选择“String Matching”字符串匹配,匹配规则我们的设置我们需 要查看源代码,并检索记录数,如图 13.1


网友评论