文件名称:大数据与专利分析.doc
文件大小:31KB
文件格式:DOC
更新时间:2022-12-24 11:41:59
文档资料
大数据与专利分析 作者:马兵 来源:《中国科技博览》2017年第05期 [摘 要]大数据时代下专利分析的发展趋势具有重要的研究价值。本文首先介绍了专利分析的 现状,分析了现阶段专利分析存在的不足,随后介绍了大数据的应用、特点以及大数据 时代所带来的变革。最后基于大数据分析的主要内容,展望了专利分析与大数据技术的 结合前景。 [关键词]大数据 专利分析 数据挖掘 可视化 中图分类号:TU94 文献标识码:A 文章编号:1009-914X(2017)05-0298- 01 一、引言 随着网络、通信、运算、存储技术的发展及成本降低,大数据在搜索引擎、互 联网金融、电子商务、医疗卫生等诸多领域已经开始产生重大影响。"大数据"作为当前 科技关键词的大热门之一,截至本文刊发时,在百度搜索引擎中相关网页搜索结果超过 1亿个,相关新闻搜索结果逾148万篇。数据已经成为重要的生产要素之一,相关组织、 机构所掌握的数据规模、对数据的分析运用能力已经成为考量其综合实力的重要因素。 专利分析的主要功能在于从孤立的专利文献中多层次多角度地挖掘信息,并处理成具有 预测功能的报告为企业所用,而对海量数据进行挖掘、计算及可视化,正是大数据分析 的主要内容。可以预见,基于大数据的专利分析将成为未来的发展趋势。 二、专利分析现状 一般认为,专利分析发轫于1949年Seidel所提出的专利引文分析专利文献重要 性的概念,但将其应用于企业的战略与竞争分析,是上世纪90年代后随着信息、网络、 数据库技术的发展才得以实现的。 专利分析通常是指对专利文献进行数据挖掘、加工、统计处理,进而获取符合 分析目标要求的有价值信息,主要应用包括专利导航、专利预警、专利布局、专利评估 、技术规避、侵权分析等。 专利分析的方式方法很多,其过程一般包括数据采集处理阶段、专利分析阶段 、报告形成及成果展示阶段。由于专利分析的对象数据规模庞大,因此通常需要借助计 算机和分析工具,但是人员的参与仍然必不可少,例如在数据采集处理阶段,需要完成 技术分解、检索、数据加工、数据标引等工作,而检索过程中的检索策略的制定、检索 要素的筛选、结果噪声去除等很大程度上依赖于专利分析人员的经验和能力,这也导致 了专利分析的高成本、高门槛。另外,由于专利的早期公开延迟*,导致专利分 析所针对的专利文献都是一至两年前申请的技术方案,不能代表最新技术的发展现状。 三、大数据时代 互联网用户对大数据有了越来越多的直观体验,在社交网络中被推荐的联系人 或内容,是基于社交网络大数据得到的用户之间、用户与社区之间的隐含关系信息;在 电商网站被推荐的商品,是基于处理海量的访问、购买、评论数据分析出的消费行为信 息;在搜索引擎中定向投放的广告,是通过对广告大数据的处理分析得到的。 著名管理咨询公司麦肯锡首先预言了大数据时代的来临,"数据,已经渗透到当 今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用 ,预示着新一波生产率增长和消费者盈余浪潮的到来"。阿里巴巴董事局主席马云则直接 地指出,虽然阿里巴巴是全球最大的零售平台,但是阿里巴巴不是一家零售公司,而是 一家数据公司。 "大数据"相对于传统"小数据"的特点,传播非常广泛的是Gartner集团分析师L aney所总结出的三个"V",即容量(Volume)、种类(Variety)、速度(Velocity)。 以此为基础,IBM进一步将其扩充到四个"V",即:1、容量(Volume),大数据时代的数 据量已达PB(1024TB)乃至EB(1024PB)级;2、种类(Variety),大数据时代的数据 类型庞杂,除结构化数据,还包括互联网自媒体数据、图片、音视频等非结构化数据; 3、速度(Velocity),大数据需要快速的处理才能获取有价值的信息;4、真实(Vera city),需要从大数据中筛选真实数据才能得到真实的信息。维克托·迈尔- 舍恩伯格在《大数据时代》中提出,大数据时代带来的变革主要包括:不是随机样本,而 是所有数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。在大数据时代 ,不再需要借助随机采样的方法处理数据,而是对所有数据进行处理以分析具体事件; 不再需要数据的微观精确性,只需在宏观上洞悉数据的总体方向;不再需要事件与原因 之间的因果关系,而是通过相关关系了解事件的发生进程。 四、基于大数据的专利分析展望 基于大数据分析的主要内容以及专利分析的现状,可以预测未来基于大数据的 专利分析发展将包括以下几个方面。 1、基于语义引擎数据采集处理。以往的机器检索,计算机只能在字符匹配层级 认知用户的输入信息,不能理解信息的含义,特别是在专利信息的检索过程中,检索策 略的设定和调整都需要借助人工方式。而随着计算机技术和人工智能的发展,通