文件名称:知识抽取-中兴netnumen u31 r10(v12.11.40)统一网元管理系统 产品描述
文件大小:2.82MB
文件格式:PDF
更新时间:2024-07-16 04:26:46
人工智能 智能医疗 知识图谱
图 2.1 知识图谱的技术架构图 图 2.1 为知识图谱的技术架构图,方框内知识的抽取、融合与处理三步骤是 知识图谱构建的核心。由图可见,结构化的数据因为规范化程度较高,可以较为 容易的从中抽取知识;半结构和非结构化数据规范性较差,难以直接获取知识, 因此需要借助属性抽取、关系抽取、实体抽取等一系列操作提取出知识的实体和 关联,然后存入知识库中。知识图谱的构建过程是不断循环往复的,可将迭代的 环节大致分为三个阶段:知识抽取、知识融合以及知识处理。 (1)知识抽取 构建知识图谱的第一个环节是知识抽取,其目的是从多种数据源中抽取得到 知识单元。知识抽取面向的数据源是半结构化和非结构化的,因其规范性差而难 以直接识别知识单元,所以需要借助命名实体识别、实体关系识别和属性抽取等 技术进行处理。 命名实体识别(Named entity recognition,NER)是指通过自动化手段从文本 中识别具有特定含义的一类实体概念的技术,也可以称作实体抽取。实体识别的 准确性直接决定了关系识别的质量,影响到知识图谱构建的后续环节,因此是整 个知识抽取中最重要的地方。 命名实体识别的流程如图 2.2 所示。