文件名称:使用开放自然语言处理 (NLP) 处理文本信息-研究论文
文件大小:866KB
文件格式:PDF
更新时间:2024-06-29 17:11:17
Information Extraction Computing
NLP 是计算技术的应用,AI 的组成部分有助于标准英语语言的分析和合成。 它借鉴了计算机科学和计算语言学等许多学科来处理和分析大量自然语言数据。 识别语言中指代文本中特定类型的实体和关系的短语。 N-gram 方法中发现的问题是,平衡权重放在不频繁和频繁的克之间。 它仅对少量文本数据有效。 因此,很难发现语料库中可用的命名实体。 本文的主要目的是克服 n-gram 方法中可用的限制,并通过使用 Open NLP 工具包促进找到所需的实体片段。 它有助于以 XML 格式存储信息,从而提供一种简单的查询和处理方式。 因此,从网络中提取的信息是一种非结构化的形式。 这种方法是一种以有效方式处理文本的有前途的方法。 为了提高文本挖掘的有效性,研究人员专注于 NLP 的任务,即从许多非结构化文本文档中发现知识,从而获得最大的可用知识来源。 本文展示的实验和结果准确率为 0.95,证明置信水平优于 N-grams 方法。