文件名称:介绍/动机-qt教学大纲
文件大小:5.26MB
文件格式:PDF
更新时间:2024-06-23 19:46:38
python 核心编程 中文版 高清文字版
15.1 介绍/动机 处理文本和数据是件大事。如果您不相信我说的话,请仔细看看现如今的计算机主要都在做些 什么工作。文字处理、网页填表、来自数据库的信息流、股票报价信息、新闻列表,这个清单还会 不断地增长。因为我们可能不知道这些需要计算机编程处理文本或数据的具体内容,所以能把这些 文本或数据以某种可被计算机识别和处理的模式表达出来是非常有用的。 假设我在运营一个电子邮件档案公司,而您是我的一位顾客,比如说,您想获得自己去年二月 间收发的所有邮件,如果我能设计一个计算机程序来整理信息然后将它转发给您,而不是通过人工 方法通读您的邮件后再手动地处理您的请求,如此处理将会非常不错。因为如果有人会看遍您的邮 件信息,哪怕只是是用眼睛看一下邮件上的时间,您可能都会对此感到担心(甚至愤怒)。又比如, 您可能会认为凡是带有“ILOVEYOU”这样主题的邮件都是已感染病毒的信息,并要求从您的个人邮 箱中删除它们。这就引出一个问题,我们如何通过编程使计算机具有在文本中检索某种模式的能力。 正则表达式(RE)为高级文本模式匹配,以及搜索-替代等功能提供了基础。正则表达式(RE)是一 些由字符和特殊符号组成的字符串,它们描述了这些字符和字符的某种重复方式,因此能按某种模 式匹配一个有相似特征的字符串的集合,因此能按某模式匹配一系列有相似特征的字符串,见图 15 –1。换句话说,它们能匹配多个字符串 - 一个只能匹配一个字符串的 RE模式是乏味且毫无作用的, 你说是不是?