最近呢,公司让写一个组件,要求用正则表达式构建一个中文的匹配组件,许多问题就来了,大多是用自动机来构建一个正则表达式的引擎,小编虽然大学的时候学过编译原理,可奈何现在已经忘得差不多了,只能通过现有的正则表达式来进行功能实现。
下面的代码呢实现了通过用正则表达式来对某一个句子的添加、替换、删除三种操作,不知道这个适不适合大家的口味,反正小编已经做好让公司头批评的准备了,因此小编是在是现学不来呀。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
# -*- conding:utf-8 -*-
import re
txt = '这个池子的体积大约是34立方米容积'
'' 'role为匹配规则,re_out为替换部分格式为“\1(替换部分)”' ''
def Replace(role,re_out):
out = re.compile(role)
String_out = out.sub(re_out,txt)
print(String_out)
Replace(r '(这个池子的体积大约是34)(.*)' ,r '\1平方米' )
'' '
role为匹配规则,num为将要删除的元素(从1开始)
'' '
def Delete(role,num):
out = re.search(role,txt).group(num)
string = txt. split (out)
String_out = '' . join (string)
print(String_out)
Delete( '(这个池子的体积大约是34)(.*)(容积)' ,2)
def Add(role,re_out):
out = re.compile(role)
String_out = out.sub(re_out,txt)
print(String_out)
Add(r '(这个池子的体积大约是34)(.{0})' ,r '\1的' )
|
下面的图片是小编运行这三个函数得到的结果,大家可以看看,如果有需要的可以参考一下,另外,小编需要人告诉我这个正则表达式如何用自动机来实现,他的原理是什么,欢迎大家的留言哦。
总结
以上所述是小编给大家介绍的正则表达式实现添加、删除、替换三种功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://blog.csdn.net/qq_32113189/article/details/80969179