实验楼Linux基础入门(新版)- 数据提取

时间:2020-12-22 20:52:18

介绍

小明在做数据分析的时候需要提取文件中关于数字的部分,同时还要提取用户的邮箱部分,但是有的行不是数组也不是邮箱,现在需要你在data2这个文件中帮助他用正则表达式匹配出数字部分和邮箱部分。在这里下载

wget http://labfile.oss.aliyuncs.com/courses/1/data2

将下载的data2保存在/home/shiyanlou/data2

目标

  1. 在文件data中匹配数字开头的行,结果写入/home/shiyanlou/num文件
  2. 在文件data中匹配出正确格式的邮箱,结果写入一个名为/home/shiyanlou/mail的文件

提示

  1. 邮件的格式
  2. 注意符号.的处理

方案

1.创建num mail

$ touch num mail

2.匹配开头为数字的的部分

$ cat data2 | grep -E '^[0-9]+' > num

3.匹配邮箱格式

$ cat data2 | grep -E '^[[:alnum:]]+@[[:alnum:]]+.com' > mail