SQL语句正则匹配域名的问题

时间:2022-07-26 06:00:33
比如:XXX.baidu.com的域名       
或是:XXX.XXX.baidu.com的域名
或是:q1.qlogo.cn的域名等等

如果URL为二级域名,就只要查出来baidu.com
如果是三级域名,就要查出来是XXX.baidu.com


求教~!!

10 个解决方案

#1


统计一下字段中的小数点的数量不就行了?

select length(url)-length(replace(url,'.',''))

#2


那要是再在查询出的数据上做下总的统计排序呢??
比如说:baidu.com共多少个,qlogo.cn共多少个,排序

#3


引用
那要是再在查询出的数据上做下总的统计排序呢??
比如说:baidu.com共多少个,qlogo.cn共多少个,排序


不理解你的问题,建议举例说明。

   建议你列出你的表结构,并提供测试数据以及基于这些测试数据的所对应正确结果。
   参考一下这个贴子的提问方式 http://topic.csdn.net/u/20091130/20/8343ee6a-417c-4c2d-9415-fa46604a00cf.html
   
   1. 你的 create table xxx .. 语句
   2. 你的 insert into xxx ... 语句
   3. 结果是什么样,(并给以简单的算法描述)
   4. 你用的数据库名称和版本(经常有人在MS SQL server版问 MySQL)
   
   这样想帮你的人可以直接搭建和你相同的环境,并在给出方案前进行测试,避免文字描述理解上的误差。

   

#4


引用 2 楼 renmeng1988 的回复:
那要是再在查询出的数据上做下总的统计排序呢??
比如说:baidu.com共多少个,qlogo.cn共多少个,排序


select substring(col,instr(col,'.'),length(col)),count(*)
from tb
group by substring(col,instr(col,'.'),length(col))

#5


create table mdp_unkown_domain
(
id int(11),
NAME varchar(50),
url varchar(100),
STATUS int(11)
)

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (91, '', 'hp.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (92, '', 'ireadercity.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (93, '', 'download.windowsupdate.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (94, '', 'pic8.onetad.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (95, '', 'a467.phobos.apple.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (96, '', 'a87.photo.store.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (97, '', 'hainan.zhiji.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (98, '', 'h.qhimg.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (99, '', 'a71.photo.store.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (100, '', 'r6.mo.baidu.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (101, '', 'wp2.sina.cn', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (102, '', 'www.yueli.yorku.ca', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (103, '', 'img.t.sinajs.cn', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (104, '', 'a1172.phobos.apple.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (105, '', 'p.tanx.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (106, '', 's1.meituan.net', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (107, '', 'reportq.rising.com.cn', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (108, '', '3g.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (109, '', 'www.52d.cc', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (110, '', 'pic53.mimg.ifeng.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (111, '', 'pl.paipai.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (112, '', 'a204.photo.store.qq.com', 0);

比如以上数据,我想要 的结果是这样的:
count是按大小排序的
url                                  count
baidu.com                            总数量
qq.com                               总数量
 .                                     .
 .                                     .
 .                                     .
 .                                     .

#6


有高人赐教吗??

#7


根据你提供的测试数据,正确结果是多少? 

#8


我要的结果是
qq.com   4
apple.com 2
ireadercity.com 1
windowsupdate.com 1
onetad.com 1
其余的URL都只出现了一次,所以一次类推

#9


qq.com 4 是5?
是统计根域名的个数吗?

#10


 select substring_index(url, '.', -2) ,count(*) from mdp_unkown_domain group by substring_index(url, '.', -2) order by count(*) desc;解决了,谢谢大家了 

#1


统计一下字段中的小数点的数量不就行了?

select length(url)-length(replace(url,'.',''))

#2


那要是再在查询出的数据上做下总的统计排序呢??
比如说:baidu.com共多少个,qlogo.cn共多少个,排序

#3


引用
那要是再在查询出的数据上做下总的统计排序呢??
比如说:baidu.com共多少个,qlogo.cn共多少个,排序


不理解你的问题,建议举例说明。

   建议你列出你的表结构,并提供测试数据以及基于这些测试数据的所对应正确结果。
   参考一下这个贴子的提问方式 http://topic.csdn.net/u/20091130/20/8343ee6a-417c-4c2d-9415-fa46604a00cf.html
   
   1. 你的 create table xxx .. 语句
   2. 你的 insert into xxx ... 语句
   3. 结果是什么样,(并给以简单的算法描述)
   4. 你用的数据库名称和版本(经常有人在MS SQL server版问 MySQL)
   
   这样想帮你的人可以直接搭建和你相同的环境,并在给出方案前进行测试,避免文字描述理解上的误差。

   

#4


引用 2 楼 renmeng1988 的回复:
那要是再在查询出的数据上做下总的统计排序呢??
比如说:baidu.com共多少个,qlogo.cn共多少个,排序


select substring(col,instr(col,'.'),length(col)),count(*)
from tb
group by substring(col,instr(col,'.'),length(col))

#5


create table mdp_unkown_domain
(
id int(11),
NAME varchar(50),
url varchar(100),
STATUS int(11)
)

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (91, '', 'hp.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (92, '', 'ireadercity.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (93, '', 'download.windowsupdate.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (94, '', 'pic8.onetad.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (95, '', 'a467.phobos.apple.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (96, '', 'a87.photo.store.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (97, '', 'hainan.zhiji.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (98, '', 'h.qhimg.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (99, '', 'a71.photo.store.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (100, '', 'r6.mo.baidu.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (101, '', 'wp2.sina.cn', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (102, '', 'www.yueli.yorku.ca', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (103, '', 'img.t.sinajs.cn', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (104, '', 'a1172.phobos.apple.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (105, '', 'p.tanx.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (106, '', 's1.meituan.net', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (107, '', 'reportq.rising.com.cn', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (108, '', '3g.qq.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (109, '', 'www.52d.cc', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (110, '', 'pic53.mimg.ifeng.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (111, '', 'pl.paipai.com', 0);

INSERT INTO MDP_UNKOWN_DOMAIN
   (`ID`, `NAME`, `URL`, `STATUS`)
VALUES
   (112, '', 'a204.photo.store.qq.com', 0);

比如以上数据,我想要 的结果是这样的:
count是按大小排序的
url                                  count
baidu.com                            总数量
qq.com                               总数量
 .                                     .
 .                                     .
 .                                     .
 .                                     .

#6


有高人赐教吗??

#7


根据你提供的测试数据,正确结果是多少? 

#8


我要的结果是
qq.com   4
apple.com 2
ireadercity.com 1
windowsupdate.com 1
onetad.com 1
其余的URL都只出现了一次,所以一次类推

#9


qq.com 4 是5?
是统计根域名的个数吗?

#10


 select substring_index(url, '.', -2) ,count(*) from mdp_unkown_domain group by substring_index(url, '.', -2) order by count(*) desc;解决了,谢谢大家了