C#提取网页中超链接link和text部分的方法

时间:2021-09-17 07:46:04

本文实例讲述了C#提取网页中超链接link和text部分的方法。分享给大家供大家参考,具体如下:

?
1
2
3
4
5
6
7
8
9
string s = "..";
Regex re = new Regex(@"<a[^>]*href=(""(?<href>[^""]*)""|'(?<href>[^']*)'|(?<href>[^\s>]*))[^>]*>(?<text>.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Singleline);
Match m = re.Match(s);
if(m.Success)
{
 string link = m.Groups["href"].Value;
 string text = Regex.Replace(m.Groups["text"].Value,"<[^>]*>","");
 Console.WriteLine("link:{0}\ntext:{1}", link, text);
}

希望本文所述对大家C#程序设计有所帮助。