HtmlAgilityPack 是CodePlex 上的一个开源项目。它提供了标准的DOM API 和XPath 导航--即使 HTML 不是适当的格式!
使用HtmlAgilityPack操作HTML比正则表达式好用一些。
WebClient page = new WebClient();
page.Encoding = Encoding.UTF8;
page.BaseAddress = "http://www.cnblogs.com"; String url = "/n/200069/";
String html = String.Empty; html = page.DownloadString(url); HtmlAgilityPack.HtmlDocument document = new HtmlAgilityPack.HtmlDocument();
document.LoadHtml(html);
取得document对象后,使用XPath对其进行操作。