使用正则表达式(RegEx)清理HTML标签

有些时候，我们处于安全等因素的考虑，是禁止用户提交含有HTML的内容的，但是客户端的验证和限制总归是不可信的。

这时候，我们需要对提交的内容，进行安全处理，去掉所有的HTML标签。

或者，我们需要提取某些混合内容的一部分作为摘要，此时，也需要清理掉HTML标签。

一、 C# 方式

System.Text.RegularExpressions.Regex reg = new System.Text.RegularExpressions.Regex("</?[^>]+>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

 string 清理后的结果 = reg.Replace("需要清理的内容", "");

二、 Javascript 方式

var stripTagsRE = /<\/?[^>]+>/gi;

 stripTags = function (v) {

   return !v ? v : String(v).replace(stripTagsRE, "");

 //使用方法

var 清理后的结果 = stripTags("要清理的内容");

秒客网

使用正则表达式(RegEx)清理HTML标签

相关文章