[正则表达式]贪婪模式与非贪婪模式

时间:2022-03-15 14:22:52

复制代码 代码如下:


/**    
**   author: site120    
**   function : get script part from html document    
**/    
var loadJs = function(str , delayTime)     
{     
    var delayTime = delayTime || 100;     
    var regExp_scriptTag = new RegExp("<\\s*script([^>]*)>([\\s\\S]*?)</\\s*script\\s*>" , "gi");     
    var regExp_scriptAttrib_src = new RegExp("\\s*src?\\s*=\\s*(\"([^\"]+)\"|\'([^\']+)\'|\\s*([^\\s]+)\\s*)" , "gi");     
    var arr_scriptTag = null;     
    var arr_scriptAttib = null;     
    var scriptData = "";     
    var jsList = new Array();     
    while ((arr_scriptTag=regExp_scriptTag.exec(str)) != null)     
    {     
        while ((arr_scriptAttib=regExp_scriptAttrib_src.exec(arr_scriptTag[1])) != null)     
        {      
            if (arr_scriptAttib[3])     
            {     
                jsList.push(arr_scriptAttib[3]);     
            }     
            else if (arr_scriptAttib[2])     
            {     
                jsList.push(arr_scriptAttib[2]);     
            }     
            else    
            {     
                jsList.push(arr_scriptAttib[1]);     
            }     
        }     
        scriptData += (arr_scriptTag[2]);     
    }     
    for (var i=0; i<jsList.length; i++)     
    {     
        var script = document.createElement("script");     
        script.src = jsList[i];     
        document.body.appendChild(script);     
    }     
    if (scriptData.length > 0)     
    {     
        var fn = "_siteFunction_" + new Date().getTime() + "_" + parseInt(Math.random()*10000) + "_120";     
        scriptData = " var " + fn + " = function(){ " + scriptData + " };  "+fn+"();"    
        window.eval(scriptData);     
    }     
}   

 
这是用Js来处理正则表达式,原理与Java一样,
功能是读取一段网页源代码,并将它里面所有的script标签,截取并加载运行。
这里面的[\s\S]*?利用非贪婪模式来匹配最近script标签之间的所有代码。包括换行