PHP过滤器的实现方法

时间:2022-09-11 23:37:50

PHP 过滤器用于验证和过滤来自非安全来源的数据,比如用户的输入。 
什么是 PHP 过滤器? 
PHP 过滤器用于验证和过滤来自非安全来源的数据。 

验证和过滤用户输入或自定义数据是任何 Web 应用程序的重要组成部分。 

设计 PHP 的过滤器扩展的目的是使数据过滤更轻松快捷。 
为什么使用过滤器? 
几乎所有 web 应用程序都依赖外部的输入。这些数据通常来自用户或其他应用程序(比如 web 服务)。通过使用过滤器,您能够确保应有程序获得正确的输入类型。 

您应该始终对外部数据进行过滤! 

输入过滤是最重要的应用程序安全课题之一。 

什么是外部数据? 
来自表单的输入数据 
Cookies 
服务器变量 
数据库查询结果 
函数和过滤器 
如需过滤变量,请使用下面的过滤器函数之一: 

filter_var() - 通过一个指定的过滤器来过滤单一的变量 
filter_var_array() - 通过相同的或不同的过滤器来过滤多个变量 
filter_input - 获取一个输入变量,并对它进行过滤 
filter_input_array - 获取多个输入变量,并通过相同的或不同的过滤器对它们进行过滤 
在下面的例子中,我们用 filter_var() 函数验证了一个整数: 

复制代码代码如下:


<?php 
$int = 123; 

if(!filter_var($int, FILTER_VALIDATE_INT)) 

echo("Integer is not valid"); 

else 

echo("Integer is valid"); 

?> 


上面的代码使用了 "FILTER_VALIDATE_INT" 过滤器来过滤变量。由于这个整数是合法的,因此代码的输出是:"Integer is valid"。 

假如我们尝试使用一个非整数的变量,则输出是:"Integer is not valid"。 

如需完整的函数和过滤器列表,请访问我们的 PHP Filter 参考手册。 
Validating 和 Sanitizing 
有两种过滤器: 

Validating 过滤器: 
用于验证用户输入 
严格的格式规则(比如 URL 或 E-Mail 验证) 
返回若成功预期的类型,否则返回 FALSE 
Sanitizing 过滤器: 
用于允许或禁止字符串中指定的字符 
无数据格式规则 
始终返回字符串 
选项和标志 
选项和标志用于向指定的过滤器添加额外的过滤选项。 

不同的过滤器有不同的选项和标志。 

在下面的例子中,我们用 filter_var() 和 "min_range" 以及 "max_range" 选项验证了一个整数: 

复制代码代码如下:


<?php 
$var=300; 

$int_options = array( 
"options"=>array 

"min_range"=>0, 
"max_range"=>256 

); 

if(!filter_var($var, FILTER_VALIDATE_INT, $int_options)) 

echo("Integer is not valid"); 

else 

echo("Integer is valid"); 

?> 


就像上面的代码一样,选项必须放入一个名为 "options" 的相关数组中。如果使用标志,则不需在数组内。 

由于整数是 "300",它不在指定的氛围内,以上代码的输出将是 "Integer is not valid"。 

如需完整的函数及过滤器列表,请访问 W3School 提供的 PHP Filter 参考手册。您可以看到每个过滤器的可用选项和标志。 
验证输入 
让我们试着验证来自表单的输入。 

我们需要作的第一件事情是确认是否存在我们正在查找的输入数据。 

然后我们用 filter_input() 函数过滤输入的数据。 

在下面的例子中,输入变量 "email" 被传到 PHP 页面: 

复制代码代码如下:


<?php 
if(!filter_has_var(INPUT_GET, "email")) 

echo("Input type does not exist"); 

else 

if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL)) 

echo "E-Mail is not valid"; 

else 

echo "E-Mail is valid"; 


?> 


例子解释: 
上面的例子有一个通过 "GET" 方法传送的输入变量 (email): 

检测是否存在 "GET" 类型的 "email" 输入变量 
如果存在输入变量,检测它是否是有效的邮件地址 
净化输入 
让我们试着清理一下从表单传来的 URL。 

首先,我们要确认是否存在我们正在查找的输入数据。 

然后,我们用 filter_input() 函数来净化输入数据。 

在下面的例子中,输入变量 "url" 被传到 PHP 页面: 

复制代码代码如下:


<?php 
if(!filter_has_var(INPUT_POST, "url")) 

echo("Input type does not exist"); 

else 

$url = filter_input(INPUT_POST, 
"url", FILTER_SANITIZE_URL); 

?> 


例子解释: 
上面的例子有一个通过 "POST" 方法传送的输入变量 (url): 

检测是否存在 "POST" 类型的 "url" 输入变量 
如果存在此输入变量,对其进行净化(删除非法字符),并将其存储在 $url 变量中 
假如输入变量类似这样:"http://www.W3#$%S^%$#ool.com.cn/",则净化后的 $url 变量应该是这样的: 

http://www.W3School.com.cn/过滤多个输入 
表单通常由多个输入字段组成。为了避免对 filter_var 或 filter_input 重复调用,我们可以使用 filter_var_array 或 the filter_input_array 函数。 

在本例中,我们使用 filter_input_array() 函数来过滤三个 GET 变量。接收到的 GET 变量是一个名称、一个年龄以及一个邮件地址: 

复制代码代码如下:


<?php 
$filters = array 

"name" => array 

"filter"=>FILTER_SANITIZE_STRING 
), 
"age" => array 

"filter"=>FILTER_VALIDATE_INT, 
"options"=>array 

"min_range"=>1, 
"max_range"=>120 

), 
"email"=> FILTER_VALIDATE_EMAIL, 
); 

$result = filter_input_array(INPUT_GET, $filters); 

if (!$result["age"]) 

echo("Age must be a number between 1 and 120.<br />"); 

elseif(!$result["email"]) 

echo("E-Mail is not valid.<br />"); 

else 

echo("User input is valid"); 

?> 


例子解释: 
上面的例子有三个通过 "GET" 方法传送的输入变量 (name, age and email) 

设置一个数组,其中包含了输入变量的名称,以及用于指定的输入变量的过滤器 
调用 filter_input_array 函数,参数包括 GET 输入变量及刚才设置的数组 
检测 $result 变量中的 "age" 和 "email" 变量是否有非法的输入。(如果存在非法输入,) 
filter_input_array() 函数的第二个参数可以是数组或单一过滤器的 ID。 

如果该参数是单一过滤器的 ID,那么这个指定的过滤器会过滤输入数组中所有的值。 

如果该参数是一个数组,那么此数组必须遵循下面的规则: 

必须是一个关联数组,其中包含的输入变量是数组的键(比如 "age" 输入变量) 
此数组的值必须是过滤器的 ID ,或者是规定了过滤器、标志以及选项的数组 
使用 Filter Callback 
通过使用 FILTER_CALLBACK 过滤器,可以调用自定义的函数,把它作为一个过滤器来使用。这样,我们就拥有了数据过滤的完全控制权。 

您可以创建自己的自定义函数,也可以使用已有的 PHP 函数。 

规定您准备用到过滤器的函数,与规定选项的方法相同。 

在下面的例子中,我们使用了一个自定义的函数把所有 "_" 转换为空格: 

复制代码代码如下:


<?php 
function convertSpace($string) 

return str_replace("_", " ", $string); 


$string = "Peter_is_a_great_guy!"; 

echo filter_var($string, FILTER_CALLBACK, 
array("options"=>"convertSpace")); 
?> 


以上代码的结果是这样的: 

Peter is a great guy!例子解释: 
上面的例子把所有 "_" 转换成空格: 

创建一个把 "_" 替换为空格的函数 
调用 filter_var() 函数,它的参数是 FILTER_CALLBACK 过滤器以及包含我们的函数的数组 



在java中实现过滤器,很简单,只需要在web.xml中配置如: 
<filter> 
<filter-name>iSpaceAuth</filter-name> 
<filter-class> 
com.skylark.console.servlet.ISpaceLoginFilter 
</filter-class> 
</filter> 
<filter-mapping> 
<filter-name>iSpaceAuth</filter-name> 
<url-pattern>/console/*</url-pattern> 
</filter-mapping> 
要想在PHP中实现一个类似的功能,因为我的需求是这样的,有个开发好了的OA系统,要集成到我们的应用中,OA要对外来的数据进行过滤,在给自己处理。这样就等于我必须写一个Php文件进行过滤,然后OA系统的文件都必须include该文件。这多恐怖,要重复的改好多代码,而且,代码的耦合度相当的高。 
查找PHP手册发现了有一些过滤的东西, 
一、过滤函数 
filter_has_var — Checks if variable of specified type exists 检查变量是否是指定的类型 
filter_id — Returns the filter ID belonging to a named filter 通过过滤器名得到过滤器的ID 
filter_input_array — Gets external variables and optionally filters them 
filter_input — Gets a specific external variable by name and optionally filters it 
filter_list — Returns a list of all supported filters 返回支持的过滤器列表 
filter_var_array — Gets multiple variables and optionally filters them 得到多个变量的值,每个变量选择一个过滤器 
filter_var — Filters a variable with a specified filter 用指定的过滤器过滤变量 
以前没使用过这个东东,今天试用下。 
<?php 
function convertSpace($string){ 
return str_replace("_", " ", $string); 

$string = "Peter_is_a_great_guy!"; 
echo filter_var($string, FILTER_CALLBACK,array("options"=>"convertSpace")); 
?> 
会输出 Peter is a great guy! 
发现PHP提供的过滤器只是对输入数据的过滤。不能像java一样,对整个项目访问进行过滤。java的过 
滤器还能指定过滤规则。看到这个规则让我想起了apache有个rewrite_rules的模块。让所有的访问都 
重定向到一个文件,那个文件就相当于一个过滤器了。我个那个文件取名filter 
RewriteEngine on 
RewriteCond %{HTTP_HOST} ^(.*)host [NC] 
RewriteRule ^(.*) filter.php 
虽然这样是可以实现。但是文件的组织方式必须是有规则的,就像单入口访问一样的。通过在filter.php通过new一个访问对象, 
调用一个方法来访问页面。 
单入口的代码 

复制代码代码如下:


<?php 
require_once './config.php'; 
$act = isset($_REQUEST['act']) ? trim($_REQUEST['act']) : 'index'; 
$ctl = isset($_REQUEST['ctl']) ? trim($_REQUEST['ctl']) : 'default'; 
$ctl = strtolower($ctl); 
$act = strtolower($act); 
require_once ROOTPATH.'/'.'lib'.'/controller/'.$ctl.'.php'; 
$ctl = ucfirst($ctl).'Controller'; 
$act = $act.'Action'; 
$app = new $ctl($act); 


但是该OA实现的不是单入口访问。这样的话访问的页面就一直是filter.php跳转之后又跳回来了。 
最后在发现在PHP的配置文件php.ini中可以配置 auto_prepend_file,该值的作用是在每个文件访问 
之前include该文件。这样include的文件就相当一个过滤器了。哈哈!该配置文件要重启服务啊,有点 
郁闷,那有没有改了之后不用重启服务的方法呢?当然有了,那就是采用.htaccess文件了。配置如 
下。 
RewriteEngine on 
php_value auto_prepend_file "D:/web/htdocs/demo1/filter.php" 不过这样有个缺点就是,当访问量大的时候,性能会受到影响。而直接在php.ini文件中改得花就不用 会了。还有个优点就是如果把.htaccess文件某个目录,只对该目录有效。那么在web目录下不是所有 的项目都会添加该文件。 下面我们来测试下。我建个项目叫demo该项目下的文件有
PHP过滤器的实现方法

index.php 

复制代码代码如下:


echo "index.php \n"; 


filter.php 
代码 

复制代码代码如下:


<?php 
echo 'filter'."\n"; 
$fileName = pathinfo($_SERVER['SCRIPT_FILENAME']); 

if($fileName['filename'] == 'index') 

header("location:".'./test.php'); 


test.php 

复制代码代码如下:


<?php 
echo 'test'; 
?> 


我们在url 中输入 http://localhost/demo/index.php 
结果是:filter test 

虽然实现了但是还是java的相差太多了.java的过滤器可以实现多个,这个就不行了。还可以指定哪些访问要过滤,这个就不行了。 

附: 
1、apache rewrite模块的启用方法。 
在http.conf文件中找到LoadModule rewrite_module modules/mod_rewrite.so把前面的# 删除。