在以前,一个用户通过网络主要是获取信息。而如今的网络刚更注重与用户的交互,用户不再仅仅是网站的浏览者,也是网站内容的制造者。由以前单纯的“读”向“写”以及“共同创作”发展,由被动接收信息向主动分行信息发展。而随之而来的安全问题也成了web开发者不可忽视的问题,验证第三方来源的数据成了每个web程序必不可少的功能。
在以前,php需要验证数据,一般都是程序员自己通过正则表达式实现,而从php从5.2开始把原本的pcel中的filter函数移到了内置库中,并做了不少强化,可以用这些函数实现对数据的过滤和验证。
数据来源及验证类型
php中的数据来源包含两部分,其一是外部变量(如post、get、cookie等),还有一种是页面内部产生的数据。php针对这两种数据类型分别定义了ilter_input_**和filter_var_**系列函数。而依据验证方法的不一样又可以分为validating和sanitizing两种。validating用于验证数据,返回一个布尔值。sanitizing则按规则过滤一些特定的字符,返回的是处理后的字符串。
简单用法
比如验证一个字符串是否是一个整数,在以往我们可以通过正则表达式或是is_numeric函数实现:
复制代码 代码如下:
$str = '51ab';
preg_match('/^[0-9]*$/', $str);
is_numeric($str);
新的验证函数可以用以下方式:
$str = '51ab';
echo filter_var($str, filter_validate_int) ? 'is valid' : 'is not valid';filter_validate_int是php定义的一个过滤器,用于验证$str是否为一个整数。实际上这就是一个数值常量,通过echo filter_validate_int;发现值为257。所以我们也可以用:
$str = '51ab';
echo filter_var($str, 257) ? 'is valid' : 'is not valid';php中定义了大量常用的过滤器,我们可以通过filter_list()获得所有支持的过滤器名称(用字符串表示),然后再用filter_id(string)获取其数值:
print_r(filter_list()); // 所有支持的过滤器名称。
echo '=========';
echo filter_id('int'); // 'int' 是filter_list返回的一个过滤器名称。以上将输入出类似以下内容:
array(0=>int',1=>'boolean',2=>'float',3=>'validate_regexp')
==========
257sanitizing过滤器
上面这个是验证数据格式是否正确,有时候过滤掉无关的内容也是挺重要的。sanitize过滤提供了这种功能,比如过滤掉一个email中多余的字符:
$email = '