第九章 正则表达式
学习要点:
1.正则表达式语法(Perl 风格)
2.正则表达式中的元素
3.Perl 风格函数
处理字符串时,有很多较为复杂的字符串用普通的字符串处理函数无法干净的完成。比
如说,可能需要验证一个Email 地址是否合法,为此需要查看许多不容易检查的规则。这正
是正则表达式的用武之地。正则表达式是功能强大而简明的字符组,其中可以包含大量的逻
辑,特别值得一提的是正则表达式相当简短。
一.正则表达式语法(Perl风格)
Perl 一直被认为是最伟大的解析语言之一,它提供了一种全面的正则表达式,即使是最
复杂的字符串模式,也可以用这种正则表达式语言搜索和替换。PHP 开发人员认识到,与
其重新发明正则表达式,不如让PHP 用户直接使用声名赫赫的Perl 正则表达式语言,即Perl
风格的函数。
模式规则:/php/ 在字符串前后加上两条斜杠即可。
匹配函数:preg_match()函数在字符串中搜索模式,如果存在则返回true,否则返回false。
<?php preg_match('/php/','php'); ?>
二.正则表达式中的元素
正则表达式中包含三种元素分别为:量词、元字符、修饰符
量词
元字符
修饰符
三.Perl风格函数
PHP 为使用Perl 兼容的正则表达式搜索字符串提供了7 个函数,包括:preg_grep()、
preg_match()、preg_match_all()、preg_auote()、preg_replace()、preg_replace_callback()和
preg_split()。
搜索字符串:preg_grep()函数搜索数组中的所有元素,返回由与某个模式匹配的所有元
素组成的数组。
<?php $language = array('php','asp','jsp','python','ruby'); print_r(preg_grep('/p$/',$language)); ?>
搜索模式:preg_match()函数在字符串中搜索模式,如果存在则返回true,否则返回false。
<?php echo preg_match('/php[1-6]/','php5'); ?>
电子邮件验证小案例(分组应用)
<?php $mode = '/([\w\.\_]{2,10})@(\w{1,}).([a-z]{2,4})/'; $string = '[email protected]'; echo preg_match($mode,$string); ?>
匹配模式的所有出现:preg_match_all()函数在字符串中匹配模式的所有出现,然后将所
有匹配到的全部放入数组。
<?php preg_match_all('/php[1-6]/','php5sdfphp4sdflljkphp3sdlfjphp2',$out); print_r($out); ?>
定界特殊的正则表达式:preg_quote()在每个对于正则表达式语法而言有特殊含义的字
符前插入一个反斜线。这些特殊字符包含:$ ^ * () + = {} [] | \\ : <>
。
<?php echo preg_quote('PHP的价格是:$150'); ?>
替换模式的所有出现:preg_replace()函数搜索到所有匹配,然后替换成想要的字符串返
回出来。
<?php echo preg_replace('/php[1-6]/','python','This is a php5,This is a php4'); ?>
ubb 小案例:贪婪问题+分组使用()
<?php $mode = '/\[b\](.*)\[\/b\]/U'; $replace = '<strong>\1</strong>'; $string = 'This is a [b]php5[/b],This is a [b]php4[/b]'; echo preg_replace($mode,$replace,$string); ?>
以不区分大小写的方式将字符串划分为不同的元素:preg_split()用来分割不同的元素。
<?php print_r(preg_split('/[\.@]/','[email protected]' )); ?>
注:目前为PHP 使用POSIX 风格的正则表达式搜索字符串提供了7 个函数,包括:ereg()、
ereg_replace()、eregi()、eregi_replace()、split()、spliti()和sql_regcase()。
PS:和Perl 风格基本相同,可以参考手册自行学习。
注:文章出自李炎恢PHP视频教程,本文仅限交流使用,不得用于商业用途,否则后果自负。