php 学习笔记 字符串操作和正则表达式(四)

时间:2023-01-03 12:39:48

主要内容:

  1. 字符串格式化;
  2. 用字符串函数连接和分隔字符串;
  3. 字符串比较;
  4. 使用字符串函数匹配和替换子字符串;
  5. 使用正则表达式;

1,去空格:trim(),ltrim(),rtrim()

trim()函数去掉头尾两边的空格。

ltrim()函数去掉开始的空格。

rtrim()函数去掉结尾的空格。

2,格式化字符串:printf(),sprintf()

printf()函数和sprintf()函数,和echo的功能相同,都会打印字符串。但是它们可以实现更复杂的格式(象C#中string.Format()类似)。

printf()和sprintf()原型如下:

12 string
sprintf(string format[,mixed args..]);
void
printf(string format[,mixed args...]);

sprintf()返回格式化后的字符串。而printf直接将结果输出。它们两个的功能类似,所以就已printf()为例。

1234 $boy ="boy";echo "i am a $boy";echo '<br />';printf("i am a %s",$boy);

上面输出的结果一样。

其中format中的类型可以有以下几种:

php 学习笔记  字符串操作和正则表达式(四)

format中的所有转换类型都以%开始。如果想打印一个“%”符号,必须使用两个“%%”

3,改变字符串中的字符大小写

a).将字符转换为大写:strtoupper()

12 $str ="i am a boy";echo strtoupper($str);

b).将字符转换为小写 :strtolower()

12 $str ="I Am A Boy";echo strtolower($str);

c).如果第一个字符是字母,就转换成大写:ucfirst()

12 $str ="i am a boy";echo ucfirst($str);

d).将字符串中每个单词的第一个字母转成大写:ucwords()

12 $str ="i am a boy";echo ucwords($str);

4,转义字符串

addslashes()函数就是把“转换成\”,或者把\转成双斜杠\\等等之类的操作。

12 $str ='"i am a [\] boy."';echo addslashes($str);

输出:\"i am a [\\] boy.\"

addslashes()函数相反的函数就是stripslashes()。

5,编码字符串

htmlspecialchars()函数把&,<,>,“等等,编码成浏览器不能解释的字符。

用字符串函数连接和分隔字符串

1,分隔字符串:explode()

它的原型如下:

1 array explode(string separator,string input[,int limit]);

可以看出返回数组。使用如下:

12345 $str ="1,2,3,4,5";$arr =explode(',',$str);foreach($arr as $v){    echo $v.'<br />';}

返回1 2 3 4 5

既然有分隔就会有整合。不错,implode()和join()函数实现就是和explode()相反的操作。

123 $str ="1,2,3,4,5";$arr =explode(',',$str);echo implode(',',$arr);

2,截取字符串:substr()

substr()函数的原型如下:

1 string
substr(string input,int start[,int length]);

第二个参数表示截取的开始位置。

第三个参数表示截取的长度。

使用如下:

12 $str ="i am a boy";echo substr($str,2);

输出:am a boy

需要注意的是,第二个参数和第三个参数可以为负,如果为负,就意味着从后边开始。

function reverse_i($str){        for($i=1;$i<=strlen($str);$i++){            echo substr($str,-$i,1);        }        return;    }    reverse_i('word');

返回:drow;

字符串比较

1,字符串排序:strcmp(),strcasecmp(),strnatcmp()

strcmp()的原型如下:

1 int
strcmp(string str1,string str2);

如果两个字符串相等,返回0;如果按字典顺序str1在str2后面就返回一个正数,反之。这个函数是区分大小写的。

123 $str1 ="2";$str2 ="12";echo strcmp($str1,$str2);

返回1,说明它是按字典顺序排列的,$str1的第一个字符大于$str2的第一个字符。

strcasecmp()函数除了不区分大小写之外,其他和strcmp()函数一样。

而strnatcmp()则是按照人们习惯的顺序进行排序。它也不区分大小写。

123 $str1 ="2";$str2 ="12";echo strnatcmp($str1,$str2);

返回-1,说明12比2大。

2,获得字符串的长度:strlen()

strlen(“hello”),输出结果为5。

使用字符串函数匹配和替换子字符串

1,在字符串中查找字符串:strstr(),strchr(),strrchr()和strissr()

这些函数看起来张得差不多,真是难记啊!~~

最常用的是strstr()函数,strchr()函数和strstr()函数时一样的,虽然感觉strchr()是查找一个字符的意思。

strstr()函数的原型如下:

1 string
strstr(string haystack,string needle);
1 第一个参数为整个字符串。

第二个参数为需要查找的子字符串。

如果找到一个匹配,函数会从needle前面返回haystack,否则返回false。如果存在不止一个needle,返回的字符串从出现第一个needle的位置开始。

a).一个精确匹配

12 $str1 ="To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.";echo strstr($str1,'very');

输出:very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.

b).多个匹配

12 $str1 ="To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward";echo strstr($str1,'been');

输出:been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.

函数strstr()有两个变体。第一个是stristr()函数,它几乎和strstr()函数一样,但区别就是不区分大小写。

第二个是strrchr()函数,它几乎和strstr()一样,但会从最后出现needle的位置的前面返回字符串haystack。

此函数第二个参数为字符。

12 $str1 ="To all, I am very sad to tell you that I’ve just been fired.It has been my pleasure to work with all of you and I wish you only the best going forward.";echo strrchr($str1,'w');
输出:ward.

2,查找字符串的位置:strpos(),strrpos()

strpos()函数和strstr()函数的操作类似。但它不是返回一个字符串,而是返回子字符串在整个字符串中的位置。我们平常使用的也是这个。而且比strstr()速度也快。

strpos()函数原型如下:

1 int
strpos(string haystack,string needle,int offset);

第三个参数是可选的,标示开始搜索的位置。

12 $str1 ="hello word";echo strpos($str1,'o');

输出:4,位置是从0开始起。也可以用子字符串,这里只是出于演示目的。

12 $str1 ="hello word";echo strpos($str1,'o',5);

输出:7。是从位置5开始搜索,也就看不到位置4的那个“o”了。

函数strrpos()也几乎一样,但返回的是子字符串在整个字符串中最后一次出现的位置。

12 $str1 ="hello word";echo strrpos($str1,'o');

输出:7。说明“o”在hello word中最后一个位置的7。

这里需要注意一下,PHP中的false等于0,如果strpos()或者strrpos()都返回false(没有找到)或者在第一个字符就找到了(第一个字符的起始位置是0),

那么就区分不出来是找到,还是未找到了。那怎么办呢?只能用“===”恒等式来避免这个问题了。

1234567 $str1 ="hello word";$position =strrpos($str1,'h');//第一个字符就找到了,$position ==0if($position === false){    echo '没有找到';}else{    echo $position;}

3,替换子字符串:str_replace(),substr_replace()

str_replace()函数的原型如下:

1 mixed
str_replace(mixed needle,mixed new_needle,mixed haystack[,int &count]);

第三个参数是可选的。它包含了要执行的替换操作次数。

返回替换过的字符串。

12 $str1 ="hello word";echo str_replace('word','china',$str1);

输出:hello china

函数substr_replace()则用来在给定位置中查找和替换字符串中特定的子字符串。原型如下:

1 string
substr_replace(string string,string replacement,int start[,int length]);

这个函数使用字符串replacement替换整个字符串string中的一部分。具体是那一部分则取决于起始位置和可选参数length的值。

需要注意的是,start的值如果是0或者一个正值,就是从字符串开始计算偏移量;如果是一个负值,就从字符串末尾开始的一个偏移量。

使用正则表达式

1,查找子字符串:ereg(),eregi()

ereg()函数的原型如下:

1 int
ereg(string pattern,string search,array [matches]);

在search字符串中查找正则为pattern的表达式,如果发现了与pattern的字表达式相匹配的字符串,这些字符串将会存储在数组matches中,每个数组元素对应一个子表达式。

函数eregi()函数除了不区分大小写外,其功能与ereg()一样。

123456 $str1 ="xxx@gmail.com.cn";if(!eregi('[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}',$str1)){    echo '不是正确的Email';}else{    echo '正确';}

2,替换子字符串:ereg_replace(),eregi_replace()

于str_replace()函数一样,只不过这两个使用正则表达式当做参数。

ereg_replace()的原型如下:

1 string
ereg_replace(string pattern,string replacement,string search);
12 $str1 ="123123@gmail.com.cn";echo ereg_replace('[A-Z0-9._%+-]+@','**@',$str1);

输出:**@gmail.com.cn

函数eregi_replace除了不区分大小写外,其他与ereg_replace()相同。

3,分隔字符串:split()

函数split()的原型如下:

1 array split(string pattern,string search[,int max]);

第三个参数为可选,表示进入数组中的元素个数。

返回值是数组。

12345 $str1 ="123123@gmail.com.cn";$arr = split('\.|@',$str1);while(list($key,$value) = each($arr)){    echo '<br />'.$key.'--'.$value;}

输出:

0--123123 
1--gmail 
2--com 
3--cn

split()函数和explode()函数有点相似,前者是用正则表达式当做分隔符,后者是用字符串当做分隔符。