Java字符串分割的三种方法

时间:2021-09-29 21:20:02


一、StringTokenizer方法

Java中substring方法可以分解字符串,返回的是原字符串的一个子字符串。如果要讲一个字符串分解为一个一个的单词或者标记,StringTokenizer可以帮你。

先看个例子:


public static void main(String[] args) {  

StringTokenizer st = new StringTokenizer("www.ooobj.com"".b");  

 while(st.hasMoreElements()){  

System.out.println("Token:" + st.nextToken());  

 }  

 }  


输出:
Token:www
Token:ooo
Token:j
Token:com

StringTokenizer有两个常用的方法:

1.hasMoreElements()。这个方法和hasMoreElements()方法的用法是一样的,只是StringTokenizer为了实现Enumeration接口而实现的方法,从StringTokenizer的声明可以看到:class StringTokenizer implements Enumeration<Object>。

2.nextElement()。这个方法和nextToken()方法的用法是一样的,返回此 StringTokenizer 的下一个标记。

StringTokenizer的三个构造方法:

1.StringTokenizer(String str)。默认以” \t\n\r\f”(前有一个空格,引号不是)为分割符。
源码:
public StringTokenizer(String str) {
this(str, ” \t\n\r\f”, false);
}

实例:

public static void main(String[] args) {  

 StringTokenizer st = new StringTokenizer("www ooobj com");  

 while(st.hasMoreElements()){  

 System.out.println("Token:" + st.nextToken());  

 }  

 }  


输出:
Token:www
Token:ooobj
Token:com

2.StringTokenizer(String str, String delim)。指定delim为分割符,看第一个例子。

3.StringTokenizer(String str, String delim, boolean returnDelims)。returnDelims为true的话则delim分割符也被视为标记。

实例:

  public static void main(String[] args) { 

  StringTokenizer st = new StringTokenizer("www.ooobj.com", ".", true); 

  while(st.hasMoreElements()){ 

  System.out.println("Token:" + st.nextToken()); 

  } 

  }

输出:
Token:www
Token:.
Token:ooobj
Token:.
Token:com


二、String.split()方法

在java.lang包中有String.split()方法,返回是一个数组。
 1、“.”和“|”都是转义字符,必须得加"\\";
  如果用“.”作为分隔的话,必须是如下写法:
String.split("\\."),这样才能正确的分隔开,不能用String.split(".");
    如果用“|”作为分隔的话,必须是如下写法:
String.split("\\|"),这样才能正确的分隔开,不能用String.split("|");

  2、如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acount=? and uu =? or n=?”,把三个都分隔出来,可以用
  String.split("and|or");

  3、public String[] split(String regex,int limit)根据匹配给定的正则表达式来拆分此字符串。
  此方法返回的数组包含此字符串的每个子字符串,这些子字符串由另一个匹配给定的表达式的子字符串终止或由字符串结束来终止。数组中
  的子字符串按它们在此字符串中的顺序排列。如果表达式不匹配输入的任何部分,则结果数组只具有一个元素,即此字符串。

  4、public string[] split(string regex)
  这里的参数的名称是 regex ,也就是 regular expression (正则表达式)。这个参数并不是一个简单的分割用的字符,而是一个正则表达式,
他对一些特殊的字符可能会出现你预想不到的结果,比如测试下面的代码:

(1) 用竖线 | 分隔字符串,你将得不到预期的结果

String[] aa="aaa|bbb|ccc".split("|"); 
//String[] aa = "aaa|bbb|ccc".split("\\|"); 这样才能得到正确的结果 
for(int i=0; i<aa.length; i++){ 
System.out.println("--"+aa); 
}



(2)用竖 * 分隔字符串运行将抛出java.util.regex.PatternSyntaxException异常,用加号 + 也是如此。

String[] aa="aaa*bbb*ccc".split("*"); 
//String[] aa = "aaa|bbb|ccc".split("\\*"); 这样才能得到正确的结果    
for(int i=0; i<aa.length; i++){ 
System.out.println("--"+aa); 
}



(3)显然,+ * 不是有效的模式匹配规则表达式,用"\\*" "\\+"转义后即可得到正确的结果。 
(4) "|" 分隔串时虽然能够执行,但是却不是预期的目的,"\\|"转义后即可得到正确的结果。 
(5)还有如果想在串中使用""字符,则也需要转义.首先要表达"aaaa\bbbb"这个串就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果: 
String[] aa = "aaa\\bbb\\bccc".split(\\\\); 
(6) 还有就是点号".",也要首先转义才能得到正确的结果。


第一种方法:

string s="abcdeabcdeabcde";
string[] sArray=s.Split('c');
foreach(string iin sArray)Console.WriteLine(i.ToString());

输出下面的结果:
 ab
deab
deab
de

第二种方法:
我们看到了结果是以一个指定的字符进行的分割。使用另一种构造方法对多个字符进行分割:

string s="abcdeabcdeabcde";
string[] sArray1=s.Split(newchar[3]{'c','d','e'});
foreach(string iin sArray1)Console.WriteLine(i.ToString());

可以输出下面的结果:
ab
ab
ab

第三种方法:
除了以上的这两种方法以外,第三种方法是使用正则表达式。新建一个控制台项目。
然后先添加 using System.Text.RegularExpressions;

using System.Text.RegularExpressions
string content=agcsmallmacsmallgggsmallytx;
string[] resultString=Regex.Split(content,small,RegexOptions.IgnoreCase)
foreach(string iin resultString)
     Console.WriteLine(i.ToString());

输出下面的结果:
agc
 mac
 ggg
ytx

第四种方法:

 string str1="我*****是*****一*****个*****教*****师";
string[] str2; str1=str1.Replace("*****","*");
str2=str1.Split(’*‘);foreach(string i in str2)
Console.WriteLine(i.ToString());



第五种方法:
string str1=”我**是*****一*****个*****教*****师“;
我希望显示的结果为:我是一个教师。 我如果采用上面的第四种方法来做就会产生下面的错误:我 是一个教师。中间有空格输出,所以输出结果并不是希望的结果,这就又回到了正则表达式了,这时可以采用下面的第五种方法:

string str1=‘我**是*****一*****个*****教*****师“;
string[] str2=System.Text.RegularExpressions.Regex.Split(str1,@[*]+);
foreach(string iin str2)
Console.WriteLine(i.ToString());

这里通过[*]+ 巧妙的完成了我们的目标。

三、substring方法

java字符串分解 substring用法


单参数形式:
substring(int beginIndex)
该子字符串从beginIndex处的字符开始,直到此字符串末尾。


双参数形式:
substring(int beginIndex, int endIndex)
该子字符串从指定的 beginIndex 处开始,直到索引 endIndex – 1 处的字符。注意:其它一些语言第二个参数往往代表长度,JAVA不一样。该子字符串的长度为 endIndex-beginIndex。


String a = "www.ooobj.com";


03 System.out.println(a);


04 String b = a.substring(2);


05 System.out.println(b);


06 String c = a.substring(1,10);


07 System.out.println(c);


08 String d = a.substring(6, a.length());


 

09 System.out.println(d);

 

输出:

www.ooobj.com
w.ooobj.com
ww.ooobj.
obj.com

注:beginIndex不能为负数,endIndex不能超出字符串长度,否则会抛出StringIndexOutOfBoundsException异常

四,Js的substring()

语法:

程序代码
String.substring(start, end)

说明:
返回一个从start开始到end(不包含end)的子字符串。

示例:

程序代码
var str="abcdefgh";
document.write(str.substring(0,1));//return:a
document.write(str.substring(2,5));//return:cde
document.write(str.substring(7,8));//return:h

js的substring()方法与java的比较相似,但js的substring()需要注意一下几点:

1.start不一定就是第一个参数,end也不一定就是第二个参数,substring(3,1)时,开始位置是1,结束位置是3;
2.当要返回的子字符串是从开始位置到结束时,end的值必须大于等于字符串的长度,如上边的str.substring(7,8),按照索引从0开始算的话end的最大值为7,但这边却用8,当然,使用大于8的数返回的结果也是一样的.