在Java中怎样用split分割字符串

在Java中的我们常常会利用split把字符串按照指定的分割符进行分割，然后返回字符串数组，下面是string.split的用法实例及注意事项：

public class StringSplit {

public static void main(String[] args) {

String sourceStr = "1,2,3,4,5";

String[] sourceStrArray = sourceStr.split(",");

for (int i = 0; i < sourceStrArray.length; i++) {

System.out.println(sourceStrArray[i]);

}

// 最多分割出3个字符串

int maxSplit = 3;

sourceStrArray = sourceStr.split(",", maxSplit);

for (int i = 0; i < sourceStrArray.length; i++) {

System.out.println(sourceStrArray[i]);

}

输出结果：

输出结果

split 的实现直接调用的 matcher 类的 split 的方法。在使用String.split方法分隔字符串时，分隔符如果用到一些特殊字符，可能会得不到我们预期的结果。在正则表达式中有特殊的含义的字符，我们使用的时候必须进行转义，示例：

public class StringSplit {

public static void main(String[] args) {

String value = "192.168.128.33";

// 注意要加\\,要不出不来,yeah

String[] names = value.split("\\.");

for (int i = 0; i < names.length; i++) {

System.out.println(names[i]);

}

split分隔符总结

1.字符"|","*","+"都得加上转义字符，前面加上"\\"。2.而如果是"\"，那么就得写成"\\\\"。3.如果一个字符串中有多个分隔符，可以用"|"作为连字符。

比如：String str = "Java string-split#test",可以用Str.split(" |-|#")把每个字符串分开。这样就把字符串分成了3个子字符串。

java.util.Tokenizer JDK 1.0 or later

StringTokenizer

StringTokenizer 类允许应用程序将字符串分解为标记。StringTokenizer 是出于兼容性的原因而被保留的遗留类（虽然在新代码中并不鼓励使用它）。建议所有寻求此功能的人使用 String 的 split 方法或 java.util.regex 包。

代码示例

public class StringSplit {

public static void main(String[] args) {

String ip = "192.168.128.33";

StringTokenizer token=new StringTokenizer(ip,".");

while(token.hasMoreElements()){

System.out.print(token.nextToken()+" ");

}

但是StringTokenizer对于字符串"192.168..33"的分割，返回的字符串数组只有3个元素，对于两个分隔符之间的空字符串会忽略，这个要慎重使用。

但是String.split（String.split是用正则表达式匹配，所以不使用KMP字符串匹配算法）用的都是按顺序遍历的算法，时间复杂度O(m*n)，较高，所以性能上，StringTokenizer好很多，对于频繁使用字符串分割的应用，例如etl数据处理，使用StringTokenizer性能可以提高很多。

此外，分享一下使用String.split方法时要注意的问题

在使用String.split方法分隔字符串时，分隔符如果用到一些特殊字符，可能会得不到我们预期的结果。

我们看jdk doc中说明

public String[] split(String regex)

Splits this string around matches of the given regular expression.

参数regex是一个 regular-expression的匹配模式而不是一个简单的String，他对一些特殊的字符可能会出现你预想不到的结果，比如测试下面的代码：

用竖线 | 分隔字符串，你将得不到预期的结果

用竖 * 分隔字符串运行将抛出java.util.regex.PatternSyntaxException异常，用加号 + 也是如此。

String[] aa = "aaa*bbb*ccc".split("*");
//String[] aa = "aaa|bbb|ccc".split("\\*"); 这样才能得到正确的字符串结果

显然，+ * 不是有效的模式匹配规则表达式，用"\\*" "\\+"转义后即可得到正确的字符串结果。

"|" 分隔串时虽然能够执行，但是却不是预期的目的，得到的是每个字符的分割，而不是字符串，"\\|"转义后即可得到正确的字符串结果。

还有如果想在串中使用"\"字符，则也需要转义.首先要表达"aaaa\bbbb"这个串就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果：

String[] aa = "aaa\\bbb\\bccc".split("\\\\");

注意当用"."分隔的时候, 要用"[.]" 进行分隔!

PS：JAVA新手交流群：457036818，欢迎大家来交流JAVA相关问题

PS：JAVA新手交流群：457036818，希望能一起交流一下JAVA方面的知识

秒客网

在Java中怎样用split分割字符串

相关文章