概念:
- Java字符串就是Unicode字符序列, Java没有内置的字符串类型, 而是在标准Java类库中提供了一个预定义类.
每个用双引号括起来的字符串都是String类的一个实例.
String e = ""; // an empty string
String greeting = "Hello";
- 子串:
String类的substring方法可以从一个较大的字符串提取一个子串.
substring(a, b):
a: 截取字符串开始的index
b: 截取字符串结束的index, 但不包含b.
截取字符串的长度为b-a
String greeting = "Hello";
String s = greeting.substring(0,3); // Hel
- 拼接: +
字符串 + 非字符串 : 非字符串被转化为字符串.
任何一个Java对象都可以转换成字符串
- 不可变字符串:
String类没有提供用于直接修改字符串的方法, 如果需要改, 需对变量重新赋值(并不是修改了字符串, 而是变量重新引用了另一个字符串).
所以String类对象称为不可变字符串
例:
String greeting = "Hello";
greeting = greeting.substring(0, 3) + "p!" // Help!
- 检测字符串是否相等:
equals方法: s.equals(t), 返回true或者false
检测两个字符串是否相等而不区分大小写, 可以使用equalsIgnoreCase方法
== 只能确定两个字符串是否在同一个位置上, 但是不能判断不同位置上的内容相同字符串是否相同, 所以不能用来判断两个字符串是否相同.
- 空串与null串
空串""是长度为0的字符串, 是一个Java对象, 有自己的长度(0)和内容(空).
检查一个字符串是否为空: if (str.length() == 0) 或者 if (str.equals("") == 0)
null: String变量可以存放的一个特殊的值, 表示目前没有任何对象与该变量关联.
检查一个字符串既不是null也不为空串: if (str != null && str.length() != 0)
null值上不能调用方法, 所以要先检测String不为null.
- 代码点与代码单元
Java字符由char序列组成, char数据类型时一个采用UTF-16编码表示Unicode代码点的代码单元.
大多数的常用Unicode字符使用一个代码单元就可以表示, 而辅助字符需要一对的代码单元表示.
length方法将返回采用UTF-16表示的给定字符串所需要的代码单元数量, 而非我们所认为的字符的个数.
charAt方法返回的是指定位置的代码单元, 而非我们所认为的字符.
string.codePointCount(0, string.length()) 获取字符串中字符的个数.
string.codePointAt(i) 获取指定位置处的字符, 返回的是int而非char.
例:
String greeting = "Hello";
int n = greeting.length(); // is 5
int cpCount = greeting.codePointCount(0, greeting.length()); // is 5
char first = greeting.charAt(0); // is 'H'
char last = greeting.charAt(4); // is 'o'
要想得到第i个代码点, 应该使用下列语句.
int index = greeting.offsetByCodePoints(0, i);
int cp = greeting.codePointAt(index);
API:
- char charAt (int index)
返回给定位置的代码单元, 除非对底层的代码单元感兴趣, 否则不需要调用.
- int codePointAt(int index) 5.0
返回从给定位置开始或借宿的代码点.
- int offsetByCodePoints(int startIndex, int cpCount) 5.0
返回从startIndex代码点开始, 位移cpCount后的代码点索引.
- int compareTo(String other)
按照字典顺序, 如果字符串位于other之前, 返回一个负数; 如果字符串位于other之后, 返回一个整数, 如果两个字符串相等, 返回0.
- String substring(beginIndex, endIndex)(含头不含尾)
返回一个新字符串. 这个字符串包含原始字符串中从beginIndex到串尾或endIndex-1的所有代码单元.
- String trim()
返回一个新字符串, 这个字符串删除原始字符头部和尾部空格.
- boolean endsWith(String suffix)
如果字符串以suffix结尾, 返回true
- boolean equals(Object other)
如果字符串与other相等, 返回true
- boolean equalsIgnoreCase(String other)
如果字符串与other相等(忽略大小写), 返回true
- int indexOf(String str, int fromIndex)
- int indexOf(int cp, int fromIndex)
返回与字符串或代码点cp匹配的第一个子串的开始位置. 从位置从索引0或fromIndex开始计算. 如果在原始串中不存在str, 返回-1.
- int lastIndexOf(String str, int fromIndex)
- int lastIndexOf(int cp, int fromIndex)
返回与字符串或代码点cp匹配的最后一个子串的开始位置. 这个位置从原始串尾端或fromIndex开始计算.
- int length()
返回字符串的代码单元长度, 一般就是所见的字符串的长度, 但是如果有特殊两个代码单元的字符, 就不是字符串长度了.
- int codePointCount(int startIndex, int endIndx)
返回startIndex和endIndx-1之间的代码点数量, 没有配成对的代用字符将计入代码点.
- String replace(charSequence oldString, charSequence newString)
返回一个新字符串, 这个字符串用newString代替原始字符串中所有的oldString. 可以用String或StringBuilder对象作为charSequence参数.
- boolean startsWith(String prefix)
如果字符串以prefix字符串开始, 返回true
- String toLowerCase()
返回一个新字符串.这个字符串将原始字符串中所有大写字母改成了小写字母
- String toUpperCase()
返回一个新字符串.这个字符串将原始字符串中所有小写字母改成了大写字母
构建字符串:
由许多小的字符串构建一个字符串时
StringBuilder builder = new StringBuilder(); // 新建一个空字符串构造器
当每次添加一部分内容时, 就调用append方法.
builder.append(ch);
...
String completedString = builder.toString; // 用toString方法得到String对象
// StringSample .java package com.picc.sample.firstsample; public class StringSample { public static void main(String[] args) { String s1 = "abc"; String s2 = "aBc"; // A的Unicode码为65,a的Unicode码为97,所以A<a if(s1.compareTo(s2)>0) System.out.println("s1>s2"); if(s1.compareTo(s2)==0) System.out.println("s1==s2"); if(s1.compareTo(s2)<0) System.out.println("s1<s2"); } }