在golang中可以通过切片截取一个数组或字符串,但是当截取的字符串是中文时,可能会出现的问题是:由于中文一个字不只是由一个字节组成,所以直接通过切片可能会把一个中文字的编码截成两半,结果导致最后一个字符是乱码。
例如:
想要截取前四个字
1
2
|
name := "我是胡八一"
fmt.Println( "name[:4] = " ,name[:4])
|
执行后得到的结果会是这样的:
1
|
name[: 4 ] = 我?
|
解决方法:
先将其转为[]rune,再截取后,转会string
1
2
|
nameRune := []rune(name)
fmt.Println("string(nameRune[:4]) = ",string(nameRune[:4]))
|
运行结果:
string(nameRune[:4]) = 我是胡八
好了弄懂了原理我们来写一个完整的Golang中文字符串截取函数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
func SubString( str string, begin, length int ) string {
fmt.Println( "Substring =" , str )
rs : = []rune( str )
lth : = len (rs)
fmt.Printf( "begin=%d, end=%d, lth=%d\n" , begin, length, lth)
if begin < 0 {
begin = 0
}
if begin > = lth {
begin = lth
}
end : = begin + length
if end > lth {
end = lth
}
fmt.Printf( "begin=%d, end=%d, lth=%d\n" , begin, length, lth)
return string(rs[begin:end])
}
|
实现Golang中文字符串截取函数很简单利用golang原理语句就可实现