Golang中文字符串截取函数实现原理

时间:2021-11-28 03:46:53

在golang中可以通过切片截取一个数组或字符串,但是当截取的字符串是中文时,可能会出现的问题是:由于中文一个字不只是由一个字节组成,所以直接通过切片可能会把一个中文字的编码截成两半,结果导致最后一个字符是乱码。

例如:

想要截取前四个字

?
1
2
name := "我是胡八一"
fmt.Println("name[:4] = ",name[:4])

执行后得到的结果会是这样的:

?
1
name[:4] = 我?

解决方法:
先将其转为[]rune,再截取后,转会string

?
1
2
nameRune := []rune(name)
fmt.Println("string(nameRune[:4]) = ",string(nameRune[:4]))

运行结果:

string(nameRune[:4]) =  我是胡八

好了弄懂了原理我们来写一个完整的Golang中文字符串截取函数

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
func SubString(str string, begin, length int) string {
  fmt.Println("Substring =", str)
  rs := []rune(str)
  lth := len(rs)
  fmt.Printf("begin=%d, end=%d, lth=%d\n", begin, length, lth)
  if begin < 0 {
    begin = 0
  }
  if begin >= lth {
    begin = lth
  }
  end := begin + length
 
  if end > lth {
    end = lth
  }
  fmt.Printf("begin=%d, end=%d, lth=%d\n", begin, length, lth)
  return string(rs[begin:end])
}

实现Golang中文字符串截取函数很简单利用golang原理语句就可实现