文章转载地址:https://www.flysnow.org/2018/10/20/golang-for-range-slice-map.html
如果我们要遍历某个数组,Map 集合、Slice 切片等,Go 语言(Golang) 为我们提供了比较好的 For Range 方式。
range 是一个关键字, 表示范围,和 for 配合使用可以迭代 数组、Map、Slice等集合,用法比较简洁,那么,这种
迭代方式和 for i=0;i<N;i++ 对比,性能怎么样呢?下面通过 Go 的基准测试对比一下两者的性能
For-Range 的基本使用
for range 的使用非常简单,这里演示两种集合类型的使用
package main import "fmt" func main() {
ages := []string{"10","20","30"} for i,age := range ages {
fmt.Println(i,age)
}
}
这里是针对 Slice 切片的迭代使用,使用 range 关键字返回两个变量 i,age ,第一个是 Slice 切片的索引,第二个
是 Slice 切片的内容,打印结果如下:
0 10
1 20
2 30
下面再看看 Map 的 for range 使用示例:
package main import "fmt" func main() {
ages:=map[string]int{"张三":15,"李四":20,"王武":36} for name,age:=range ages{
fmt.Println(name,age)
}
}
在使用for range迭代map的时候,返回的第一个变量是key,第二个变量是value,也就是我们例子中对应的name和ages
。我们运行程序看看输出结果:
张三 15
李四 20
王五 36
常规 For 循环对比
比如对于 Slice 切片,我们有两种迭代方式:一种是常规的for i:=0;i<N;i++的方式;一种是for range的方式,如下示例:
package main_test import "testing" const N = 1000 // 常规 for 迭代 slice
func ForSlice(s []string) {
len := len(s)
for i := 0; i < len; i++ {
_, _ = i,s[i]
}
} // for range 迭代 slice
func RangeForSlice(s []string) {
for i, v := range s {
_, _ = i, v
}
} // 初始化 slice
func initSlice() []string{
s := make([]string,N) for i := 0;i < N;i++ {
s[i] = "www.flysnow.org"
}
return s
} // 基准测试函数
func BenchmarkForSlice(b *testing.B) {
s := initSlice() b.ResetTimer()
for i := 0;i < b.N;i++ {
ForSlice(s)
}
} func BenchmarkRangeForSlice(b *testing.B) {
s := initSlice() b.ResetTimer()
for i := 0;i < b.N;i++ {
RangeForSlice(s)
}
}
输出结果如下:
goos: windows
goarch: amd64
BenchmarkForSlice-8 5000000 303 ns/op
BenchmarkRangeForSlice-8 3000000 512 ns/op
PASS
ok _/E_/GoProject/development/src 4.692s
从上面的输出结果可以看到,常规的 For 循环的性能更高。主要是因为 for range 是每次对循环元素的拷贝,而
for 循环,它获取集合内元素是通过 s[i],这种索引指针引用的方式,要比拷贝性能高得多
那么既然是元素拷贝的问题,我们在使用 range 方式迭代 slice 时候的目的也是为了获取元素,现在换一种方式实现 for range:
// for range 迭代 slice
func RangeForSlice(s []string) {
for i, _ := range s {
_, _ = i, s[i]
}
}
输出结果:
goos: windows
goarch: amd64
BenchmarkForSlice-8 5000000 303 ns/op
BenchmarkRangeForSlice-8 5000000 308 ns/op
PASS
ok _/E_/GoProject/development/src 4.218s
结果和常规的 for 循环一样。原因是我们通过 _ 舍弃了元素的复制,然后通过 s[i] 方式获取迭代的元素
Map 遍历
对于 map 来说,我们并不能使用 for i=0;i<N;i++ 的方式,大部分我们使用 for range 的方式:
package main_test import (
"fmt"
"testing"
) const N = 1000 // for range For map
func RangeForMap1(m map[int]string) {
for k, v := range m{
_,_ = k,v
}
} // 初始化 map
func initMap() map[int]string {
m := make(map[int]string,N) for i := 0;i < N;i++ {
m[i] = fmt.Sprint("www.flysnow.org",i)
} return m
} func BenchmarkRangeForMap1(b *testing.B) {
m := initMap() b.ResetTimer()
for i := 0; i < b.N; i++ {
RangeForMap1(m)
}
}
运行结果如下:
goos: windows
goarch: amd64
BenchmarkRangeForMap1-8 100000 14535 ns/op
PASS
ok _/E_/GoProject/development/src 2.333s
相比较 slice,Map 遍历的性能更差。现在,我们使用上面优化遍历 slice 的方式优化遍历 map,减少值拷贝,如下示例:
func RangeForMap2(m map[int]string) {
for k, _ := range m{
_,_ = k,m[k]
}
} func BenchmarkRangeForMap2(b *testing.B) {
m := initMap() b.ResetTimer()
for i := 0; i < b.N; i++ {
RangeForMap2(m)
}
}
运行结果如下:
goos: windows
goarch: amd64
BenchmarkRangeForMap1-8 100000 14290 ns/op
BenchmarkRangeForMap2-8 100000 22240 ns/op
PASS
ok _/E_/GoProject/development/src 4.929s
我们看到,优化后的结果性能明显下降了,这和我们上面测试 slice 不一样,这次没有提升反而下降了
For Range 原理
range for slice:
// The loop we generate:
// len_temp := len(range)
// range_temp := range
// for index_temp = 0; index_temp < len_temp; index_temp++ {
// value_temp = range_temp[index_temp]
// index = index_temp
// value = value_temp
// original body
// }
遍历 slice 前先是对要遍历的 slice 做一个拷贝,然后获取 slice 的长度作为循环次数,循环体中每次循环
会先获取元素值,我们还可以看到遍历过程中每次迭代都会对 index 和 value 进行赋值,如果数据量比较大或
者 value 为 string 时,对 value 的赋值操作可能是多余的,所以在上面我们使用 range 遍历 slice 的时候,可以
忽略 value,使用 slice[index] 的方式提升性能
range for map:
// The loop we generate:
// var hiter map_iteration_struct
// for mapiterinit(type, range, &hiter); hiter.key != nil; mapiternext(&hiter) {
// index_temp = *hiter.key
// value_temp = *hiter.val
// index = index_temp
// value = value_temp
// original body
// }
看上面的实现方式,结合我们使用 for range slice 的 _ 优化方式,我们可以看到看似减少了一次赋值操作,但
是通过 key 查找 value 的性能消耗高于赋值消耗,这就是为什么优化没有起到作用