struct
struct定义结构,结构由字段(field)组成,每个field都有所属数据类型,在一个struct中,每个字段名都必须唯一。
说白了就是拿来存储数据的,只不过可自定义化的程度很高,用法很灵活,Go中不少功能依赖于结构,就这样一个角色。
Go中不支持面向对象,面向对象中描述事物的类的重担由struct来挑。比如面向对象中的继承,可以使用组合(composite)来实现:struct中嵌套一个(或多个)类型。面向对象中父类与子类、类与对象的关系是is a
的关系,例如Horse is a Animal
,Go中的组合则是外部struct与内部struct的关系、struct实例与struct的关系,它们是has a
的关系。Go中通过struct的composite,可以"模仿"很多面向对象中的行为,它们很"像"。
定义struct
定义struct的格式如下:
type identifier struct {
field1 type1
field2 type2
…
}
// 或者
type T struct { a, b int }
理论上,每个字段都是有具有唯一性的名字的,但如果确定某个字段不会被使用,可以将其名称定义为空标识符_
来丢弃掉:
type T struct {
_ string
a int
}
每个字段都有类型,可以是任意类型,包括内置简单数据类型、其它自定义的struct类型、当前struct类型本身、接口、函数、channel等等。
如果某几个字段类型相同,可以缩写在同一行:
type mytype struct {
a,b int
c string
}
构造struct实例
定义了struct,就表示定义了一个数据结构,或者说数据类型,也或者说定义了一个类。总而言之,定义了struct,就具备了成员属性,就可以作为一个抽象的模板,可以根据这个抽象模板生成具体的实例,也就是所谓的"对象"。
例如:
type person struct{
name string
age int
}
// 初始化一个person实例
var p person
这里的p就是一个具体的person实例,它根据抽象的模板person构造而出,具有具体的属性name和age的值,虽然初始化时它的各个字段都是0值。换句话说,p是一个具体的人。
struct初始化时,会做默认的赋0初始化,会给它的每个字段根据它们的数据类型赋予对应的0值。例如int类型是数值0,string类型是"",引用类型是nil等。
因为p已经是初始化person之后的实例了,它已经具备了实实在在存在的属性(即字段),所以可以直接访问它的各个属性。这里通过访问属性的方式p.FIELD
为各个字段进行赋值。
// 为person实例的属性赋值,定义具体的person
p.name = "longshuai"
p.age = 23
获取某个属性的值:
fmt.Println(p.name) // 输出"longshuai"
也可以直接赋值定义struct的属性来生成struct的实例,它会根据值推断出p的类型。
var p = person{name:"longshuai",age:23}
p := person{name:"longshuai",age:23}
// 不给定名称赋值,必须按字段顺序
p := person{"longshuai",23}
p := person{age:23}
p.name = "longshuai"
如果struct的属性分行赋值,则必须不能省略每个字段后面的逗号",",否则就会报错。这为未来移除、添加属性都带来方便:
p := person{
name:"longshuai",
age:23, // 这个逗号不能省略
}
除此之外,还可以使用new()函数或&TYPE{}
的方式来构造struct实例,它会为struct分配内存,为各个字段做好默认的赋0初始化。它们是等价的,都返回数据对象的指针给变量,实际上&TYPE{}
的底层会调用new()。
p := new(person)
p := &person{}
// 生成对象后,为属性赋值
p.name = "longshuai"
p.age = 23
使用&TYPE{}
的方式也可以初始化赋值,但new()不行:
p := &person{
name:"longshuai",
age:23,
}
选择new()还是选择&TYPE{}
的方式构造实例?完全随意,它们是等价的。但如果想要初始化时就赋值,可以考虑使用&TYPE{}
的方式。
struct的值和指针
下面三种方式都可以构造person struct的实例p:
p1 := person{}
p2 := &person{}
p3 := new(person)
但p1和p2、p3是不一样的,输出一下就知道了:
package main
import (
"fmt"
)
type person struct {
name string
age int
}
func main() {
p1 := person{}
p2 := &person{}
p3 := new(person)
fmt.Println(p1)
fmt.Println(p2)
fmt.Println(p3)
}
结果:
{ 0}
&{ 0}
&{ 0}
p1、p2、p3都是person struct的实例,但p2和p3是完全等价的,它们都指向实例的指针,指针中保存的是实例的地址,所以指针再指向实例,p1则是直接指向实例。这三个变量与person struct实例的指向关系如下:
变量名 指针 数据对象(实例)
-------------------------------
p1(addr) -------------> { 0}
p2 -----> ptr(addr) --> { 0}
p3 -----> ptr(addr) --> { 0}
所以p1和ptr(addr)保存的都是数据对象的地址,p2和p3则保存ptr(addr)的地址。通常,将指向指针的变量(p1、p2)直接称为指针,将直接指向数据对象的变量(p1)称为对象本身,因为指向数据对象的内容就是数据对象的地址,其中ptr(addr)和p1保存的都是实例对象的地址。
但尽管一个是数据对象值,一个是指针,它们都是数据对象的实例。也就是说,p1.name
和p2.name
都能访问对应实例的属性。
那var p4 *person
呢,它是什么?该语句表示p4是一个指针,它的指向对象是person类型的,但因为它是一个指针,它将初始化为nil,即表示没有指向目标。但已经明确表示了,p4所指向的是一个保存数据对象地址的指针。也就是说,目前为止,p4的指向关系如下:
p4 -> ptr(nil)
既然p4是一个指针,那么可以将&person{}
或new(person)
赋值给p4。
var p4 *person
p4 = &person{
name:"longshuai",
age:23,
}
fmt.Println(p4)
上面的代码将输出:
&{longshuai 23}
传值 or 传指针
Go函数给参数传递值的时候是以复制的方式进行的。
复制传值时,如果函数的参数是一个struct对象,将直接复制整个数据结构的副本传递给函数,这有两个问题:
- 函数内部无法修改传递给函数的原始数据结构,它修改的只是原始数据结构拷贝后的副本
- 如果传递的原始数据结构很大,完整地复制出一个副本开销并不小
所以,如果条件允许,应当给需要struct实例作为参数的函数传struct的指针。例如:
func add(p *person){...}
既然要传指针,那struct的指针何来?自然是通过&
符号来获取。分两种情况,创建成功和尚未创建的实例。
对于已经创建成功的struct实例p
,如果这个实例是一个值而非指针(即p->{person_fields}
),那么可以&p
来获取这个已存在的实例的指针,然后传递给函数,如add(&p)
。
对于尚未创建的struct实例,可以使用&person{}
或者new(person)
的方式直接生成实例的指针p,虽然是指针,但Go能自动解析成实例对象。然后将这个指针p传递给函数即可。如:
p1 := new(person)
p2 := &person{}
add(p1)
add(p2)
struct field的tag属性
在struct中,field除了名称和数据类型,还可以有一个tag属性。tag属性用于"注释"各个字段,除了reflect包,正常的程序中都无法使用这个tag属性。
type TagType struct { // tags
field1 bool "An important answer"
field2 string "The name of the thing"
field3 int "How much there are"
}
匿名字段和struct嵌套
struct中的字段可以不用给名称,这时称为匿名字段。匿名字段的名称强制和类型相同。例如:
type animal struct {
name string
age int
}
type Horse struct{
int
animal
sound string
}
上面的Horse中有两个匿名字段int
和animal
,它的名称和类型都是int和animal。等价于:
type Horse struct{
int int
animal animal
sound string
}
显然,上面Horse中嵌套了其它的struct(如animal)。其中animal称为内部struct,Horse称为外部struct。
以下是一个嵌套struct的简单示例:
package main
import (
"fmt"
)
type inner struct {
in1 int
in2 int
}
type outer struct {
ou1 int
ou2 int
int
inner
}
func main() {
o := new(outer)
o.ou1 = 1
o.ou2 = 2
o.int = 3
o.in1 = 4
o.in2 = 5
fmt.Println(o.ou1) // 1
fmt.Println(o.ou2) // 2
fmt.Println(o.int) // 3
fmt.Println(o.in1) // 4
fmt.Println(o.in2) // 5
}
上面的o
是outer struct的实例,但o
除了具有自己的显式字段ou1和ou2,还具备int字段和inner字段,它们都是嵌套字段。一被嵌套,内部struct的属性也将被外部struct获取,所以o.int
、o.in1
、o.in2
都属于o
。也就是说,外部struct has a 内部struct
,或者称为struct has a field
。
输出以下外部struct的内容就很清晰了:
fmt.Println(o) // 结果:&{1 2 3 {4 5}}
上面的outer实例,也可以直接赋值构建:
o := outer{1,2,3,inner{4,5}}
在赋值inner中的in1和in2时不能少了inner{}
,否则会认为in1、in2是直接属于outer,而非嵌套属于outer。
显然,struct的嵌套类似于面向对象的继承。只不过继承的关系模式是"子类 is a 父类",例如"轿车是一种汽车",而嵌套struct的关系模式是外部struct has a 内部struct
,正如上面示例中outer拥有inner
。而且,从上面的示例中可以看出,Go是支持"多重继承"的。
具名struct嵌套
前面所说的是在struct中以匿名的方式嵌套另一个struct,但也可以将嵌套的struct带上名称。
直接带名称嵌套struct时,不会再自动深入到嵌套struct中去查找属性和方法。想要访问内部struct属性时,必须带上该struct的名称。
例如:
type animal struct {
name string
age int
}
type Horse struct{
a animal
sound string
}
这时候,想要访问嵌套在Horse中animal的name属性,则只能通过h.a.name
的方式(h为Horse的实例对象),且访问h.name
时将直接报错,因为在Horse里找不到name属性。
嵌套struct的名称冲突问题
假如外部struct中的字段名和内部struct的字段名相同,会如何?
有以下两个名称冲突的规则:
- 外部struct覆盖内部struct的同名字段、同名方法
- 同级别的struct出现同名字段、方法将报错
第一个规则使得Go struct能够实现面向对象中的重写(override),而且可以重写字段、重写方法。
第二个规则使得同名属性不会出现歧义。例如:
type A struct {
a int
b int
}
type B struct {
b float32
c string
d string
}
type C struct {
A
B
a string
c string
}
var c C
按照规则(1),直属于C的a和c会分别覆盖A.a和B.c。可以直接使用c.a、c.c分别访问直属于C中的a、c字段,使用c.d或c.B.d都访问属于嵌套的B.d字段。如果想要访问内部struct中被覆盖的属性,可以c.A.a的方式访问。
按照规则(2),A和B在C中是同级别的嵌套结构,所以A.b和B.b是冲突的,将会报错,因为当调用c.b的时候不知道调用的是c.A.b还是c.B.b。
递归struct:嵌套自身
如果struct中嵌套的struct类型是自己的指针类型,可以用来生成特殊的数据结构:链表或二叉树(双端链表)。
例如,定义一个单链表数据结构,每个Node都指向下一个Node,最后一个Node指向空。
type Node struct {
data string
ri *Node
}
以下是链表结构示意图:
------|---- ------|---- ------|-----
| data | ri | --> | data | ri | --> | data | nil |
------|---- ------|---- ------|-----
如果给嵌套两个自己的指针,每个结构都有一个左指针和一个右指针,分别指向它的左边节点和右边节点,就形成了二叉树或双端链表数据结构。
二叉树的左右节点可以留空,可随时向其中加入某一边加入新节点(像节点加入到树中)。添加节点时,节点与节点之间的关系是父子关系。添加完成后,节点与节点之间的关系是父子关系或兄弟关系。
双端链表有所不同,添加新节点时必须让某节点的左节点和另一个节点的右节点关联。例如目前已有的链表节点A <-> C
,现在要将B节点加入到A和C的中间,即A<->B<->C
,那么A的右节点必须设置为B,B的左节点必须设置为A,B的右节点必须设置为C,C的左节点必须设置为B。也就是涉及了4次原子性操作,它们要么全设置成功,失败一个则链表被破坏。
例如,定义一个二叉树:
type Tree struct {
le *Tree
data string
ri *Tree
}
最初生成二叉树时,root节点没有任何指向。
// root节点:初始左右两端为空
root := new(Tree)
root.data = "root node"
随着节点增加,root节点开始指向其它左节点、右节点,这些节点还可以继续指向其它节点。向二叉树中添加节点的时候,只需将新生成的节点赋值给它前一个节点的le或ri字段即可。例如:
// 生成两个新节点:初始为空
newLeft := new(Tree)
newLeft.data = "left node"
newRight := &Tree{nil, "Right node", nil}
// 添加到树中
root.le = newLeft
root.ri = newRight
// 再添加一个新节点到newLeft节点的右节点
anotherNode := &Tree{nil, "another Node", nil}
newLeft.ri = anotherNode
简单输出这个树中的节点:
fmt.Println(root)
fmt.Println(newLeft)
fmt.Println(newRight)
输出结果:
&{0xc042062400 root node 0xc042062420}
&{<nil> left node 0xc042062440}
&{<nil> Right node <nil>}
当然,使用二叉树的时候,必须为二叉树结构设置相关的方法,例如添加节点、设置数据、删除节点等等。
另外需要注意的是,一定不要将某个新节点的左、右同时设置为树中已存在的节点,因为这样会让树结构封闭起来,这会破坏了二叉树的结构。