初步剖析C语言编程中的结构体

时间:2021-10-17 05:56:52

C语言结构体,可谓是C强大功能之一,也是C++语言之所以能衍生的有利条件,事实上,当结构体中成员中有函数指针了后,那么,结构体也即C++中的类了。

C语言中,结构体的声明、定义是用到关键字struct,就像联合体用到关键字union、枚举类型用到enum关键字一样,事实上,联合体、枚举类型的用法几乎是参照结构体来的。结构体的声明格式如下:

?
1
2
3
4
5
6
7
8
9
10
11
struct tag-name{
 
{
 
member 1;
 
 
member N;
 
};

因此,定义结构体变量的语句为:struct tag-name varible-name,如struct point pt;其中,point 为tag-name,pt是结构体struct point变量。当然,也可以一次性声明结构体类型和变量,即如下:struct tag-name {…} x,y,z;就类似于int x,y,z;语句一样。也可以在定义结构体变量时即赋初值,即变量初始化,struct point pt={320,200};

当然,也就可以有结构体指针、结构体数组了。访问结构体变量中的member的方法有:如果是由结构体变量名来访问,则是structure-variable-name.member;如果是由结构体变量指针来访问,则是structure-variable-pointer->member;

好了,上面的不是重点,也不难掌握,只是细节问题。结构体具有重要的应用,如下的:

如自引用的结构体,常用来作为二叉树等重要数据结构的实现:假设我们要实现一个普遍的问题的解决算法——统计某些输入的各单词出现的频数。由于输入的单词数是未知,内容未知,长度未知,我们不能对输入进行排序并采用二分查找。……那么,一种解决办法是:将已知的单词排序——通过将每个到达的单词排序到适当位置。当然,实现此功能不能通过线性排序,因为那样有可能很长,相应地,我们将使用二叉树来实现。该二叉树每一个单词为一个二叉树结点,每个结点包括:

  • a pointer to the text of the word
  • a count of the number of occurences
  • a pointer to the left child node
  • a pointer to the right child node

其写在程序中,即:

?
1
2
3
4
5
6
7
8
9
10
11
struct tnode{/*the tree node:*/
 
char *word;/*points to the next*/
 
int count;/*number of occurences*/
 
struct tnode *left;/*left child*/
 
struct tnode *right;/*right child*/
 
}

完成上述功能的完整程序如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
#include<stdio.h>
#include<ctype.h>
#include<string.h>
#include"tNode.h"
 
#define MAXWORD 100
struct tnode *addtree(struct tnode *,char *);
void treeprint(struct tnode *);
int getword(char *,int);
 
 
struct tnode *talloc(void);
char *strdup2(char *);
 
 
/*word frequency count*/
main()
{
  struct tnode *root;
  char word[MAXWORD];
 
  root=NULL;
  while(getword(word,MAXWORD)!=EOF)
    if(isalpha(word[0]))
      root=addtree(root,word);
  treeprint(root);
  return 0;
}
 
#define BUFSIZE 100
char buf[BUFSIZE];/*buffer for ungetch*/
int bufp=0;/*next free position in buf*/
 
int getch(void)/*get a (possibly pushed back) character*/
{
  return (bufp>0)? buf[--bufp]:getchar();
}
 
void ungetch(int c)/*push back character on input*/
{
  if(bufp>=BUFSIZE)
    printf("ungetch:too many characters\n");
  else
    buf[bufp++]=c;
}
 
/*getword:get next word or character from input*/
int getword(char *word,int lim)
{
  int c,getch(void);
  void ungetch(int);
  char *w=word;
 
  while(isspace(c=getch() ));
 
  if(c!=EOF)
    *w++=c;
  if(!isalpha(c)){
    *w='\0';
    return c;
  }
  for(;--lim>0;w++)
    if(!isalnum(*w=getch())){
      ungetch(*w);
      break;
    }
  *w='\0';
  return word[0];
}
 
 
/*addtree:add a node with w,at or below p*/
struct tnode *addtree(struct tnode *p,char *w)
{
  int cond;
 
  if(p==NULL){/*a new word has arrived*/
    p=talloc();/*make a new node*/
    p->word=strdup(w);
    p->count=1;
    p->left=p->right=NULL;
  }else if((cond=strcmp(w,p->word))==0)
    p->count++;/*repeated word*/
  else if(cond<0)/*less than into left subtree*/
    p->left=addtree(p->left,w);
  else  /*greater than into right subtree*/
    p->right=addtree(p->right,w);
  return p;
}
/*treeprint:in-order print of tree p*/
void treeprint(struct tnode *p)
{
  if(p!=NULL){
    treeprint(p->left);
    printf("%4d %s\n",p->count,p->word);
    treeprint(p->right);
  }
}
 
#include<stdlib.h>
/*talloc:make a tnode*/
struct tnode *talloc(void)
{
  return (struct tnode *)malloc(sizeof(struct tnode));
}
 
 
char *strdup2(char *s)/*make a duplicate of s*/
{
  char *p;
 
  p=(char *)malloc(strlen(s)+1);/*+1 for '\0'*/
  if(p!=NULL)
    strcpy(p,s);
  return p;
}

其中,其它的关于union、enum这里就不多说了,再说一个关于结构体的非常重要的应用——位操作:

当然,我们知道,对于位操作,我们可通过#define tables(即用宏和C中的位操作来实现)

如:

?
1
2
3
4
5
#define KEYWORD 01 /*0001*/
 
#define EXTERNAL 02 /*0010*/
 
#define STATIC 04   /*0100*/

?
1
enum{KEYWORD =01,EXTERNAL =02,STATIC =04};

那么,flags|=EXTERNAL|STATIC;将打开flags的EXTERNAL和STATIC位,而

flags&=~(EXTERNAL|STATIC);将关闭flags的EXTERNAL和STATIC位.

然而,上述定义的位模式可以用结构体如下写:

?
1
2
3
4
5
6
7
8
9
struct{
 
unsigned int is_keyword:1;
 
unsigned int is_extern:1;
 
unsigned int is_static:1;
 
}flags;/*This defines a variable called flags that contains three 1-bit fields*/

那么,上述打开相应位的操作为:

?
1
flags.is_extern=flags.is_static=1;

上述关闭相应位的操作为:

?
1
flags.is_extern=flags.is_static=0;