编译器开发系列--Ocelot语言4.类型定义的检查

时间:2025-04-09 23:03:25

这里主要介绍一下检查循环定义的结构体、联合体。是对成员中包含自己本身的结构体、联合体进行检查。所谓“成员中包含自己本身”,举例来说,就是指下面这样的定义。

struct point {
struct point p;
};

这里所说的“成员中包含自己本身”是指直接包含自己本身,通过指针来应用自己本身是没有问题的。例如刚才的例子,如果是下面这样的话就没有问题了。

struct point {
struct point *ptr;
};

刚才的例子中存在直接的循环定义,因此一眼就能看出来。还有如下所示的间接循环定义的情况,也需要注意。

struct point_x {
struct point_y y;
}; typedef struct point_x my_point_x; struct point_y {
my_point_x x;
};

上述例子中还夹杂着使用typedef 定义的类型,因此调查起来更为繁琐。

检查“循环定义的类型”的方法。进行这样的类型检查需要将类型定义的整体当作图(graph)来思考。

将类型的定义抽象为图时,可以将类型作为节点,将该类型对其他类型的引用作为边。例如结构体的定义,将该结构体的类型作为节点,向成员的类型的节点连接一条边。使用typedef 的情况下,将新定义的类型作为节点,向原来的类型节点引一条边。

再来看一个例子。现在假设有如下所示的定义。

struct st {
struct point pnt;
long len;
}; typedef unsigned int uint; struct point {
uint x;
uint y;
};

将上述定义转化为图,如图10.2 所示。

编译器开发系列--Ocelot语言4.类型定义的检查

如果发生循环定义,那么在生成类型定义的图时,图中某处必定存在闭环。循环定义情况下的图如图10.3 所示。

编译器开发系列--Ocelot语言4.类型定义的检查

可见图中存在闭环。检查是否存在循环定义,只需检查类型定义的图中是否存在闭环即可

检测有向图中的闭环的算法

因为边存在方向性,所以类型定义的图属于有向图。要检测有向图中是否存在闭环,可以使用如下算法。

1. 选择任意一个节点(类型)并标注为“查找中”
2. 沿着边依次访问所有与该节点相邻的节点
3. 如果访问到的节点没有标注任何状态,则将该节点标注为“查找中”;如果标注了“查找结束”,则不做任何处理,返回之前的节点;如果已经标注为“查找中”,则说明存在闭环
4. 从当前的节点重复步骤2 和3,如果已经没有可访问的相邻节点,则将该节点标注为“查找结束”,并沿原路返回
5. 按照上述流程对所有节点进行处理,如果查找过程中没有遇到“查找中”状态的节点,就说明不存在闭环

上述算法中使用了“有向图的深度优先检索”来检测闭环。简单地说,该算法的概要就是“只要节点有未访问的相邻节点就试着访问,调查是否会回到原来的节点”。从算法执行过程中的某一时刻来看,就是在为从起始节点到某一节点的路径上的所有节点标注上“查找中”的状态。

具体算法如下:

    protected void checkRecursiveDefinition(Type t, ErrorHandler h) {
_checkRecursiveDefinition(t, new HashMap<Type, Object>(), h);
} static final protected Object checking = new Object();
static final protected Object checked = new Object(); /*结构体、联合体的循环定义检查
* 结构体、联合体、数组、typedef 所定义的类型以外的类型只有整数类型和指针,因此除
了上述4 个类型以外,其他情况下都不可能出现边。包含某类型的指针的情况下,因为不会产
生循环依赖,所以不会有问题。
算法说明中的“标注状态”的实现方式是“将Type 对象和它的状态作为一组保存在
Map 对象marks 中”,这是上述算法的重点。
*/
protected void _checkRecursiveDefinition(Type t,
Map<Type, Object> marks,
ErrorHandler h) {
/*
* 如果t 的状态为“查找中”,输出错误并return
*/
if (marks.get(t) == checking) {
h.error(((NamedType)t).location(),
"recursive type definition: " + t);
return;
}
/*
* t 的状态为“查找结束”
*/
else if (marks.get(t) == checked) {
return;
}
/*
* 访问的节点还没有被标注状态。
* 将t 标注为“查找中”,
* 访问所有和t 相邻的节点(调用_checkRecursiveDefinition),
* 将t 标注为“查找结束”。
*/
else {
marks.put(t, checking);
if (t instanceof CompositeType) {
CompositeType ct = (CompositeType)t;
for (Slot s : ct.members()) {
_checkRecursiveDefinition(s.type(), marks, h);
}
}
else if (t instanceof ArrayType) {
ArrayType at = (ArrayType)t;
_checkRecursiveDefinition(at.baseType(), marks, h);
}
else if (t instanceof UserType) {
UserType ut = (UserType)t;
_checkRecursiveDefinition(ut.realType(), marks, h);
}
marks.put(t, checked);
}
}