2.1实验环境:
2.1.1环境配置:
安装LLVM 10.0.1
:
- ##llvm10.0.1安装
- wget https://github.com/llvm/llvm-project/archive/llvmorg-10.0.1.tar.gz
- tar -zxvf llvmorg-10.0.1.tar.gz
- cd llvm-project
- mkdir build
- cd build
- cmake -DCMAKE_BUILD_TYPE=Release -DLLVM_ENABLE_PROJECTS="clang" -G "Unix Makefiles" -DCMAKE_INSTALL_PREFIX=llvm_install_dir ../llvm
- make -j 4 ##4为编译运行时的线程数
- sudo make install
- ##若未安装到默认目录当中,需要在~/.bashrc当中添加路径:
- sudo gedit ~/.bashrc
- ##在文本末尾添加:
- export PATH="$PATH:llvm_install_dir/bin"
- ##更新shell:
- source ~/.bashrc
安装完环境后,在实验框架目录下执行以下指令编译运行:
- mkdir build
- cd build
- cmake ..
- make
若能够编译成功,你将在build
目录下见到LivenessPass.so
。 之后在test目录下运行./auto.sh test01
得到以下输出:
- Running Liveness on main
- BitVec map:
- Liveness Analysis Result:
- %retval = alloca i32, align 4: [ --> ]
- %a = alloca i32, align 4: [ --> ]
- %b = alloca i32, align 4: [ --> ]
- %c = alloca i32, align 4: [ --> ]
- %d = alloca i32, align 4: [ --> ]
- store i32 0, i32* %retval, align 4: [ --> ]
- %0 = load i32, i32* %a, align 4: [ --> ]
- %1 = load i32, i32* %b, align 4: [ --> ]
- %add = add nsw i32 %0, %1: [ --> ]
- store i32 %add, i32* %d, align 4: [ --> ]
- %2 = load i32, i32* %d, align 4: [ --> ]
- store i32 %2, i32* %b, align 4: [ --> ]
- %3 = load i32, i32* %a, align 4: [ --> ]
- store i32 %3, i32* %c, align 4: [ --> ]
- ret i32 0: [ --> ]
2.1.2环境情况:
Ubuntu:
Linux:
Llvm:
2.2 flowIn实现:
2.2.1文件框架:
// Inst:当前处理的Inst; InVec:当前处理的Inst的前一轮分析的Input Bitvector
void LivenessPass::flowIn(Instruction *Inst, BitVector InVec) {
///TODO 将所有上一个Inst(由于是后向分析,所以是当前Inst的后继Inst)的Output Bitvector进行join操作作为当前Inst的Input Bitvector
auto successors = getSuccessors(Inst);
BitVector InputVec = InVec;
// 遍历后继指令,并进行合并操作
for (auto successor : successors) {
BitVector OutputVec = OUTSet[successor];
InputVec |= OutputVec;
}
INSet[Inst] = InputVec;
// 将合并后的结果设置为当前指令的输入位向量
}
- LivenessPass::flowIn(Instruction *Inst, BitVector InVec):
这是一个成员函数,用于计算指定指令 Inst 的输入位向量 InVec。输入位向量 InVec 表示在 Inst 执行之前活跃的变量集合。函数的目标是将所有 Inst 的后继指令的输出位向量进行合并(join操作),得到 Inst 的输入位向量。
- auto successors = getSuccessors(Inst);:
获取 Inst 的所有后继指令。在控制流图中,后继指令是指在控制流中直接跟随 Inst 的指令。
- BitVector InputVec = InVec;:
创建了一个新的位向量 InputVec,它是 InVec 的副本,用于存储 Inst 的最终输入位向量。
- for (auto successor : successors) { ... }:
这个循环遍历 Inst 的所有后继指令。对于每个后继指令,它获取其输出位向量 OutputVec,这是在 successor 执行之后活跃的变量集合。
- InputVec |= OutputVec;:
执行位向量的逻辑或操作,将 OutputVec 合并到 InputVec 中。合并操作是将所有后继指令的输出位向量合并到当前指令的输入位向量中,表示这些变量在 Inst 执行之前也是活跃的。
- INSet[Inst] = InputVec;:
计算得到的输入位向量 InputVec 存储在 INSet 映射中,INSet 用于存储每个指令的输入位向量。
- bool bitVectorsEqual(const BitVector& vec1, const BitVector& vec2):
用于比较两个位向量是否相等。它首先检查两个位向量的长度是否相同,如果不同,则它们不相等。然后,它遍历位向量的每个位,如果发现任何不匹配的位,则返回 false。如果所有位都匹配,则返回 true
2.3 flowOut实现 :
void LivenessPass::flowOut(Instruction *Inst, BitVector Pre, BitVector Post){
///TODO
//判断当前输出的Output Bitvector和上一轮迭代的Output Bitvector是否一致,
//如果不一致就将当前Inst的所有下一个Inst(由于是后向分析,所以是当前Inst的前继Inst)加入InstVector当中
if(bitVectorsEqual(Pre,Post) )
{
//Pass;
}
else{
auto nextnodes = getPredecessors(Inst);
for(auto eachnodes : nextnodes)
InstVector.push_back(eachnodes);
}
OUTSet[Inst] = Post;//?
}
- void LivenessPass::flowOut(Instruction *Inst, BitVector Pre, BitVector Post):
这个成员函数接受三个参数:Inst 是当前正在处理的指令,Pre 是指令执行前的位向量(即输入位向量),Post 是指令执行后的位向量(即输出位向量)。
- if(bitVectorsEqual(Pre, Post)):
用于检查当前指令的输出位向量 Post 是否与上一轮迭代的输出位向量 Pre 相同。如果它们相同,说明对于当前指令的输出位向量没有新的信息,因此不需要进行任何操作。
- else:
如果输出位向量发生了变化,即 Pre 和 Post 不相同,那么需要更新依赖于当前指令的其他指令的活性信息。
- auto nextnodes = getPredecessors(Inst); 获取当前指令的所有前继指令。
- for(auto eachnodes : nextnodes) InstVector.push_back(eachnodes); 将这些前继指令加入到 InstVector 中,这是一个待处理的指令列表,用于后续的迭代。
- OUTSet[Inst] = Post;:
更新当前指令 Inst 的输出位向量 OUTSet 为新的值 Post。OUTSet 是一个映射,用于存储每个指令的输出位向量。
2.4 transfer实现:
BitVector LivenessPass::transfer(Instruction *Inst) {// 实现活跃变量分析的转移函数
// 初始化Use和Def集合
BitVector Use = BitVector(InstCounter, false);
BitVector Def = BitVector(InstCounter, false);
// 根据指令类型进行分类处理
if (auto *BinOp = dyn_cast<BinaryOperator>(Inst)) {
Value *Operand0 = BinOp;
Value *Operand1 = BinOp->getOperand(0);
Value *Operand2 = BinOp->getOperand(1);
Def[InstBitMap[Operand0]] = true;
if (!isImmutable(Operand1))
Use[InstBitMap[Operand1]] = true;
if (!isImmutable(Operand2))
Use[InstBitMap[Operand2]] = true;
} else if (auto *Load = dyn_cast<LoadInst>(Inst)) {
Value *Operand0 = Load;
Value *Operand1 = Load->getOperand(0);
Def[InstBitMap[Operand0]] = true;
if (!isImmutable(Operand1))
Use[InstBitMap[Operand1]] = true;
} else if (auto *Store = dyn_cast<StoreInst>(Inst)) {
Value *Operand0 = Store->getOperand(0);
Value *Operand1 = Store->getOperand(1);
Def[InstBitMap[Operand1]] = true;
if (!isImmutable(Operand0))
Use[InstBitMap[Operand0]] = true;
} else if (auto *Alloc = dyn_cast<AllocaInst>(Inst)) {
Value *Operand0 = Alloc;
Def[InstBitMap[Operand0]] = true;
} else if (auto *Cmp = dyn_cast<ICmpInst>(Inst)) {
Value *Operand0 = Cmp;
Value *Operand1 = Cmp->getOperand(0);
Value *Operand2 = Cmp->getOperand(1);
Def[InstBitMap[Operand0]] = true;
if (!isImmutable(Operand1))
Use[InstBitMap[Operand1]] = true;
if (!isImmutable(Operand2))
Use[InstBitMap[Operand2]] = true;
}
// 计算输出活跃变量集合
BitVector Out = BitVector(InstCounter, false);
BitVector Temp = INSet[Inst];
for (int i = 0; i < Temp.size(); ++i) {
if (Def[i])
Temp[i] = false;
}
for (int i = 0; i < Use.size(); ++i) {
if (Use[i] || Temp[i])
Out[i] = true;
}
return Out;
}
这段代码是一个活跃变量分析(Liveness Analysis)的迁移函数transfer的实现。迁移函数用于计算在执行当前指令后,哪些变量是活跃的。活跃变量是指在指令执行后仍然有效的变量,它们可能是使用(Use)或定义(Def)的变量。
代码的主要部分是针对不同类型的指令(二元运算符、加载指令、存储指令、内存分配指令、比较指令)的分支处理。对于每种类型的指令,代码会更新Use和Def集合,然后使用这些集合来计算输出活跃变量集合。
- BitVector Use = BitVector(InstCounter, false); 和 BitVector Def = BitVector(InstCounter, false);:
这两行代码初始化了两个位向量 Use 和 Def,它们分别用于表示指令的“使用”集合和“定义”集合。InstCounter 是指令的数量,用于确定位向量的长度。初始化时,位向量的所有位都设置为 false。
- if (auto *BinOp = dyn_cast<BinaryOperator>(Inst)) { ... }:
这段代码处理二元运算符指令。dyn_cast 是一个类型转换函数,用于安全地将指令转换为 BinaryOperator 类型。如果转换成功,说明当前指令是一条二元运算符指令。
对于二元运算符,它的结果(Operand0)被加入到 Def 集合中,表示这个指令定义了结果值。如果操作数(Operand1 和 Operand2)不是不可变的(isImmutable 返回 false),则它们被加入到 Use 集合中,表示这些操作数被使用了。
- else if (auto *Load = dyn_cast<LoadInst>(Inst)) { ... }:
这段代码处理加载指令(Load)。加载指令的结果被加入到 Def 集合中,表示这个指令定义了加载的值。加载指令的源操作数(Operand1)如果是可变的,则被加入到 Use 集合中。
- else if (auto *Store = dyn_cast<StoreInst>(Inst)) { ... }:
处理存储指令(Store)。存储指令的目标操作数(Operand1)被加入到 Def 集合中,表示这个指令定义了存储的目标。存储指令的源操作数(Operand0)如果是可变的,则被加入到 Use 集合中。
- else if (auto *Alloc = dyn_cast<AllocaInst>(Inst)) { ... }:
处理分配指令(Alloca)。
分配指令的结果被加入到 Def 集合中,表示这个指令定义了分配的内存。
- else if (auto *Cmp = dyn_cast<ICmpInst>(Inst)) { ... }:
处理比较指令(ICmp)。
比较指令的结果被加入到 Def 集合中,表示这个指令定义了比较的结果。
比较指令的操作数(Operand1 和 Operand2)如果是可变的,则被加入到 Use 集合中。
- BitVector Out = BitVector(InstCounter, false);:
初始化了输出位向量 Out,它将用于存储当前指令执行后的活跃变量集合。
- BitVector Temp = INSet[Inst];:
获取了当前指令的输入位向量 INSet[Inst],并将其存储在临时位向量 Temp 中。
- for (int i = 0; i < Temp.size(); ++i) { ... }:
遍历临时位向量 Temp,如果某个位在 Def 集合中为 true,则将该位在 Temp 中设置为 false。
这是因为如果一个变量在当前指令中被定义,那么它之前的活跃状态就不重要了。
- for (int i = 0; i < Use.size(); ++i) { ... }:
遍历 Use 集合,如果某个位在 Use 集合中为 true 或者该位在 Temp 中为 true,则将该位在 Out 中设置为 true。
这表示这个变量在当前指令执行后仍然是活跃的。
- return Out;:
最后,返回输出位向量 Out,它表示当前指令执行后的活跃变量集合。
2.5 InstAnalysis实现:
初次尝试:
结果:
更新后,成功!:
void LivenessPass::InstAnalysis() {
///TODO
///基于实现基本的WorkList循环,使用你刚刚实现的flowIn, flowOut, transfer函数实现活跃变量分析
while (!InstVector.empty())
{
auto instruction = *InstVector.begin(); // 获取指向 Value* 的指针,注意*号,否则返回的是迭代器
Instruction *Inst = dyn_cast<Instruction>(instruction);
InstVector.erase(InstVector.begin());
if (Inst) // 确保转换成功
{
BitVector Pre = OUTSet[instruction];
flowIn(Inst, INSet[instruction]);
OUTSet[instruction] = transfer(Inst); //transfer函数导致段错误
flowOut(Inst, Pre, OUTSet[instruction]);
}
代码解释如下:
- void LivenessPass::InstAnalysis():
成员函数,用于执行活跃变量分析。
- for (auto instIterator = InstVector.begin(); instIterator != InstVector.end(); ):
遍历指令集合 InstVector。
InstVector 是一个待处理的指令列表,包含了在活跃变量分析中需要考虑的指令。
- Instruction *Inst = dyn_cast<Instruction>(*instIterator);:
尝试将迭代器指向的元素转换为 Instruction 类型的指针。
dyn_cast 是一个类型转换函数,用于安全地将迭代器指向的元素转换为 Instruction 类型。
- instIterator = InstVector.erase(instIterator);:
如果转换成功,这行代码从 InstVector 中移除当前指令。
移除操作通常发生在指令被处理后,以确保在后续迭代中不会重复处理同一个指令。
- if (Inst) // 确保转换成功:
用于确保转换成功,即当前迭代器指向的元素确实是一个指令。
- BitVector &preOut = OUTSet[Inst];:
获取当前指令的输出位向量 preOut。
OUTSet 是一个映射,用于存储每个指令的输出位向量。
- flowIn(Inst, INSet[Inst]);:
调用 flowIn 函数,计算当前指令的输入位向量。
INSet 是一个映射,用于存储每个指令的输入位向量。
- OUTSet[Inst] = transfer(Inst);:
更新当前指令的输出位向量。
transfer 函数用于计算指令的输出位向量,即在该指令执行后活跃的变量集合。
- flowOut(Inst, preOut, OUTSet[Inst]);:
调用 flowOut 函数,计算当前指令的前继指令的输出位向量。
preOut 是当前指令在执行前的输出位向量,OUTSet[Inst] 是当前指令在执行后的输出位向量。