现在很多的程序都是多语言混合编程的,比如我司的产品,就是用C++/.net clr混合编制的。那么当我们调试这样的程序时,一定要注意,比如有时我们只看到c++的栈和名称,而.net clr的代码确看不到。比如
那要怎样才能看到.net clr的代码和栈呢,下面简单讲一下。
一、SOS.DLL
SOS 调试扩展 (SOS.dll) 通过提供有关内部公共语言运行时 (CLR) 环境的信息,帮助你在 Visual Studio 和 Windows 调试器 (WinDbg.exe) 中调试托管程序。 此工具需要你启用项目的非托管调试。 SOS.dll 自动随 .NET Framework 一起安装。 若要在 Visual Studio 中使用 SOS.dll,请安装 Windows 驱动程序工具包 (WDK)。SOS 调试扩展允许你查看有关在 CLR 内运行的代码的信息。 例如,可以使用 SOS 调试扩展显示有关托管堆的信息、查找堆损坏情况、显示运行时所使用的内部数据类型以及查看有关在运行时内运行的所有托管代码的信息。还可以通过将 SOS 调试扩展加载到 WinDbg.exe 调试器中并在 WinDbg.exe 中执行命令来使用此扩展。在调试托管代码时,有两个扩展DLL需要注意,它们分别是SOS和SOSEX。
1.1、在Windbg里加载SOS
在使用SOS之前,第一步就是要加载SOS。若要将 SOS 调试扩展加载到 WinDbg.exe 调试器中,请在工具中运行以下命令:
.loadby sos clr
.loadby sos clrjit
WinDbg.exe 和 Visual Studio 使用与当前使用的 Mscorwks.dll 版本对应的 SOS.dll 版本。 默认情况下,应使用与当前版本的 Mscorwks.dll 匹配的 SOS.dll 版本。若要使用在其他计算机上创建的转储文件,请确保该安装所附带的 Mscorwks.dll 文件存在于符号路径中,并加载相应的 SOS.dll 版本。
若要加载特定版本的 SOS.dll,请在 Windows 调试器中键入以下命令:.load <full path to sos.dll>
如果使用的.Net版本不同,那么还可以手动指定版本,如手动指定载入4.0版本命令:
.load C:/WINDOWS/Microsoft.NET/Framework/v2.0.50727/sos.dll
.load C:/WINDOWS/Microsoft.NET/Framework/v4.0.30319/sos.dll
如果是64位,那么应该加载如下sos.dll
.load C:/Windows/Microsoft.NET/Framework64/v2.0.50727/sos.dll
.load C:/Windows/Microsoft.NET/Framework64/v2.0.50727/sos.dll
SOS.dll 随 .NET Framework 安装在 %windir%\microsoft.net\framework\<.NET 版本> 目录下。
1.2、SOS扩展命令
语法
![command] [options]
命令
命令 | 说明 |
---|---|
AnalyzeOOM (ao) | 显示对垃圾回收堆进行分配请求时发生的最后一次内存不足 (OOM) 的信息。 (在服务器垃圾回收中,它将在每个垃圾回收堆上显示 OOM(如果有))。 |
BPMD [ -nofuturemodule] [<module name> <method name>] [ -md <MethodDesc >] -list -clear <pending breakpoint number> -clearall
|
在指定模块中的指定方法处创建断点。
如果尚未加载指定的模块和方法,则此命令将在创建断点之前等待已加载并进行实时 (JIT) 编译的模块的通知。 可以通过使用 -list、 -clear 和 -clearall 选项来管理挂起断点的列表: 该 -list 选项生成所有挂起断点的列表。 如果挂起断点有一个非零模块 ID,则该断点特定于该特定已加载模块中的函数。 如果挂起断点有一个零模块 ID,则该断点适用于尚未加载的模块。 使用 -clear 或 -clearall 选项可从该列表中移除挂起断点。 |
CLRStack [ -a] [ -l] [ -p] [ -n] | 仅提供托管代码的堆栈跟踪。
-p 选项显示托管函数的自变量。 -l 选项显示有关帧中的局部变量的信息。 SOS 调试扩展无法检索本地名称,因此本地名称的输出采用的格式为 <local address> = <value>。 -a(全部)选项是 -l 和 -p 组合的快捷方式。 -n 选项禁止显示源文件名和行号。 如果调试器已指定选项 SYMOPT_LOAD_LINES,则 SOS 将查找每个托管帧的符号,如果成功,则将显示对应的源文件名和行号。 可以指定 -n(无行号)参数来禁用此行为。 在基于 x64 和 IA-64 的平台上,SOS 调试扩展不显示过渡帧。 |
COMState | 列出每个线程的 COM 单元模型和 Context 指针(如果可用)。 |
DumpArray [ -start <startIndex>] [ -length <length>] [ -details] [ -nofields] <array object address>
或 DA [ -start <startIndex>] [ -length <length>] [ -detail] [ -nofields] array object address> |
检查数组对象的元素。
-start 选项指定开始显示元素的起始索引。 -length 选项指定要显示的元素数量。 -details 选项使用 DumpObj 和 DumpVC 格式显示元素的详细信息。 -nofields 选项可阻止显示数组。 此选项仅在指定 -detail 选项后可用。 |
DumpAssembly <assembly address> | 显示有关程序集的信息。
DumpAssembly 命令将列出多个模块(如果存在)。 可以通过使用 DumpDomain 命令获取程序集地址。 |
DumpClass <EEClass address> | 显示有关与类型关联的 EEClass 结构的信息。
DumpClass 命令显示静态字段值,但不显示非静态字段值。 使用 DumpMT、DumpObj、Name2EE 或 Token2EE 命令获取 |
DumpDomain [<domain address>] | 枚举在指定的 Assembly 对象地址内加载的每个 AppDomain 对象。 若在调用 DumpDomain 命令时不提供任何参数,则将列出过程中的所有 AppDomain 对象 。 |
DumpHeap [ -stat] [ -strings] [ -short] [ -min <size>] [ -max <size>] [ -thinlock] [ -startAtLowerBound] [ -mt <MethodTable address>] [ -type <partial type name>][start [end]] | 显示有关垃圾回收堆的信息和有关对象的收集统计信息。
如果 DumpHeap 命令在垃圾回收器堆中检测到过多碎片,将会显示警告。 -stat 选项将输出限制为统计类型摘要。 -strings 选项将输出限制为统计字符串值摘要。 -short 选项将输出限制为只是每个对象的地址。 这使你能够轻松地以管道方式将输出从该命令转移到另一个调试器命令以实现自动化。 -min 选项忽略小于 -max 选项忽略大于 -thinlock 选项报告 ThinLocks。 有关详细信息,请参阅 SyncBlk 命令。
-mt 选项仅列出与指定的 -type 选项仅列出其类型名称为指定字符串的子字符串匹配项的那些对象。
|
DumpIL <Managed DynamicMethod object> | <DynamicMethodDesc pointer> | <MethodDesc pointer> | 显示与托管方法关联的 Microsoft 中间语言 (MSIL)。
请注意,发出的动态 MSIL 与从程序集加载的 MSIL 不同。 动态 MSIL 引用托管对象数组中的对象而不是引用元数据标记。 |
DumpLog [ -addr <addressOfStressLog>] [<Filename >] |
将内存中压力日志的内容写入到指定文件。 如果你不指定名称,则此命令将在当前目录中创建一个名为 StressLog.txt 的文件。
内存中压力日志可帮助你在不使用锁或 I/O 的情况下诊断压力故障。 若要启用压力日志,请在 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\.NETFramework 下设置以下注册表项: (DWORD) StressLog = 1 (DWORD) LogFacility = 0xffffffff (DWORD) StressLogSize = 65536 利用可选的 |
DumpMD <MethodDesc address> | 显示有关指定地址处的 MethodDesc 结构的信息。
可以使用 IP2MD 命令从托管函数中获取 |
DumpMT [ -MD] <MethodTable address> | 显示有关指定地址处的方法表的信息。 指定 -MD 选项将显示与对象一起定义的所有方法的列表。
每个托管对象均包含一个方法表指针。 |
DumpMethodSig <sigaddr> <moduleaddr > |
显示有关指定地址处的 MethodSig 结构的信息。 |
DumpModule [ -mt] <Module address> | 显示有关指定地址处的模块的信息。 -mt 选项显示模块中定义的类型和模块所引用的类型
可以使用 DumpDomain 或 DumpAssembly 命令检索模块的地址。 |
DumpObj [ -nofields] <object address>
或 DO <object address> |
显示有关指定地址处的对象的信息。 DumpObj 命令显示对象的字段、EEClass 结构信息、方法表和大小。
可以使用 DumpStackObjects 命令检索对象的地址。 请注意,可以对
|
DumpRuntimeTypes | 显示垃圾回收器堆中的运行时类型对象并列出其关联的类型名称和方法表。 |
DumpStack [ -EE] [ -n] [top stack [bottom stack ]] |
显示堆栈跟踪。
-EE 选项使 DumpStack 命令仅显示托管函数。 使用 -n 选项禁止显示源文件名和行号。 如果调试器已指定选项 SYMOPT_LOAD_LINES,则 SOS 将查找每个托管帧的符号,如果成功,则将显示对应的源文件名和行号。 可以指定 -n(无行号)参数来禁用此行为。 在 x86 和 x64 平台上,DumpStack 命令将创建详细的堆栈跟踪。 在基于 IA-64 的平台上,DumpStack 命令模拟调试器的 K 命令。 在基于 IA-64 的平台上,将忽略 |
DumpSig <sigaddr> <moduleaddr> | 显示有关指定地址处的 Sig 结构的信息。 |
DumpSigElem <sigaddr> <moduleaddr> | 显示签名对象的单个元素。 大多数情况下,应使用 DumpSig 查看单个签名对象。 但是,如果签名已在某种程度上被损坏,则可使用 DumpSigElem 读取它的有效部分。 |
DumpStackObjects [ -verify] [top stack [bottom stack]]
或 DumpStackObjects [ -verify] [ |
显示在当前堆栈的边界内找到的所有托管对象。
-verify 选项验证对象字段的每个非静态 将 DumpStackObject 命令与堆栈跟踪命令(如 K 命令和 CLRStack 命令)一起使用以确定局部变量和参数的值。 |
DumpVC <MethodTable address> <Address> | 显示有关指定地址处的值类字段的信息。
MethodTable 参数使 DumpVC 命令可以正确解释字段。 值类不将方法表作为其第一个字段。 |
EEHeap [ -gc] [ -loader] | 显示有关内部 CLR 数据结构所使用的进程内存的信息。
-gc 和 -loader 选项将此命令的输出限制为垃圾回收器或加载程序数据结构。 有关垃圾回收器的信息列出了托管堆中每个段的范围。 如果指针落在由 -gc 给定的段范围内,则该指针是一个对象指针。 |
EEStack [ -short] [ -EE] | 对一个进程中的所有线程运行 DumpStack 命令。
将 -EE 选项直接传递给 DumpStack 命令。 -short 参数将输出限制为以下类型的线程: 已获取锁的线程。 己停止运行以允许垃圾回收的线程。 当前在托管代码中的线程。 |
EEVersion | 显示 CLR 版本。 |
EHInfo [<MethodDesc address>] [<Code address>] | 显示指定方法中的异常处理块。 此命令显示子句块(try 块)和处理程序块(catch 块)的代码地址和偏移量。 |
常见问题解答 | 显示常见问题。 |
FinalizeQueue [ -detail] | [ -allReady] [ -short] | 显示所有已进行终结注册的对象。
-detail 选项显示有关需要清理的任何
|
FindAppDomain <Object address> | 确定指定地址处的对象的应用程序域。 |
FindRoots -gen <N> | -gen any |<object address> | 导致调试器在指定生成的下次回收时在调试对象中中断。 在中断发生时立即重置该效果。 若要在下一个集合中断,你必须重新发出该命令。 此命令的 <object address> 形式在 -gen 或 -gen any 引起的中断发生后使用。 此时,调试对象处于正确的状态,以便 FindRoots 从当前已报废的生成中识别出对象的根。 |
GCHandles [ -perdomain] | 显示有关进程中的垃圾回收器句柄的统计信息。
-perdomain 选项将按应用程序域排列统计信息。 使用 GCHandles 命令可查找由垃圾回收器句柄泄漏导致的内存泄漏。 例如,当代码由于强垃圾回收器句柄仍指向一个大型数组而保留该数组时,若不释放句柄就将其放弃,则会发生内存泄漏。 |
GCHandleLeaks | 在内存中搜索进程中的对强垃圾回收器句柄和固定垃圾回收器句柄的任何引用并显示结果。 如果找到某个句柄,GCHandleLeaks 命令将显示相应的引用地址。 如果在内存中找不到句柄,此命令将显示一个通知。 |
GCInfo <MethodDesc address><Code address> | 显示指示寄存器或堆栈位置何时包含托管对象的数据。 如果发生垃圾回收,回收器必须知道对象引用的位置,以便可以使用新的对象指针值更新相应的对象引用。 |
GCRoot [ -nostacks] <Object address> | 显示有关对指定地址处的对象的引用(或根)的信息。
GCRoot 命令将检查整个托管堆和句柄表以查找其他对象内的句柄和堆栈上的句柄。 然后,在每个堆栈中搜索对象的指针,同时还搜索终结器队列。 此命令无法确定堆栈根是有效的还是已丢弃。 使用 CLRStack 和 U 命令可对本地或自变量值所属的帧进行反汇编,以便确定堆栈根是否仍在使用中。 -nostacks 选项将搜索限制为垃圾回收器句柄和 reachable 对象。 |
GCWhere <object address> | 显示垃圾回收堆中自变量传入的位置和大小。 如果自变量位于托管堆中,但不是有效的对象地址,则大小显示为 0(零)。 |
help [<command>] [faq ] |
在未指定参数时显示所有可用命令,或者显示有关指定命令的详细帮助信息。
|
HeapStat [ -inclUnrooted | -iu] | 显示每个堆的生成大小及每个堆上各生成的可用空间总量。 如果指定 -inclUnrooted 选项,则报告将包括有关不再为根的垃圾回收堆中的托管对象的信息。 |
HistClear | 释放由 Hist 命令系列使用的任何资源。
通常,你不必显式调用 |
HistInit | 从保存在调试对象中的压力日志初始化 SOS 结构。 |
HistObj <obj_address> | 检查所有压力日志的重定位记录,并显示可能已将地址作为自变量传入的垃圾回收重定位链。 |
HistObjFind <obj_address> | 显示在指定地址处引用对象的所有日志项。 |
HistRoot <root> | 显示与指定根的提升和重定位相关的信息。
根值可用于通过垃圾回收来跟踪对象的移动。 |
IP2MD <Code address> | 显示已 JIT 编译的代码中指定地址处的 MethodDesc 结构。 |
ListNearObj (lno ) <obj_address>
|
显示指定地址之前和之后的对象。 该命令在垃圾回收堆和自变量地址之后的对象中寻找地址,而该垃圾回收堆看上去像托管对象(基于有效的方法表)的有效开头。 |
MinidumpMode [0] [1] | 防止在使用小型转储时运行不安全的命令。
传递 0 禁用此功能,或传递 1 启用此功能。 默认情况下,MinidumpMode 值设置为 0。 使用 .dump /m 命令或 .dump 命令创建的小型转储具有有限的 CLR 特定数据,允许只正确地运行一小部分 SOS 命令。 有些命令可能会因错误而失败,因为所需的内存区域未被映射或仅被部分映射。 此选项可防止你对小型转储运行不安全的命令。 |
Name2EE <module name> <type or method name>
或 Name2EE <module name> ! <type or method name> |
显示指定模块中的指定类型或方法的 MethodTable 结构和 EEClass 结构。
在进程中必须加载指定的模块。 若要获取正确的类型名称,请通过使用 Ildasm.exe(IL 反汇编程序)浏览模块。 也可以将 此命令支持 < |
ObjSize [<Object address>] | [ -aggregate] [ -stat] | 显示指定对象的大小。 如果未指定任何参数,则 ObjSize 命令将显示在托管线程上找到的所有对象的大小,显示进程中的所有垃圾回收器句柄,并对这些句柄指向的任何对象的大小进行合计。 除父对象之外,ObjSize 命令还包括所有子对象的大小。
-aggregate 选项能够与 -stat 参数一起使用,以获得仍为根类型的类型的详细视图。 通过使用 !dumpheap -stat 和 !objsize -aggregate -stat,可以确定不再为根的对象并诊断各种内存问题。 |
PrintException [ -nested] [ -lines] [<Exception object address>]
或 PE [ -nested] [<Exception object address>] |
显示从指定地址处的 Exception 类派生的任何对象的字段并设置这些字段的格式。 如果不指定地址,PrintException 命令将显示在当前线程上引发的最后一个异常。
-nested 选项显示有关嵌套异常对象的详细信息。 -lines 选项显示源信息(如果可用)。 可以使用此命令设置 |
ProcInfo [ -env] [ -time] [ -mem] | 显示进程的环境变量、内核 CPU 时间和内存使用统计信息。 |
RCWCleanupList <RCWCleanupList address> | 显示在指定地址处等待清理的运行时可调用包装器的列表。 |
SaveModule <Base address> <Filename> | 将加载到内存中指定地址的图像写入指定文件。 |
SOSFlush | 刷新内部 SOS 缓存。 |
StopOnException [ -derived] [ -create | -create2] <Exception> <Pseudo-register number> | 使调试器在引发指定异常时停止,但在引发其他异常时继续运行。
-derived 选项用于捕获指定异常以及从指定异常派生的每个异常。 |
SyncBlk [ -all | <syncblk number>] | 显示指定的 SyncBlock 结构或所有 SyncBlock 结构。 如果不传递任何自变量,SyncBlk 命令将显示与一个线程拥有的对象对应的 SyncBlock 结构。
|
ThreadPool | 显示有关托管线程池的信息,包括队列中工作请求的数目、完成端口线程的数目和计时器的数目。 |
Token2EE <module name> <token> | 将指定模块中的指定元数据标记转换成 MethodTable 结构或 MethodDesc 结构。
可以传递 |
Threads [ -live] [ -special] | 显示进程中的所有托管线程。
Threads 命令显示调试程序速记 ID、CLR 线程 ID 以及操作系统线程 ID。 此外,Threads 命令还会显示“Domain”列、“APT”列和“Exception”列,这三列分别用于指示正在执行某线程的应用程序域、显示 COM 单元模式以及显示该线程中引发的上一个异常。 -live 选项显示与活动线程关联的线程。 选项显示由 CLR 创建的所有特殊线程。 特殊线程包括垃圾回收线程(在并发垃圾回收和服务器垃圾回收中)、调试器帮助程序线程、终结器线程、AppDomain 卸载线程和线程池计时器线程。 |
ThreadState < State value field > | 显示线程的状态。 value 参数为 Threads 报告输出中的 State 字段的值。
示例:
|
TraverseHeap [ -xml] <filename> | 以 CLR 探查器能够识别的格式将堆信息写入指定文件。 -xml 选项使 TraverseHeap 命令将文件格式化为 XML。
可以从 Microsoft 下载中心下载 CLR 探查器。 |
U [ -gcinfo] [ -ehinfo] [ -n] <MethodDesc address> | <Code address> | 显示由方法的 MethodDesc 结构指针或方法体内的代码地址指定的托管方法的反汇编(带有批注)。 U 命令将从开始到结束显示整个方法,并带有将元数据标记转换为名称的批注。
-gcinfo 选项使 U 命令显示方法的 -ehinfo 选项显示方法的异常信息。 也可以使用 EHInfo 命令获取此信息。 -n 选项禁止显示源文件名和行号。 如果调试器已指定选项 SYMOPT_LOAD_LINES,则 SOS 将查找每个托管帧的符号,如果成功,则将显示对应的源文件名和行号。 可以指定 -n 选项来禁用此行为。 |
VerifyHeap | 检查垃圾回收器堆中是否有损坏迹象,并显示找到的任何错误。
错误构造的平台调用可能导致堆损坏。 |
VerifyObj <object address> | 检查作为自变量传递的对象是否有损坏迹象。 |
VMMap | 遍历虚拟地址空间并显示应用于每个区域的保护类型。 |
VMStat | 提供虚拟地址空间的摘要视图,并按应用于该内存的每种保护类型(可用、已保留、已提交、私有、已映射和映像)排序。 “TOTAL”列显示“AVERAGE”列乘以“BLK COUNT”列的结果。 |
二、Windbg调试SOS.DLL和CLR 不匹配问题
CLR.dll 是一个原生C++ Win32 Native code 编写的托管代码运行时,它是托管代码的运行环境,它从我们.net编写的生成的dll中抽取IL中间代码和元数据,通过JIT即时编译来生成内存中的原生native Code. Windbg是一个针对原生Native code 的调试器。那在原生调试器和托管代码世界之间,我们需要一座“桥梁”这就是SOS.dll。但是CLR的内部数据结构可能是要不断变化的,这时如果有一个针对调试器的一个抽象层就非常重要,调试器通过一个抽象层来访问CLR的内部数据结构。mscordacwks.dll 就是这样一个抽象层 ( Data-Access-Component (DAC) ),它实现了让调试器SOS.dll 以比较稳定的接口来访问CLR内部不断的数据结构的目的。但CLR和SOS.dll 以及 mscordacwkd.dll 还是耦合的非常紧密的,以至乎 他们的版本必须一致才可以正常工作。一般,我们的机器上安装好.net 运行时后,都有 clr.dll ,sos.dll 和mscordacwk.dll 三个版本一致的dll。
我们在用windbg调试客户发来的dump文件的时候,如果不是相同的环境的话,很容易出现这个现象,简单的说就是程序运行机器上的CLR与当前开发调试人员机器上的CLR是不同的版本,从而导致开发人员机器上的SOS.dll与dump file中要求的SOS.dll不一样(比如应用程序要求是.net framework 4.6,所以客户机安装的就是.net 4.6,但是开发人员机器上安装的是.net 4.7)。我们在open crash dump之后。输入命令.loadby sos clr,这时候是成功的,但是在运用扩展命令的时候就显示失败,比如!dumpheap,这时候显示CLR version和SOS version 不匹配,这个时候你就需要将客户机器(相同环境机器也行)上的sos.dll复制到调试机器上随便一个文件夹,比如C:\temp\目录下,然后运行.load c:\temp\sos.dll,这时候也会成功。在执行上述过程之后,还是不能调试,因为sos.dll还对应一个mscordacwks.dll, 同时你还需要将这个dll从客户机器上复制过来,放到symbol所在的目录或者source文件所在的目录下都行, 但是需要改名字,名字的规则如下:
mscordacwks_AAA_AAA_x.x.x.xxxx.dll 。其中AAA是dump的bit位对应的(x86 or AMD64),x.x.x.x实际上就是mscordacwks.dll的版本号(可以从文件的property dialog中查到),比如2.0.50272.8763, 4.7.2114.0等。
然后运行.cordll -ve -u -l 命令,就能查看出该dll被成功加载,并且显示之前的dll不匹配SOS.dll版本。经过上面的过程之后就能利用SOS 扩展命令正常调试了。.cordll –ve –u –l (小写的L ) 这个命令是控制调试和控制CLR的命令,-ve是显示详细信息,-u 卸载模块,-l (小写的L) 是加载模块,上面这个命令就是卸载CLR 调试模块,然后再加载CLR调试模块,并显示详细信息。如果你不知道怎么改mscordacwks.dll名字,可以先运行.cordll -ve -u -l,就会显示当前的版本不匹配SOS的版本,需要的dll的名字是什么。客户机dll的路径:c:\windows\microsoft.NET\framework\各个版本目录下,根据上面命令的提示可以找到对应的文件夹,比如4.0之后的都是在4.0.*目录下,2.0的都是在2.0.*目录下。
除了到客户机上拷贝对应版本的动态库外,还可以到http://www.mskbfiles.com/sos.dll.php这里找对应的版本。