Advanced .Net Debugging 10:事后调试



一、介绍



这是我的《Advanced .Net Debugging》这个系列的第十篇文章。这篇文章的内容是原书的第三部分的【高级主题】的第八章【事后调试】。前面几篇文章,我们介绍了很多工具,可以帮助大家找出问题的所在。但是,有一类问题我们是没办法使用这些工具来解决的,那就是已经发布的程序。在程序发布后,总是会出现一些问题,并且这些问题出现的时机是不确定的,大多数出现在用户在使用软件的过程中。想要解决这样的问题,我们当然会想到远程调试,有时候可以,有时候是不可以的,当然,不可以的理由会有很多,比如:安全的原因等类似的。

如果使用软件的客户拒绝对出现问题的软件进行实时调试,并且本地又无法重现问题,那我们该怎么办呢?当然是有办法的,那就是【事后调试】。


【事后调试】的步骤:



1)、触发故障的发生。



2)、抓取系统在发生故障时的状态快照(根据不同的故障类型,在某些情况下还需要抓取故障发生前后的状态快照)。



3)、将快照发送给工程师作进一步的分析。


在这篇文章中,我们将讨论抓取快照的各种不同方式,不同类型的转储信息以及如何分析它们。

当然,高级调试会涉及很多方面的内容,你对 .NET 基础知识掌握越全面、细节越底层,调试成功的几率越大,当我们遇到各种奇葩问题的时候才不会手足无措。

如果在没有说明的情况下,所有代码的测试环境都是 Net 8.0,如果有变动,我会在项目章节里进行说明。好了,废话不多说,开始我们今天的调试工作。


调试环境我需要进行说明,以防大家不清楚,具体情况我已经罗列出来。



操作系统:Windows Professional 10



调试工具:Windbg Preview(Debugger Client:1.2306.1401.0,Debugger engine:10.0.25877.1004)和 NTSD(10.0.22621.2428 AMD64)



下载地址:可以去Microsoft Store 去下载



开发工具:Microsoft Visual Studio Community 2022 (64 位) – Current版本 17.8.3



Net 版本:.Net 8.0



CoreCLR源码:
源码下载


在此说明:我使用了两种调试工具,第一种:Windbg Preivew,图形界面,使用方便,操作顺手,不用担心干扰;第二种是:NTSD,是命令行形式的调试器,在命令使用上和 Windbg 没有任何区别,之所以增加了它的调试过程,不过是我的个人爱好,想多了解一些,看看他们有什么区别,为了学习而使用的。如果在工作中,我推荐使用 Windbg Preview,更好用,更方便,也不会出现奇怪问题(我在使用 NTSD 调试断点的时候,不能断住,提示内存不可读,Windbg preview 就没有任何问题)。



如果大家想了解调试过程,二选一即可,当然,我推荐查看【Windbg Preview 调试】。



二、目录结构



为了让大家看的更清楚,也为了自己方便查找,我做了一个目录结构,可以直观的查看文章的布局、内容,可以有针对性查看。



2.1、
转储文件基本知识





2.1.1、
通过调试器来生成转储文件




A、
基础知识



B、
眼见为实



1)、
NTSD 调试



2)、
Windbg Preview 调试




2.1.2、
通过 ADPlus 生成转储文件




A、
基础知识



B、
眼见为实



1)、
崩溃模式




2.1.3、
转储文件的调试





2.1.4、
数据访问层





2.1.5、
转储文件分析:未处理的 .NET 异常




1)、
NTSD 调试



2)、
Windbg Preview 调试




2.2、
Windows 错误报告



三、调试源码




废话不多说,本节是调试的源码部分,没有代码,当然就谈不上测试了,调试必须有载体。




1、ExampleCore_8_01




四、基础知识



在这一段内容中,有的小节可能会包含两个部分,分别是 A 和 B,也有可能只包含 A,如果只包含 A 部分,A 字母会省略。A 是【基础知识】,讲解必要的知识点,B 是【眼见为实】,通过调试证明讲解的知识点。



4.1、转储文件的基本知识



转储文件是进程状态的外在表示。生成转储文件的目的:在不需要对出问题的计算机进行实时访问的情况下,就可以对程序故障进行分析。有了转储文件,调试人员就可以使用调试器的事后调试功能来分析故障。

共有两种类型的转储文件:

1)、

完全转储文件(Full Dump)



2)、

微型转储文件(Mini Dump)



在完全转储文件中包含了进程的整个内存空间、可执行影响、句柄表和调试器需要使用的其他信息。当使用完全转储文件时不能指定所要收集的数据量。但是,我们可以使用调试器将完全转储文件转换为微型转储文件。

微型转储文件的内容是可变的,并且能根据使用的转储文件生成器进行定制。在微型转储文件中可以只包含某个线程的信息,也可以包含被转储进程的详细信息。需要注意的是,在最大的微型转储文件中包含的内容要多于在完全转储文件中包含的内容。因此,我们这里只介绍微型转储文件的结构。

以下是能够生成转储文件的工具列表:

1)、

Windows Debuggers(Windows 调试器)

:Windows 调试器可以生成各种不同大小的转储文件,并且能够完全控制转储文件的生成过程。

2)、

ADPlus

:ADPlus 是 Windows 调试工具集中的一个。它的作用相当于一个进程监视器,每当发生崩溃或者挂起时,都能生成转储文件。此外,它还能将崩溃事件通知给用户。

3)、

Windows 错误报告

:Windows错误报告是Microsoft提供的一种服务,用户通过这种服务注册到一个实时的错误报告站点。每当用户的某个应用程序发生错误时,都会将一个错误报告从发生崩溃的机器发送到Windows错误报告站点。然后,在进行事后分析时可以从WER服务中提取崩溃信息(包括转储文件)。


以上都是书里介绍的内容,由于书写的比较早,到现在还有很多其他工具可以生成转储文件,比如:任务管理器,Windbg 调试器,Process Explorer,PCHunter 等,使用起来也很方便,网上学习资料很多,我就不多说了。


接下来,我们就针对这三种工具分别介绍如何生成转储文件。



4.1.1、通过调试器生成转储文件




A、基础知识


如果我们想使用调试器生成 DUMP 文件,可以使用【.dump】命令,【.dump /m】表示调试器将生成一个微型转储文件。当然【.dump】命令还有其他的选项,如下:

a、生成一个完整的微型转储文件,启动所有选项。在这个文件中将包含完整的内存数据、句柄信息、模块信息、基本的内存信息和线程信息等。相当于使用/mfFhut。

f、生成一个微型转储文件,其中包含进程内所有可访问和已提交的内存页。

F、生成一个微型转储文件,其中包含调试器在重构整个虚拟内存地址空间时需要的所有基本内存信息。

h、生成一个微型转储文件,其中包含句柄信息。

u、生成一个微型转储文件,其中包含未卸载模块的信息。注意,这个选项只能在Windows Server 2003上使用。

t、生成一个微型转储文件,其中包含线程时间的信息。在线程时间信息中包括创建时间,以及在用户态和内核态中执行的时间。

i、生成一个微型转储文件,其中包含辅助内存信息。辅助内存是指由栈指针或者后台存储使用的内存(及其周围的一小块内存)。

p、生成一个微型转储文件,其中包含进程环境块和线程环境块。

w、生成一个微型转储文件,其中包含所有已提交的读-写私有内存页。

d、生成一个微型转储文件,其中包含映像中的所有数据段。

c、生成一个微型转储文件,其中包含映像中的所有代码段。

r、生成一个微型转储文件,适合于在需要保护隐私的情况中使用。这个选项将删除在重建栈时不需要的任何信息(将这些信息替换为0,包括局部变量)。

R、生成一个微型转储文件,适合在需要保护隐私的情况下使用。这个选项将从微型转储文件中删除完整的模块路径,因此将确保用户目录结构的隐私性。


举个例子

:我们在调试器中执行【.dump /ma /u F:\MyDump.dmp】命令,可以在F盘看到生成 dmp 文件到MyDump_1c90_2024-06-27_15-13-24-466_3660.dmp文件。 .dump命令参数比较多,常用的组合就是/ma,/m 表示生成minidump,/a 表示dmp包含所有信息,/u 参数就是上面说的附加时间和PID信息到文件名。

当我们在生成一个转储文件的时候,有一个经验法则,在转储文件中包含的状态越多,在进行事后调试的时候就能获取更多的信息。当然,最大的限制因素就是转储文件的大小。有时候你会发现无法从一个高安全的服务器上获取很大的转储文件,而只能对一个删除了某些敏感信息之后的转储文件进行分析。

如果我们使用命令行调试器,当我们需要加载 dump 文件时,必须使用【ntsd -z dumpFileName】命令才可以,我使用的是【ntsd】调试器。dumpFileName:必须包含 dump 文件的完整路径和后缀名。

通过调试器生成转储文件的一个难点就是调试器必须在合适的时候被附加到故障进程上。一般来说,还好,但是对于崩溃情况是不定时的,是没有规律的,这样就很容易错失附加调试器的机会。当我们的程序发生崩溃的时候
Windows 可以自动的生成转储文件就好了,这种机制是有的。我们可以使用“

事后调试器设置(Postmortem Debugger Setup)

”。我们可以使用以下命令来修改事后调试器:

windbg -I、cdb -iae、ntsd -iae、drwtsn32 -i


效果如图:


想要执行以上命令,直接打开【cmd】命令行工具,输入命令【windbg -I】、【cdb -iae】、【ntsd -iae】、【drwtsn32 -i】就可以了。


修改注册表的值:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion\AeDebug


效果如图:

这个结果是我执行【cdb -iae】命令的结果。命令窗口如图:

我们可以直接运行我们的实例程序,控制台程序一旦抛出异常,立刻就能打开我们注册调试器。

1)先演示执行【Windbg -I】命令后的效果。

双击我们的控制台程序,看到“

Press any key to start

”字样,然后点击回车键,就会打开指定的调试器。

效果如图:

2)、先演示执行【cdb -iae】命令后的效果。

双击我们的控制台程序,看到“

Press any key to start

”字样,然后点击回车键,就会打开指定的调试器。

效果如图:


转储文件生成注意事项:



Windows Vista 中修改了错误报告技术在本地机器上保存转储文件的方式。在 Windows Vista 之前,Dr.Watson
默认将生成的转储文件保存在本地机器上。这些转储文件可以由任何一个想要调试转储文件的用户访问。在 Windows Vista 中去掉了
Dr.Watson,而是引入了一种更为可靠和稳定的错误报告机制。其中的修改之一就是,生成的转储文件(在默认情况下)不会被保存到本地机器上。要改变这种默认行为,可以将注册表
ForceQueue 设置为1,这将使所有转储文件在上传到 Microsoft 之前就在本地机器上排队。ForceQueue
注册键值位于以下注册路径:HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\Windows Error
Reporting


在注册键值 ForceQueue 被设置为1后,生成的所有转储文件都将被保存到以下位置:


对于在系统上下文中运行或者被提升到系统上下文中运行的进程:


%ALLUSERSPROFILE %\Microsoft\Windows\WER\[ReportQueue|ReportArchive]


对于所有其他的进程:


%LOCALAPPDATA%\Microsoft\Windows\WER\[ReportQueue|ReportArchive]


当调试非托管代码程序时,会用到 AeDebug

键值。然而,对于托管代码调试,可以使用【DbgManagedDebugger】和【DbgJITDebugLaunchSetting】这两个键值控制器调试。该键值位置:计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\.NETFramework,效果如图:










1)



DbgManagedDebugger

:该注册键值会指定当遇到未处理的异常时应该启动哪一个调试器。当遇到未处理的异常时,该注册键值指定的调试器并不会立即调用,而是显示一个消息框,由用户选择是调试程序还是结束程序。在事后调试中,一个很常见的问题就是,如何在程序发生故障的时候自动生成转储文件。

我们可以执行以下命令【ntsd
-pv -p %ld -c “,dump /u /ma <path to dump file>; .kill;
qd】,该命令的意思是,当一个故障发生时,启动【ntsd】调试器,并且执行【.dump】命令生成一个转储文件,然后退出调试回话。


2)、DbgJITDebugLaunchSetting

:该注册键值表示发生未处理异常时的行为。如果这个值被设置为 0,那么将显示一个消息框,并由用户选择对故障采用何种处理方式。请注意,只有在交互进程的情况下才会显示这个消息框,而对于其他进程(例如服务)则是直接结束。

如果 DbgJITDebugLaunchSetting 被设置 1,那么程序会直接结束,并返回一个栈转储。

如果 DbgJITDebugLaunchSetting 被设置 2,那么将立刻启动在 DbgManagedDebugger 中指定的调试器,而不会显示消息框。

如果 DbgJITDebugLaunchSetting 被设置 16,对于交互式进程会显示前面的消息框,而对于非交互式进程则会直接启动在 DbgManagedDebugger 中指定的调试器。


B、眼见为实


调试源码:ExampleCore_8_01

调试任务:通过 Windows 调试器生成转储文件。


1)、NTSD 调试


编译项目,打开【Visual Studio 2022 Developer Command Prompt v17.9.6】命令行工具,输入命令【NTSD E:\Visual Studio 2022\Source\Projects\AdvancedDebug.NetFramework.Test\ExampleCore_8_01\bin\Debug\net8.0\ExampleCore_8_01.exe】打开调试器。

进入调试器,我们直接使用【g】命令,运行调试器,直到看到调试器输入“

Press any key to start

”字样,我们按回车键,让调试器继续执行,发现现在的调试器已经中断执行了。

我们可以执行【!clrstack】命令,查看一下当前的线程调用栈。

接下来,我们使用【

.dump /mf F:\Test\TestDump\08dumpfile2.dmp】命令,生成转储文件,保存目录在

F:\Test\TestDump 下,文件名称是

08dumpfile2.dmp。说明一下,文件名为什么加一个 2,因为我已经生成一个文件了,文件名必须不同,否则会有错误。



文件名修改后,继续执行,看到“

Dump successfully written

”字样就说明成功了。

我们需要再打开一个【NTSD】调试器,执行【NTSD -z

F:\Test\TestDump\08dumpfile2.dmp

】命令,加载我们刚刚生成的 DUMP 文件。

调试器显示如下:

第一部分红色标注的说明加载 DUMP 文件的信息,第二部分红色标注的就是故障原因(CLR 异常)。

接下来,我们就可以使用各种命令调试我们的程序了。


2)、Windbg Preview 调试


编译项目,打开【Windbg Preview】调试器,依次点击【文件】—-【Launch executable】,加载我们的项目文件 ExampleCore_8_01.exe,进入到调试器中。

直接【g】命令运行调试器,直到我们的控制台程序输入“

Press any key to start

”字样,我们在控制台程序中,按任何键继续执行。此时,调试器会中断执行,因为抛出了异常。

我们可以使用【!clrstack】命令查看一下调用栈的情况。

说明我们的程序执行到 ProcessData 方法的第 22 行出现了问题,因为我们抛出了异常。红色标注的


22


就是源代码中发生问题的行号。

接下来,我们使用【

.dump /mf F:\Test\TestDump\08dumpfile.dmp

】命令,生成转储文件,保存目录在

F:\Test\TestDump 下,文件名称是

08dumpfile.dmp



当我们看到了“

Dump successfully written

”字样时,说明 Dump 文件写成功了,在指定目录就能看到该文件。

我们有了 DUMP 文件,我们再打开一个【Windbg Preview】调试器加载 DUMP 文件就可以了。依次点击【文件】—-【Open dump file】,在右侧通过浏览按钮选择我们的 Dump 文件,点击【open】按钮,就可以了。

第一部分红色标注的说明加载 DUMP 文件的信息,第二部分红色标注的就是故障原因(CLR 异常)。

接下来,我们就可以使用各种命令调试我们的程序了。




4.1.2、通过 ADPlus 生成转储文件




A、基础知识


ADPlus 工具能够监测和自动化一个或者多个故障进程的转储文件生成过程,并且能够在发生崩溃时通知用户或者计算机。ADPlus 工具位于 windbg 安装目录,最早叫 adplus.vbs,以VBScript脚本提供,最新版改成了adplus.exe。我们可以使用【cmd】命令打开命令行工具,直接输入 adplus 就可以运行,效果如下:

ADPlus.exe 不仅可以在程序崩溃时手动运行来生成dmp文件,也可以在崩溃之前就运行它,当程序崩溃时它会自动生成dmp文件;甚至可以在程序没有运行之前就先运行adplus,当程序崩溃时它会自动生成dmp文件。


ADPlus 可以在以下两种模式下运行:


1)、挂起模式(Hang Mode):用于分析出现挂起现象的进程(例如:程序不执行或者 100% 的 CPU 使用率)。ADPlus 必须在进程挂起之后启动。

2)、崩溃模式(Crash Mode):用于分析出现崩溃行为的进程。ADPlus 必须在进程崩溃之后启动。


ADPlus 可以控制生成转储文件的类型,共有四个命令行开关控制这种行为:


1)、-FullOnFirst:将 ADPlus 设置为在首次出现异常时创建完整转储文件。

2)、-MiniOnSecond:将 ADPlus 设置为在第二次出现异常时创建微型转储文件。

3)、-NoDumpOnFirst:将 ADPlus 设置为在首次出现异常时不创建任何微型转储文件。

4)、-NoDumpOnSecond:将 ADPlus 设置为在第二次出现异常时不创建任何微型转储文件。

ADPlus 还为用户提供了一种功能强大的方式来配置信息收集的频率以及在何种条件下收集信息,尤其是为调试器提供了一个脚本前端。这样做不过是采用了一种对用户更友好的方式来执行调试器命令,并将它们的执行过程自动化。

如果我们想了解 ADPlus 命令的使用,可以使用【adplus -?】命令查看该命令的使用方法和各种参数。


B、眼见为实


调试源码:ExampleCore_8_01

调试任务:通过 ADPlus 生成转储文件。


1)、崩溃模式


首先,我们先编译我们的项目,打开项目的可以执行程序文件,也就是 EXE 文件,直接双击执行。我们的程序输出“

Press any key to start

”字样。

在继续之前,我们打开【Visual Studio 2022 Developer Command Prompt v17.9.6】或者【cmd】命令行工具都可以,执行【adplus -pn ExampleCore_8_01.exe -crash -o F:\Test\TestDump】命令,-crash 将 ADPlus 设置为崩溃模式,-pn 告诉 ADPlus 要监控的进程名称,该参数的好处是它能够监视由 name 指定的进程的任意数量实例。-o 表示文件存储的目录地址。

执行效果如图:

当执行完成后,ADPlus 会把结果日志文件保存到我们设置的目录。效果如图:

它会新建一个目录

20240627_152459_Crash_Mode

,在该目录下存放日志文件。当我们的进程发生关闭事件时,ADPlus 将生成一个完全转储文件,我的文件名是:FULLDUMP_SecondChance_clr_NET_CLR_ExampleCore_8_01.exe__3c04_2024-06-27_16-15-43-200_2c28.dmp,效果如图:

文件名太长,截图没有显示全部。我们看到在 F:\Test\TestDump\20240627_152459_Crash_Mode 目录下,有一个文件 DebuggerScript.txt,其中包含了在 ADPlus 会话中使用的所有调试器命令。




4.1.3、转储文件的调试



因为转储文件只是进程状态的一个静态快照,因此,我们不能在代码上设置断点以及单步调试。最好把转储文件看成是一种手动调试,在使用转储文件时,仍然可以使用大多数的调试器命令。

在准备调试转储文件之前,需要先获取两个关键信息:符号文件和数据访问层(Data Access Layer,DAC)。由于在转储文件中不包含任何符号信息,因此当分析转储文件时,符号文件是非常重要的。这里的数据访问层(DAC)指的是 CLR 数据访问层,SOS 将通过这个信息来提供在调试会话中需要的数据。



4.1.4、数据访问层





先说明一下:对于所有版本的.NET Framework,DAC 的文件名 mscordacwks.dll,SOS 调试扩展的文件名 sos.dll,在 Net 跨平台版本名称改了,名称是

mscordaccore.d







我先说说在 Net Framework 环境下的情况。在非托管调试环境中,许多信息都可以通过观察内存来收集,而在托管代码中,SOS 依靠 CLR 来提供我们的调试输出以及结果。为了使 SOS 能够正确解析传递给它的原始数据,SOS 将调用 CLR (即执行CLR代码)来辅助执行这个过程。CLR 中负责实现这个功能的组件就是数据访问层,它包含在 mscordacwks.dll 中。现在,随着 CLR 被不断地增强,底层的 DAC 同样随各个版本(包含补丁)的不同而变化。通过查看机器上每个.NET版本的安装文件夹可以很容易地验证这一点。例如,在我的机器上,

mscordacwks.dll 位于以下文件夹中:C:\Windows\Microsoft.NET\Framework\v4.0.30319

。效果如图:


64 位的目录:C:\Windows\Microsoft.NET\Framework64\v4.0.30319,

效果如图:



由于调试器在其操作期间需要用到这个组件,因此要知道调试器这个文件的位置。在实时调试过程通常不需要关心这个问题,因为 SOS 能够从当前被调试的 CLR 所在位置上找到这个文件。在事后调试(或者转储文件)中,在程序中使用的 CLR 版本可能与转储文件所在机器上的 CLR 版本不同。再次重申,SOS 调试器扩展将调用 mscordacwks.dll 中的函数,这个动态库将执行 CLR 代码,因此为调试器指定正确的版本是非常重要的。

由于 CLR 版本的正确与否对于调试是否成功至关重要,因此,微软公布了 mscordacwks.dll 大部分符号,放在 Microsoft 共有符号服务器上。只要将调试器的符号路径指向共有符号服务器(使用 symfix 或者其他相关的命令),那么调试器就能找到这个文件。但是,有时候需要我们显示告诉 SOS 扩展命令在什么位置上查找该文件。这些情况:当文件不在公共符号服务器上或者文件没有安装在与生成转储文件的机器上的同一个路径下。此时,我们就可以使用【.cordll】命令来控制 mscordacwks.dll 加载的方式,并在处理版本不匹配问题时节约大量的时间。

接下来,我们看看【.cordll】命令的开关:

1)、-l  在默认加载路径中搜索 DLL并加载调试模块。

2)、-u  从内存中卸载调试模块。

3)、-e  启用 CLR 调试。

4)、-d  禁用 CLR 调试

5)、-D  禁用 CLR 调试并卸载调试模块。

6)、-N  重新加载调试模块。

7)、-lp  指定调试模块的目录。

8)、-se  启用使用短名字版本的调试模块,mscordacwks.dll。

9)、-sd  禁用使用短名字的调试模块,mscordacwks.dll。如果指定了这个开关,那么调试模块要以以下格式

加载:mscordacwks_<spec>.dll,其中<spec>的形式为<architecture>_<architecture ><file version>,而<Architecture >可以是x86 或者amd64。

10)、-ve  启用 verbose 模式。当处理不匹配问题时,verbose 模式是非常有用的,因为它能给出调试器如何加载调试模块的信息

11)、-vd  禁用 verbose 模式。



接下来,我们开始讲讲在 Net 5.0 和以上版本的情况,包括 NET 6.0、NET 7.0、NET 8.0,以后还会有更新的版本,都包含在内。



在 NET 跨平台版本中,名称和文件存放位置都发生了很大的变化,现在的文件名称是:

mscordaccore.dll

。当然这个文件也有两个版本,一个是 x86 架构的,一个是 64 架构的。我们安装几个版本的 .NET runtime,就会有几个版本的 DAC 文件与之匹配。我们可以使用【cmd】命令,打开命令行工具,然后输入【dotnet –info】命令,查看 dotnet 具体详情。

这个命令的输出内容确实很多,加粗标注的就是【Runtime(运行时)】的版本,我们也可以使用【dotnet –list-runtimes】命令,只查看运行时。

这些【运行时(Runtimes)】的目录是【C:\Program Files\dotnet\shared\Microsoft.WindowsDesktop.App】,说明是 64位架构的。说明一下,在这个目录下是找不到 mscordaccore.dll 文件的,该文件的目录是:C:\Program Files\dotnet\shared\Microsoft.NETCore.App,桌面程序(WindowsDesktop)和Asp.Net 程序(AspNetCore)共用这个。效果如图:

随便打开一个文件夹下,都能找到 mscordaccore.dll 和 coreclr.dll 文件,我打开 8.0.4 文件夹,效果如图:

以上是 64 位架构的,接下来,我们看看 x86 架构的,该文件的地址目录是:C:\Program Files (x86)\dotnet\shared\Microsoft.NETCore.App。

效果如图:

在这里,我同样打开最新版本的文件夹,该文件夹名称是 8.0.4,效果如图:



如何知道是否需要使用【.cordll】命令?如果存在版本不匹配的

mscordaccore.dll

(在 Net Framework 版本里提示的是 mscordacwks.dll) ,那么 SOS 调试扩展将输出以下错误信息,在跨平台版本里

mscordaccore.dll

和 coreclr.dll 是一一对应的,在 .Net Framework 版本里 mscordacwks.dll 和 mscorwks.dll 是一一对应的。

说明一下,我已经加载了一个 DUMP 文件,只是执行了一个【!t】命令,就会输出一下内容:

我们仔细看看这篇建议,

第一建议很简单

,就是要确保我们的调试器是最新版本。

第二条建议

是要确保

mscordaccore.dll

(原著中是 mscordacwks.dll,也就是 NET FRAMEWORK 版本)的版本和所加载的

coreclr.dll

(原著中的是 mscorwks.dll,也就是 NET FRAMEWORK 版本)是相匹配的。

第三条建议

是如果你调试的 DUMP 文件,要确保

mscordaccore_<arch>_<arch>_<version>.dll

文件位于符号路径中。这个名字其实就是使用了 -sd 命令开关启用长名字,长名字只是将这个 DLL 文件对应的架构以及构建编号添加到 DLL 的名字中。然后,就可以更新符号路径,指向这个 DLL,并执行【.cordll】命令来重新加载 mscordaccore.dll。

例如:如果在生成转储文件时使用的是 mscordaccore.dll 的版本为 1.1.1.0,架构为 x86,那么就可以将 mscordaccore.dll 重命名为 mscordaccore_x86_x86_1.1.1.0.dll,并将调试器的符号路径指向这个重命名的位置,接着使用【.cordll】命令来重新加载调试模块。效果如图:




第四条建议

确保运行调试器的所在的架构与生成转储文件的架构相同。由于调试器要执行 DAC 中的代码,因此,用于调试转储文件的调试器的架构信息与创建转储文件时使用的调试器架构信息要完全一样。

输出的最后一行,要求可执行路径指向

mscordaccore.dll

。可执行路径可以在调试器中通过【.exepath】命令来控制。如果要添加可执行路径,可以使用【!exepath +】命令。

如果无法找到在生成转储文件时使用的 DLL 正确版本,最简单的方法就是,要求生成转储文件的人员把相应的

mscordaccore.dll

文件发给你,在收到文件后,在按照之前给出的策略来加载它。在成功加载之后,SOS 调试器扩展会充分发挥其功能。

我们可以使用【Windbg Preview】调试器,输入【.cordll】命令,可以加载

mscordaccore.dll




4.1.5、转储文件分析:未处理的 .NET 异常。



调试源码:根据 ExampleCore_8_01 生成的 DUMP 文件。

调试任务:使用调试器分析 DUMP 文件。


1)、NTSD 调试


打开【Visual Studio 2022 Developer Command Prompt v17.9.6】,输入命令【NTSD -z F:\Test\TestDump\08dumpfile.dmp】打开调试器。

我们成功打开调试器,并且调试器已经中断执行,因为出现了异常。

以上信息说明,这个 DUMP 是由于引发了一个 CLR 异常而生成的。接着,我们查看异常的详细信息,包括传递的参数,使用【kb】命令。

我们看堆栈知道最后抛出异常,红色标注的地址就是异常对象的具体地址。我们可以使用【!do 000001e5`f8809ce8】命令或者【!DumpObj 000001e5`f8809ce8】,这个命令输入的内容太多。

我们也可以使用【!pe】命令,这个命令输出就很简洁了。

在这里看的就很清楚了,异常类型,错误码和调用堆栈都是一目了然。



2)、Windbg Preview 调试


我们打开【Windbg Preview】调试器,依次点击【文件】—-【Open dump file】,在右侧选择我们的 Dump 文件,点击【open】按钮,就打开了调试器。

由于我们调试的是 Dump 文件,所以调试刚开始的输出也是不一样的。

红色标注的都说明了加载了我们的 Dump 文件,并且由于发生了一个 CLR 异常生成的转储文件。

我们可以使用【!clrstack】命令看看托管调用堆栈,这里有用的信息不多。

我们可以使用【kb】命令查看非托管调用栈,包括参数。



000001e5`f8809ce8


这个参数就是异常实例的地址,我们可以使用【!do


000001e5`f8809ce8


】命令查看,但是使用【!pe


000001e5`f8809ce8


】命令会更好。

这里的信息就很清楚了,异常类型,调用堆栈一目了然。




4.2、Windows 错误报告



这一节的内容挺不好写的,因为这里面的内容发生了很大的变化,如果照着原文写,很多内容会过时的,所以,这节就简写了,我会给出微软最先有关文章的连接,大家可以去学习。

Windows 错误报告(Windows Error Reporting,WER)是一种聚合故障数据的服务,使得 Microsoft 和独立软件供应商(Independent Software Vendor,ISV)可以很容易的访问与他们程序相关的故障数据。

我们先上一个图,来说明一下 WER 服务的操作流程。

假设在世界的某个地方,有一台计算机正在运行由 ADND 企业开发的一个程序(就是图中的 X 进程)。假设这个程序崩溃了,并且用户看到了 Dr.Watson 界面并询问是否将错误报告发送给 Microsoft。用户选择了发送,并且错误报告将通过安全通道(HTTPS)发送给 WER 服务。然后,WER 将收到错误报告进行分门别类并保存。要使用这些错误报告,来之 ADND 企业的用户需要查询 WER 服务,找出与其程序相关的崩溃并且获得报告的错误信息。如果 ADND 得到了这些错误报告,那么就可以修正这个问题,并且提供一个回应,这样下一次当用户遇到了想通的崩溃情况时,Dr. Watson 将给出相应的回应。这个回应可以是一个补丁或者是其他一些帮助信息。

WER 服务是一种功能非常强大的机制,提供了对错误报告的聚合功能,ISV 可以查询这些信息来改进程序。此外,ISV 可以提供问题的回应,并且这个回应会集成到 WER 反馈循环中,从而可以使用户很容易得到回应。

要想使用 WER 服务,必须向 Windows 错误报告服务注册,剩下的内容就是如何注册账号和使用了,内容太老就不多说了。

在文章的最后,如果大家想了解 WER 最新的使用方法,我把 Microsoft 官网文章地址贴出来,大家可以自行学习。

地址如下:
https://learn.microsoft.com/zh-cn/windows/win32/wer/windows-error-reporting



五、总结





这篇文章的终于写完了,这篇文章的内容相对来说,不是很多。写完一篇,就说明进步了一点点。Net 高级调试这条路,也刚刚起步,还有很多要学的地方。皇天不负有心人,努力,不辜负自己,我相信付出就有回报,再者说,学习的过程,有时候,虽然很痛苦,但是,学有所成,学有所懂,这个开心的感觉还是不可言喻的。不忘初心,继续努力。做自己喜欢做的,开心就好。

未经允许不得转载:大白鲨游戏网 » Advanced .Net Debugging 10:事后调试