存储在变量中
下图便是"存储在变量中"的情况:
◆再利用GetType方法根据类名检索对应的Type对象
◆再利用GetFields来获取目标类中的所有对象,同时可以利用BingdingFlags来限制对象的属性
◆随后用GetValue来获取每个field中的所有字段值。
- $AgentTesla = [System.Reflection.Assembly]::LoadFile("C:\Users\g0mx\Desktop\RCData1.bin")
- $class = $AgentTesla.GetType("A.b")
- $fields = $class.GetFields([System.Reflection.BindingFlags]::Static -bor [System.Reflection.BindingFlags]::Public) | Where-Object {$_.MetadataToken -in (0x04000005..0x0400002B)}
- foreach ($field in $fields) {
- $fieldValue = $field.GetValue($null)
- $fieldValueString = [System.Convert]::ToString($fieldValue)
- Write-Host "The decrypted value is: $fieldValueString"
- }
复制代码
◆"hxxps://api.ipify.org",常常被用于获取受害者IP;
◆"prince.omd@yandex.com",该邮箱地址很可能被用于接收受害者信息;
◆"rdPg.exe",大概率是创建了一个名字是这个的文件。其有可能是第二阶段文件,也可能是自拷贝用于持久化操作; ◆"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:99.0) Gecko/20100101 Firefox/99.0",用于服务端识别的"UA"标识。
存储在内存中
该样本中,又包含了大量的存储在内存中的字符串,如下图所示:
面对这种情况,往往我们会选择进行动态调试,但是当遇到如此大量的调用时,会浪费我们大量的时间和经历,才能找到我们感兴趣的地方,本人也被此困扰,因而急需一种自动化的解决方案。
通过查看IL,可以发现这种情况下存在相同的IL切片。随后,又把微软官方文档和官方论坛翻了又翻,本人决定通过将IL和ps1相结合的方式,来实现自动化处理。
保存到csv,并输出
- $assemblyPath = "C:\Users\g0mx\Desktop\RCData1.bin"
- $methodToken = "0x0600026F"
- $filePath = "C:\Users\g0mx\Desktop\AT.il"
- $pattern = "\s+(IL_\w+):\s+ldc\.i4\s+([0-9a-fx]+)\r?\n\s+IL_\w+:\s+call\s+string A\.V::A\(int32\)"
- try {
- $assembly = [System.Reflection.Assembly]::LoadFile($assemblyPath)
- }
- catch {
- Write-Host "Failed to load assembly: $_"
- return
- }
- try {
- $method = $assembly.ManifestModule.ResolveMethod([int]$methodToken)
- }
- catch {
- Write-Host "Failed to resolve method: $_"
- return
- }
- $matches = @()
- Get-Content $filePath -Raw | Select-String -Pattern $pattern -AllMatches | ForEach-Object {
- $_.Matches | ForEach-Object {
- $key = $_.Groups[1].Value
- $value = $_.Groups[2].Value
- $matches += [PSCustomObject]@{Key = $key; Value = $value}
- }
- }
- # $matches
- $results = $matches | ForEach-Object {
- $value = [int]$_.Value
- $hexValue = "0x{0:x}" -f $value
- $string = $method.invoke($null, $value)
- [PSCustomObject]@{
- Value = $hexValue
- String = $string
- }
- }
- $results | Export-Csv -Path "C:\Users\g0mx\Desktop\Output.csv" -NoTypeInformation
- $results | Out-GridView
复制代码
键盘记录器
窃密
还有很多此处就不再一一列举了,对应的CSV文件本人也会发出来,到时大家有兴趣的话慢慢看就好了。到这也能非常轻松的看出来这是一个窃密样本了。
小结
以上两种方法,解决了我们在开头所提出了"需要进行大量重复操作"的痛点,但是这两种方法真的完美吗,真的优雅吗?答案一定是否定的。首先,其需要将"存储在变量中"和"存储在内存中"这两种情况分开处理,并且分析的时候需要根据所保存的立即数去定位相应的方法,再进行详细分析; 其次,第二个脚本中用了一个非常非常冗长的正则表达式,其一,虽然正则表达式非常强大,但他经常给人一种非常杂乱,并且难以阅读的感觉,对于本人而言能不用就不用,因为在我眼里这个手法太不优雅了,甚至有点丑陋; 其二,本人这个正则水平着实不高,为了匹配上上文中小小的代码切片,写了快半小时。基于上面所说的两点问题,下面我们来说一说优雅的解决方案。
优雅的方式
dnlib
在具体说明这个优雅的方式如何实现之前,我们不得不来看一看"dnlib"(
https://github.com/0xd4d/dnlib)这个相当nice项目,它让这种优雅的方式成为现实,让我们可以摆脱正则表达式,同时还能够直接修改.NET程序,使我们的分析过程变得更加丝滑。
可以看到,该项目的功能是"读写.NET文件的程序集和模块",具体的用法把"readme"看一看,例子看一看,再配合ps1的Get-Member,我们就能动手了。
原理 & 实现
◆载入dnlib & .NET程序
通过反射加载,载入dnlib.dll; 同时,再以两种方式载入.NET文件。通过反射加载可以实现,通过获取到的参数直接调用相应方法; 通过dnlib载入可以实现,寻找目标方法和所需参数。
◆寻找目标方法
通过dnlib给我们的"GetTypes()",我们可以获取到目标.NET文件的中的所有方法,随后我们遍历所有方法,根据目标方法特点找到,对应的方法。该样本中的目标方法已在上文中提及,可以看到其仅包含一个参数,类型为"System.Int32",且其返回值类型为"System.String"。
- function FindDecryptMethod($methods)
- {
- foreach($method in $methods)
- {
- if (-not $method.HasBody){continue}
- if ($method.Parameters.Count -eq 1 -and $method.Parameters[0].Type.FullName -eq "System.Int32" -and $method.ReturnType.FullName -eq "System.String")
- {
- return $method
- }
- }
- return $null
- }
- $methods = $module_defmd.GetTypes().foreach{$_.Methods}
- $decrypt_method = FindDecryptMethod -methods $methods
- $Global:remove_method = @($decrypt_method)
复制代码
通过这些简单的特征,我们找到了想要的方法:
◆找到目标方法的所有交叉引用 & patch IL
再次遍历所有方法,并在他们的IL中找到所有"call $decrypt_method",而这次我们将不再需要丑陋的正则表达式,可以借助dnlib提供的"MethodBody.Instructions",通过名称实现全局搜索。
每次找到目标方法后,我们将ldc.i4所对应的立即数保存下来,再获取目标方法的MDToken,用反射注入提供的接口,将获取到的立即数传入,随后invoke目标方法,我们就能得到解密后的字符串。
随后修改相应的"调用IL",将红框中这类方法调用直接替换为解密后得到的字符串。修改非常简单,我们只需将对应的IL删去一行,并将另一行替换为"Ldstr $decrypted_string"即可。
- foreach($method in $methods)
- {
- if (-not $method.HasBody){continue}
- foreach($instr in $method.MethodBody.Instructions.ToArray())
- {
- if ($instr.OpCode.Name -like "call" -and $instr.Operand -eq $decrypt_method)
- {
- $index = $method.MethodBody.Instructions.IndexOf($instr)
- $para_1_instr = $method.MethodBody.Instructions[$index - 1]
- if (-not $para_1)
- {
- Write-Host "Someting went wrong, para was not found!" -ForegroundColor Red;
- Exit
- }
- $decrypted_string = $module_refl.ResolveMethod($instr.Operand.MDToken.ToInt32()).Invoke($null, $para_1_instr.Operand)
- $method.MethodBody.Instructions[$index - 1].OpCode = [dnlib.DotNet.Emit.OpCodes]::Ldstr
- $method.MethodBody.Instructions[$index - 1].Operand = $decrypted_string
- $method.MethodBody.Instructions.RemoveAt($index)
- }
- }
- $method.MethodBody.UpdateInstructionOffsets() | Out-Null
- }
复制代码◆成果
随便举两个例子,可以看到,我们想要的效果已经实现了,这样分析起来就非常的流畅并且舒适了,最关键的是还可以正常进行动态调试。
但这真的完美了吗,还没有!我们可以更近一步,我们可以将"ldsfld $VAR",即"b.R"以及"b.s"这种变量直接替换为字符串,这样可以更加方便我们阅读,也同时解决了上文中提到的"以变量形式存储"和"以内存形式存储"这两种情况,这样才是一个趋近于完美的解决方案。
◆找到目标赋值的所有交叉引用 & patch IL
其中原理和上一步相同,本文便不再过多赘述,直接查看下面的ps1代码即可。
- foreach($method in $methods)
- {
- if (-not $method.HasBody){continue}
- foreach($instr in $method.MethodBody.Instructions.ToArray())
- {
- if (-not ($instr.OpCode.Name -like "ldsfld" -and $instr.Operand.IsField)){continue}
- $index = $method.MethodBody.Instructions.IndexOf($instr)
- $field = $instr.Operand.FullName
- if ($field | Select-String -Pattern "A\.b")
- {
- $str = $module_refl.ResolveField($instr.Operand.MDToken.ToInt32()).GetValue($null)
- if (-not $str){continue}
- if (-not ($str.GetType().Name -eq "String")){continue}
- $method.MethodBody.Instructions[$index].OpCode = [dnlib.DotNet.Emit.OpCodes]::Ldstr
- $method.MethodBody.Instructions[$index].Operand = $str
- }
- }
- $method.MethodBody.UpdateInstructionOffsets() | Out-Null
- }
复制代码
成果
再来看效果,Perfect!!!,这就是我们想要的,并且还能正常调试,完美收工!
总结
本文提供了三种利用powershell自动化处理.NET样本混淆的方案,可以极大的提高分析效率,降低重复工作,希望大家有所收获,读的开心,也欢迎大家讨论和分享自己平时所用的分析方法和技巧。最后,祝大家生活愉快!!!