脚本工具:基于lldb的trace脚本（新增<block级trace命令>，辅助算法分析，过混淆等）

yangyss · 2021 年6 月 22 日 11:23

由于工作的需要，在逆向分析中，遇到了强混淆，vm虚拟机等加固方案。在分析的过程中，痛不欲生。为了能在逆向的过程中，能安心的喝口咖啡，同时能还原出高度混淆/vm虚拟机中的代码。参考函数追踪的原理，弄个指令级的 lldb-trace脚本。

[前瞻]:

平时分析的过程中，难免遇到c函数，c++函数，objc函数。而objc函数又包括很多realease函数…顾儿，在trace过程中，objc的形如 release，引用计数类的函数，都忽略掉。对于 c/c++ 函数而言，类构造函数啊 .. 系统函数啊…等等，都需要过滤。而 objc_msgsend 函数，可以做重点分析：在于你是否要分析这个函数。而我不需要，所以我只要objc_msgsend中的函数名，而函数的实现，我就不trace了。

框架分析:
对不同平台，做不同的配置。忽略掉的函数，都放到忽略函数列表中。objc_msgsend函数需要特殊处理，顾放到受保护列表中。由于trace过程中，需要读取那些寄存器的值，顾用正则解析汇编指令，获得此汇编需要的寄存器。

更新：

1，trace 参数优化，绝大部分参数都为默认参数。
2，结束地址可以有多个（在某些混淆情况下，不确定结束地址到哪里，可以多设置几个结束地址）
3，增加了暂停其他线程的可选参数
4，增加了只 trace 本模块的可选参数
5，增加了进度信息（防止以为脚本卡死…等的不耐心..从而关闭了 lldb）
6，对msg_send 函数的参数解开发中…
7，增加了对还原的算法检测脚本。相关介绍见<13楼> : 脚本工具:基于lldb的trace脚本（新增<block级trace命令>，辅助算法分析，过混淆等） - #13，来自 yangyss
8，增加 block 级 trace 命令 [trace_b -e address -l debug -p] 。相关介绍见 <43楼>：脚本工具:基于lldb的trace脚本（新增<block级trace命令>，辅助算法分析，过混淆等） - #43，来自 yangyss

优化 :

1, 注释掉：解析函数名和其方法名代码 <解决 : 因为某些未知原因，导致不能写入文件>
2, 修复了在函数结束位置的下断点的bug

怎么使用该脚本:

1，在你准备追踪的地方下断点：（我的断点，从breakpoint函数 si 进入到 a函数的第一行）

1111820×437 90.4 KB

2，导入lldbTrace.py脚本。（你可以设置，默认的 log 文件路径。如果不设置，默认和脚本同位置）

2222636×212 28.4 KB

3，设置一个停止追踪的地址：（当前a函数，我把结束地址设为最后地址，和 ret 地址。为了查看debug信息，我把log类型设置成了debug）

33331061×909 159 KB

4，设置好，直接回车，结果如下：

44441094×807 249 KB

脚本在 git 上：https://github.com/yangyss/lldb-trace

脚本还有很多不完善的地方，需要慢慢优化。
不过利用trace 结果，能还原手写的算法，以及强混淆或者某些 vm虚拟机。

某手撸 aes 算法的还原：

66661079×816 469 KB

wzqwzq666 · 2021 年6 月 23 日 02:21

大神厉害,体验了一下很好用.

顾儿

111110 · 2021 年6 月 23 日 02:42

哈哈哈，牛逼，y总

yangyss · 2021 年6 月 23 日 02:44

道爷，别奶我…
就瞎搞瞎搞，为分析混淆/虚拟机提供一个方案

274622701 · 2021 年6 月 23 日 02:59

大佬，加载出现这个错是怎么解决啊
error: module importing failed: Traceback (most recent call last):
File “”, line 1, in
File “/opt/lldb_scripts/lldbTrace.py”, line 117
def handle_command(command,debugger:lldb.SBDebugger):

yangyss · 2021 年6 月 23 日 03:02

感觉，可能是你的 python环境，我这个是python3环境

而且我只实现了 arm64 架构的trace x86 系列的没有弄
def handle_command(command,debugger:lldb.SBDebugger): 这个是 python3的语法

274622701 · 2021 年6 月 23 日 03:23

谢谢，我试试切换一下

lixianshen · 2021 年6 月 25 日 09:52

感觉很牛逼，体验下来反馈

c7260274 · 2021 年6 月 25 日 10:55

感觉会有效率问题。以前使用ida trace过vm，太慢了。

yangyss · 2021 年6 月 25 日 16:14

感觉还行。
一般10分钟左右，trace 2-3w行

如果trace 10几万行，那就脱离了 trace 的价值。
trace的主要目的是分析算法，抠出关键逻辑。

ida trace 没用过。还是比较相信lldb 自带api接口。

而trace vm 是需要技巧的，直接全局trace 。。。妈妈呀，只能紫薯布丁了

ParadiseDuo · 2021 年7 月 1 日 07:38

摸摸摸摸摸摸摸

yangyss · 2021 年7 月 11 日 16:24

脚本优化如下:
1，增加了多个结束地址，用 “;” 分割
2，增加了调试 500 行，显示相关信息
3，增加了 trace 本模块的可选参数
4，增加了暂停其他线程的可选参数

yangyss · 2021 年7 月 29 日 07:38

算法还原检测脚本简介:

具体操作如下

1,找到ida中对应方法，翻译成对应的python代码

ida_fun451×356 25.5 KB

2,利用lldbTrace.py脚本，把需要翻译的函数trace一哈。结果如下：

trace_result873×736 130 KB

3,在ida伪代码中，切换到对应的汇编，对照trace结果，确定具体检测的地址。因为trace，当前打印的是上一句代码执行后的寄存器值。所以，我们把check的地址，定义为 0x10000393c，寄存器为 w8

check_com879×424 80.9 KB

4,定义检测的变量 Check_0x10000393c_w8 = ‘Check_0x10000393c_w8’ 。在翻译的代码中，添加检测函数 check_value(ret,Check_0x10000393c_w8) 。在解析tracelog文件之前，设置check的相关信息 set_trace_data(Check_0x10000393c_w8)

5,用python 调用此脚本，并传入 tracelog文件的路径。结果如下:

check_pintout597×480 31.4 KB

samlee1 · 2021 年8 月 9 日 01:39

在终端切换成了python3 xcode 里的lldb也会跟着切换吗但是还是报错
Traceback (most recent call last):
File “/Users/aimo/Desktop//lldb-trace-script/lldbTrace.py”, line 959, in trace
log_d(“Target: {}”.format(str(target)))
File “/Users/aimo/Desktop//lldb-trace-script/lldbTrace.py”, line 30, in log_d
d_log_file.write(msg)
UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 14-15: ordinal not in range(128)

yangyss · 2021 年8 月 9 日 06:09

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 14-15: ordinal not in range(128)

你这一段代码，具体的看看

也就ida 自带了一个python运行环境，别的没注意过。
xcode按理没自带python运行环境，应该和你当前的python运行环境，是一样的样子。。。个人猜测，不足为凭

44269597 · 2021 年8 月 12 日 10:16

在tk上试验了下，失败了，一直在死循环，
0x103efb4c8 stlxrbw10, w8, [x20] // w9 : 0x00000000 x20 : 0x00000001085b36c4
0x103efb4cc cbnz w10, 0x103efb4c4 // w10 : 0x00000001 w8 : 0x00000001 x20 : 0x00000001085b36c4
0x103efb4c4 ldaxrbw9, [x20] // w10 : 0x00000001
0x103efb4c8 stlxrbw10, w8, [x20] // w9 : 0x00000000 x20 : 0x00000001085b36c4
0x103efb4cc cbnz w10, 0x103efb4c4 // w10 : 0x00000001 w8 : 0x00000001 x20 : 0x00000001085b36c4
一直在这里死循环，不知道为啥

yangyss · 2021 年8 月 12 日 10:27

想到一种东西么？同步锁？原子锁？
因为其他线程，都暂停了，所以 w10 的值一直是1，所以对应的指向这个地址一直被占用…具体的是啥个代码？可以写个demo看看

建议两种做法：
1，直接在 0x103efb4d0 下断点，重新trace
2，–supend-threads-except-current-thread 设置为 false

wymany · 2021 年8 月 12 日 12:37

这个应该是用python2 运行的问题，如果跟你python环境保持一致(用python3)应该就没问题了.

samlee1 · 2021 年8 月 13 日 00:23

但是我终端已经切换了python3 难道xcode 的lldb不是自动切换成对应的吗

wymany · 2021 年8 月 13 日 02:07

应该不是，你可以试下在代码中最靠前的地方打印一下python的版本，import sys print(sys.version_info)

脚本工具:基于lldb的trace脚本（新增<block级trace命令>，辅助算法分析，过混淆等）

更新 ：

优化 :

算法还原检测脚本 简介:

***具体操作如下 ***

更新：

算法还原检测脚本简介:

具体操作如下