任何带特征的检测都是不安全的 & 隐而不发(@Ouroboros)
Move to AntiDebugBypass on github
代码依赖于 HookZz, 一个 hook 框架
前言
对于应用安全甲方一般会在这三个方面做防御.
按逻辑分类的话应该应该分为这几类, 但如果从实现原理的话, 应该分为两类, 用API实现的
和 不用API实现的
(这说的不用 API 实现, 不是指换成 inine 函数就行) . 首先使用 API 实现基本统统沦陷. 直接通过指令实现的机制还有一丝存活的可能. 逻辑的话应该分为, 反调试, 反注入, 越狱检测, hook 检测.
本文所有相关仅仅针对 aarch64.
假设读者对下知识有了解
- arm64 相关知识
- macho 文件结构以及加载相关知识
- dyld 链接 dylib 相关函数等知识
如何 hook 不定参数函数?
技巧在于伪造原栈的副本. 具体参考下文.
通常来说必备手册
// 指令格式等细节
ARM Architecture Reference Manual(ARMv8, for ARMv8-A architecture profile)
https://static.docs.arm.com/ddi0487/b/DDI0487B_a_armv8_arm.pdf
ARM Cortex -A Series Programmer’s Guide for ARMv8-A
http://infocenter.arm.com/help/topic/com.arm.doc.den0024a/DEN0024A_v8_architecture_PG.pdf
Calling conventions for different C++ compilers and operating systems
http://www.agner.org/optimize/calling_conventions.pdf
Procedure Call Standard for the ARM 64-bit Architecture (AArch64)
http://infocenter.arm.com/help/topic/com.arm.doc.ihi0055b/IHI0055B_aapcs64.pdf
通常来说必备源码
// dyld
https://opensource.apple.com/tarballs/dyld/
// xnu
https://opensource.apple.com/tarballs/xnu/
// objc
https://opensource.apple.com/tarballs/objc4/
https://github.com/RetVal/objc-runtime (可编译)
// cctools
https://opensource.apple.com/tarballs/cctools (很全的头文件)
反调试
反调试从逻辑上分大概分为, 一种是直接屏蔽调试器挂载, 另一种就是根据特征手动检测调试器挂载. 当然也分为使用函数实现 和 直接使用内联 asm 实现.
ptrace 反调试
ptrace 反调试可以使用四种方法实现.
1. 直接使用 ptrace 函数
这里使用的是 dlopen
+ dysym
.
typedef int (*PTRACE_T)(int request, pid_t pid, caddr_t addr, int data);
static void AntiDebug_001() {
void *handle = dlopen(NULL, RTLD_GLOBAL | RTLD_NOW);
PTRACE_T ptrace_ptr = dlsym(handle, "ptrace");
ptrace_ptr(PT_DENY_ATTACH, 0, 0, 0);
}
当然也可以基于 runtime 符号查找.
// runtime to get symbol address, but must link with `
// -Wl,-undefined,dynamic_lookup` or you can use `dlopen` and `dlsym`
extern int ptrace(int request, pid_t pid, caddr_t addr, int data);
static void AntiDebug_002() { ptrace(PT_DENY_ATTACH, 0, 0, 0); }
2. 使用 syscall 实现
void AntiDebug_005() { syscall(SYS_ptrace, PT_DENY_ATTACH, 0, 0, 0); }
3. 内联 svc + ptrace 实现
其实这种方法等同于直接使用 ptrace, 此时系统调用号是 SYS_ptrace
static __attribute__((always_inline)) void AntiDebug_003() {
#ifdef __arm64__
__asm__("mov X0, #31\n"
"mov X1, #0\n"
"mov X2, #0\n"
"mov X3, #0\n"
"mov w16, #26\n"
"svc #0x80");
#endif
}
4. 内联 svc + syscall + ptrace 实现
其实这种方法等同于使用 syscall(SYS_ptrace, PT_DENY_ATTACH, 0, 0, 0)
, 这里需要注意, 此时的系统调用号是 0, 也就是 SYS_syscall
static __attribute__((always_inline)) void AntiDebug_004() {
#ifdef __arm64__
__asm__("mov X0, #26\n"
"mov X1, #31\n"
"mov X2, #0\n"
"mov X3, #0\n"
"mov X4, #0\n"
"mov w16, #0\n"
"svc #0x80");
#endif
}
简单整理下系统调用流程, 只能以 xnu-3789.41.3
源码举例.
Supervisor Call causes a Supervisor Call exception. svc 切换 Exception Levels
从 EL0(Unprivileged)
到 EL1(Privileged)
上面说的是指令层相关, 再说系统层相关, 使用 svc 进行系统中断调用需要明确 3 个点: 中断号, 系统调用号, 以及参数. 下面以 x86-64 举例.
中断向量表
// xnu-3789.41.3/osfmk/x86_64/idt_table.h
USER_TRAP_SPC(0x80,idt64_unix_scall)
USER_TRAP_SPC(0x81,idt64_mach_scall)
USER_TRAP_SPC(0x82,idt64_mdep_scall)
中断处理函数
// xnu-3789.41.3/osfmk/x86_64/idt64.s
/*
* System call handlers.
* These are entered via a syscall interrupt. The system call number in %rax
* is saved to the error code slot in the stack frame. We then branch to the
* common state saving code.
*/
#ifndef UNIX_INT
#error NO UNIX INT!!!
#endif
Entry(idt64_unix_scall)
swapgs /* switch to kernel gs (cpu_data) */
pushq %rax /* save system call number */
PUSH_FUNCTION(HNDL_UNIX_SCALL)
pushq $(UNIX_INT)
jmp L_32bit_entry_check
// xnu-3789.41.3/bsd/dev/i386/systemcalls.c
__attribute__((noreturn))
void
unix_syscall64(x86_saved_state_t *state)
{
thread_t thread;
void *vt;
unsigned int code;
struct sysent *callp;
int args_in_regs;
boolean_t args_start_at_rdi;
int error;
struct proc *p;
struct uthread *uthread;
x86_saved_state64_t *regs;
pid_t pid;
assert(is_saved_state64(state));
regs = saved_state64(state);
#if DEBUG
if (regs->rax == 0x2000800)
thread_exception_return();
#endif
thread = current_thread();
uthread = get_bsdthread_info(thread);
#if PROC_REF_DEBUG
uthread_reset_proc_refcount(uthread);
#endif
/* Get the approriate proc; may be different from task's for vfork() */
if (__probable(!(uthread->uu_flag & UT_VFORK)))
p = (struct proc *)get_bsdtask_info(current_task());
else
p = current_proc();
/* Verify that we are not being called from a task without a proc */
if (__improbable(p == NULL)) {
regs->rax = EPERM;
regs->isf.rflags |= EFL_CF;
task_terminate_internal(current_task());
thread_exception_return();
/* NOTREACHED */
}
code = regs->rax & SYSCALL_NUMBER_MASK;
DEBUG_KPRINT_SYSCALL_UNIX(
"unix_syscall64: code=%d(%s) rip=%llx\n",
code, syscallnames[code >= nsysent ? SYS_invalid : code], regs->isf.rip);
callp = (code >= nsysent) ? &sysent[SYS_invalid] : &sysent[code];
系统调用表
xnu-3789.41.3/bsd/kern/syscall.h
#define SYS_setuid 23
#define SYS_getuid 24
#define SYS_geteuid 25
#define SYS_ptrace 26
#define SYS_recvmsg 27
#define SYS_sendmsg 28
反调试检测
这里主要是调试器的检测手段, 很多检测到调试器后使用 exit(-1)
退出程序. 这里很容易让 cracker 断点到 exit
函数上. 其实有一个 trick 就是利用利用系统异常造成 crash. 比如: 覆盖/重写 __TEXT
内容(debugmode 模式下可以对 rx-
内存进行操作).
或者利用内联汇编实现退出, 并清除堆栈(防止暴力 svc patch with nop
).
static __attribute__((always_inline)) void asm_exit() {
#ifdef __arm64__
__asm__("mov X0, #0\n"
"mov w16, #1\n"
"svc #0x80\n"
"mov x1, #0\n"
"mov sp, x1\n"
"mov x29, x1\n"
"mov x30, x1\n"
"ret");
#endif
}
使用 sysctl 检测
这里在检测时也可以通过 svc 实现.
static int DetectDebug_sysctl() __attribute__((always_inline));
int DetectDebug_sysctl() {
size_t size = sizeof(struct kinfo_proc);
struct kinfo_proc info;
int ret, name[4];
memset(&info, 0, sizeof(struct kinfo_proc));
name[0] = CTL_KERN;
name[1] = KERN_PROC;
name[2] = KERN_PROC_PID;
name[3] = getpid();
#if 0
if ((ret = (sysctl(name, 4, &info, &size, NULL, 0)))) {
return ret; // sysctl() failed for some reason
}
#else
// or change as `AntiDebug_003` and `AntiDebug_004`
// https://www.ibiblio.org/gferg/ldp/GCC-Inline-Assembly-HOWTO.html
__asm__ volatile("mov x0, %[name_ptr]\n"
"mov x1, #4\n"
"mov x2, %[info_ptr]\n"
"mov x3, %[size_ptr]\n"
"mov x4, #0\n"
"mov x5, #0\n"
"mov w16, #202\n"
"svc #0x80"
:
: [name_ptr] "r"(name), [info_ptr] "r"(&info),
[size_ptr] "r"(&size));
#endif
return (info.kp_proc.p_flag & P_TRACED) ? 1 : 0;
}
void AntiDebug_006() {
if (DetectDebug_sysctl()) {
asm_exit();
}
}
使用 isatty 检测
#include <unistd.h>
void AntiDebug_isatty() {
if (isatty(1)) {
exit(1);
} else {
}
}
使用 ioctl 检测
#include <sys/ioctl.h>
void AntiDebug_ioctl() {
if (!ioctl(1, TIOCGWINSZ)) {
exit(1);
} else {
}
}
svc 完整性检测
上述的 svc 反调试手段, 可以通过 patch svc #0x80
with nop
轻松绕过. 所以需要校验 svc #0x80
是否被 patch, 一个想当然的方法是在正常的代码中使用 svc 进行 coding, 仔细想想并不合适.
所以另一个想法就是, 使用 svc 实现一个小功能, 之后检测 x0
返回值. 这里使用的是 getpid()
.
tips: longjmp
本来是用在异常时恢复状态, 这里由于未保存状态. 所以可以让攻击者不能对退出进行断点.
这里使用, 下面一小段内联汇编可以达到相同的目的.
"mov x1, #0\n"
"mov sp, x1\n"
"mov x29, x1\n"
"mov x30, x1\n"
"ret\n"
整体的 svc 完整检测原型如下, 仅做抛砖引玉.
static __attribute__((always_inline)) void check_svc_integrity() {
int pid;
static jmp_buf protectionJMP;
#ifdef __arm64__
__asm__("mov x0, #0\n"
"mov w16, #20\n"
"svc #0x80\n"
"cmp x0, #0\n"
"b.ne #24\n"
"mov x1, #0\n"
"mov sp, x1\n"
"mov x29, x1\n"
"mov x30, x1\n"
"ret\n"
"mov %[result], x0\n"
: [result] "=r" (pid)
:
:
);
if(pid == 0) {
longjmp(protectionJMP, 1);
}
#endif
}
绕过
对于使用函数进行反调试可以使用 hook 轻松绕过, 具体的实现, 直接看代码.
syscall 反调试绕过
因为 syscall
反调试有些特殊, 这里需要介绍下如何绕过 syscall
反调试, 使用的是 va_list
进行传递参数. http://infocenter.arm.com/help/topic/com.arm.doc.ihi0055b/IHI0055B_aapcs64.pdf
参考阅读 va_list
相关.
借助 HookZz 有两种方法可以进行绕过
1. 使用 replace_call
绕过
这里的 syscall
使用的是 va_list
传递参数. 所以这里问题在于如何 hook 不定参数函数. 因为在 hook 之后不确定原函数的参数个数. 所以没有办法调用原函数.
所以这里有一个 trick, 在 orig_syscall(number, stack[0], stack[1], stack[2], stack[3], stack[4], stack[5], stack[6], stack[7]);
时伪造了一个栈, 这个栈的内容和原栈相同(应该是大于等于原栈的参数内容). 虽然传递了很多参数, 如果理解 function call
的原理的话, 即使传递了很多参数, 但是只要栈的内容不变, 准确的说的是从低地址到高地址的栈里的内容不变(这里可能多压了很多无用的内容到栈里), 函数调用就不会变.
这里不要使用 large structure
, 编译时会使用隐含的 memcpy
最终传入的其实是地址. 大部分注释请参考下文.
int (*orig_syscall)(int number, ...);
int fake_syscall(int number, ...) {
int request;
pid_t pid;
caddr_t addr;
int data;
// fake stack, why use `char *` ? hah
char *stack[8];
va_list args;
va_start(args, number);
// get the origin stack args copy.(must >= origin stack args)
memcpy(stack, args, 8 * 8);
if (number == SYS_ptrace) {
request = va_arg(args, int);
pid = va_arg(args, pid_t);
addr = va_arg(args, caddr_t);
data = va_arg(args, int);
va_end(args);
if (request == PT_DENY_ATTACH) {
NSLog(@"[AntiDebugBypass] catch 'syscall(SYS_ptrace, PT_DENY_ATTACH, 0, "
@"0, 0)' and bypass.");
return 0;
}
} else {
va_end(args);
}
// must understand the principle of `function call`. `parameter pass` is
// before `switch to target` so, pass the whole `stack`, it just actually
// faked an original stack. Do not pass a large structure, will be replace with
// a `hidden memcpy`.
int x = orig_syscall(number, stack[0], stack[1], stack[2], stack[3], stack[4],
stack[5], stack[6], stack[7]);
return x;
}
2. 使用 pre_call
绕过
这种方法需要查看 syscall
的汇编实现, 来确定 PT_DENY_ATTACH
放在哪一个寄存器.
libsystem_kernel.dylib`__syscall:
0x1815c0900 <+0>: ldp x1, x2, [sp]
0x1815c0904 <+4>: ldp x3, x4, [sp, #0x10]
0x1815c0908 <+8>: ldp x5, x6, [sp, #0x20]
0x1815c090c <+12>: ldr x7, [sp, #0x30]
0x1815c0910 <+16>: mov x16, #0x0
0x1815c0914 <+20>: svc #0x80
0x1815c0918 <+24>: b.lo 0x1815c0930 ; <+48>
0x1815c091c <+28>: stp x29, x30, [sp, #-0x10]!
0x1815c0920 <+32>: mov x29, sp
0x1815c0924 <+36>: bl 0x1815a6dc0 ; cerror
0x1815c0928 <+40>: mov sp, x29
0x1815c092c <+44>: ldp x29, x30, [sp], #0x10
0x1815c0930 <+48>: ret
可以看到调用如果 x0
是 SYS_ptrace
, 那么 PT_DENY_ATTACH
存放在 [sp]
.
void syscall_pre_call(RegState *rs, ThreadStack *threadstack, CallStack *callstack) {
int num_syscall;
int request;
zpointer sp;
num_syscall = (int)(uint64_t)(rs->general.regs.x0);
if (num_syscall == SYS_ptrace) {
sp = (zpointer)(rs->sp);
request = *(int *)sp;
if (request == PT_DENY_ATTACH) {
*(long *)sp = 10;
NSLog(@"[AntiDebugBypass] catch 'syscall(SYS_ptrace, PT_DENY_ATTACH, 0, "
@"0, 0)' and bypass.");
}
}
}
__attribute__((constructor)) void patch_syscall_by_pre_call() {
zpointer syscall_ptr = (void *)syscall;
#if 0
ZzBuildHook((void *)syscall_ptr, NULL, NULL, syscall_pre_call, NULL);
ZzEnableHook((void *)syscall_ptr);
#endif
}
// --- end ---
svc #0x80
反调试绕过
这里介绍关键是介绍如何对 svc 反调试的绕过.
上面已经对 svc 进行了简单的介绍. 所以理所当然想到的是希望通过 syscall hook
, 劫持 system call table(sysent)
. 这里相当于实现 syscall hook
. 但是难点之一是需要找到 system call table(sysent)
, 这一步可以通过 joker, 对于 IOS 10.x 可以参考 http://ioshackerwiki.com/syscalls/
, 难点之二是作为 kext 加载. 可以参考 附录, 对于具体的 kernel patch
没有做过深入研究, 应该可以参考 comex 的 datautils0
ok, 接下来使用另一种思路对绕过, 其实也就是 code patch
+ hook address
. 对 __TEXT
扫描 svc #0x80
指令, 对于 cracker 来说, 在 __TEXT
段使用 svc #0x80
具有一定的反调试可能, 所以需要对 svc #0x80
进行 hook addres
, 这里并不直接对 svc #0x80
进行覆盖操作.
以下代码依赖于 HookZz).
大致原理就是先搜索到 svc #0x80
指令后, 对该指令地址进行 hook, 之后使用 pre_call
修改寄存器的值.
void hook_svc_pre_call(RegState *rs, ThreadStack *threadstack, CallStack *callstack) {
int num_syscall;
int request;
num_syscall = (int)(uint64_t)(rs->general.regs.x16);
request = (int)(uint64_t)(rs->general.regs.x0);
if (num_syscall == SYS_syscall) {
int arg1 = (int)(uint64_t)(rs->general.regs.x1);
if (request == SYS_ptrace && arg1 == PT_DENY_ATTACH) {
*(unsigned long *)(&rs->general.regs.x1) = 10;
NSLog(@"[AntiDebugBypass] catch 'SVC #0x80; syscall(ptrace)' and bypass");
}
} else if (num_syscall == SYS_ptrace) {
request = (int)(uint64_t)(rs->general.regs.x0);
if (request == PT_DENY_ATTACH) {
*(unsigned long *)(&rs->general.regs.x0) = 10;
NSLog(@"[AntiDebugBypass] catch 'SVC-0x80; ptrace' and bypass");
}
} else if(num_syscall == SYS_sysctl) {
STACK_SET(callstack, (char *)"num_syscall", num_syscall, int);
STACK_SET(callstack, (char *)"info_ptr", rs->general.regs.x2, zpointer);
}
}
void hook_svc_half_call(RegState *rs, ThreadStack *threadstack, CallStack *callstack) {
// emmm... little long...
if(STACK_CHECK_KEY(callstack, (char *)"num_syscall")) {
int num_syscall = STACK_GET(callstack, (char *)"num_syscall", int);
struct kinfo_proc *info = STACK_GET(callstack, (char *)"info_ptr", struct kinfo_proc *);
if (num_syscall == SYS_sysctl)
{
NSLog(@"[AntiDebugBypass] catch 'SVC-0x80; sysctl' and bypass");
info->kp_proc.p_flag &= ~(P_TRACED);
}
}
}
__attribute__((constructor)) void hook_svc_x80() {
zaddr svc_x80_addr;
zaddr curr_addr, text_start_addr, text_end_addr;
uint32_t svc_x80_byte = 0xd4001001;
const struct mach_header *header = _dyld_get_image_header(0);
struct segment_command_64 *seg_cmd_64 = zz_macho_get_segment_64_via_name((struct mach_header_64 *)header, (char *)"__TEXT");
zsize slide = (zaddr)header - (zaddr)seg_cmd_64->vmaddr;
struct section_64 *sect_64 = zz_macho_get_section_64_via_name((struct mach_header_64 *)header, (char *)"__text");
text_start_addr = slide + (zaddr)sect_64->addr;
text_end_addr = text_start_addr + sect_64->size;
curr_addr = text_start_addr;
while (curr_addr < text_end_addr) {
svc_x80_addr = (zaddr)zz_vm_search_data((zpointer)curr_addr, (zpointer)text_end_addr, (zbyte *)&svc_x80_byte, 4);
if (svc_x80_addr) {
NSLog(@"hook svc #0x80 at %p with aslr (%p without aslr)",
(void *)svc_x80_addr, (void *)(svc_x80_addr - slide));
ZzBuildHookAddress((void *)svc_x80_addr, (void *)(svc_x80_addr + 4),
hook_svc_pre_call, hook_svc_half_call);
ZzEnableHook((void *)svc_x80_addr);
curr_addr = svc_x80_addr + 4;
} else {
break;
}
}
}
总结
上文对很多的反调试原理做了总结, 也有一些没有讲到原理. 读者可以自行研究.
附录
// syscall hook
http://siliconblade.blogspot.jp/2013/07/offensive-volatility-messing-with-os-x.html
https://www.defcon.org/images/defcon-17/dc-17-presentations/defcon-17-bosse_eriksson-kernel_patching_on_osx.pdf
http://d.hatena.ne.jp/hon53/20100926/1285476759
https://papers.put.as/papers/ios/2011/SysScan-Singapore-Targeting_The_IOS_Kernel.pdf
https://www.blackhat.com/docs/us-15/materials/us-15-Diquet-TrustKit-Code-Injection-On-iOS-8-For-The-Greater-Good.pdf
ios kext load
https://github.com/LinusHenze/anyKextLoader
https://github.com/Jailbreaks/trident-kloader
https://github.com/saelo/ios-kern-utils
https://github.com/xerub/kexty