Статьи - Трассировка процессов в UNIX

Соглашение | Публикация статей

Красивые рольшторы - roll-service.by

Трассировка процессов в UNIX

Категория: Статьи

К сегодняшнему дню, мы с вами рассмотрели стандартную схему образования процессов в UNIX-е и взаимодействие процессов с использованием системы передачи сигналов друг другу. Мы с вами обсудили организацию взаимодействия процессов с использованием т.н. неименованных каналов, это средство позволяет асинхронным образом передавать информацию от одного процесса к другому. Эти средства работают для родственных процессов.
Сегодня мы рассмотрим еще одну базовую функцию операционной системы UNIX, которая поддерживает трассировку процессов. Трассировка - это возможность одного процесса управлять ходом выполнения другого процесса. Давайте рассмотрим основные действия, выполняемые при отладке.
1. Установка контрольной точки.
2. Обработка ситуации, связанной с приходом в контрольную точку.
3. Чтение/запись информации в отлаживаемой программе.
4. Остановка/продолжение выполнения отлаживаемого процесса.
5. Шаговый режим отладки (остановка отлаживаемой программы после выполнения каждой инструкции).
6. Передача управления на произвольную точку отлаживаемой программы.
7. Обработка аварийных остановок (АВОСТ).

Вот семь позиций, которые реализуются почти в любом средстве отладки, с точностью до добавленных новых пунктов, в какой бы мы системе не работали.
Теперь посмотрим, какими средствами можно организовать выполнение этих функций в ОС UNIX. Есть функция ptrace.

ptrace(int op, int pid, int addr, int data);

Функция ptrace в подавляющем большинстве случаев работает в отцовском процессе, и через возможности этой функции организуется управление процессом сыном. В общем случае нельзя трассировать любой процесс. Для того чтобы процесс можно было трассировать, чтобы сыновий процесс мог управляться отцовским процессом, процесс-сын должен подтвердить разрешение на его трассировку. Для этого в самом начале своего выполнения процесс-сын должен выполнить обращение к функции ptrace с кодом операции равным нулю (op=0), который разрешает проводить трассировку данного процесса процессом-отцом. После этого в сыновьем процессе обращений к функции ptrace может не быть. Все управление будет производиться отцом.
Рассмотрим, какие возможности есть у отцовского процесса для управления сыном. Все возможности определяются значением параметра op. Параметр pid - идентификатор сыновьего процесса, который мы хотим трассировать.

• op=1 или op=2 - ptrace возвращает значение слова, адрес которого задан параметром addr (т.е. чтение слова из отлаживаемого процесса). Здесь указаны два значения op на тот случай, если есть самостоятельные адресные пространства в сегментах данных и кода (т.е. можно читать данные и код). В системах, где адресация единая в рамках процесса значение может быть любым.

• op=3 - читать информацию из контекста процесса. Обычно речь идет о доступе к информации из контекста данного процесса, сгруппированную в некоторую структуру. В этом случае параметр addr указывает смещение относительно начала этой структуры. В эта структуре размещена информация к которой я имею доступ посредством функции ptrace, в частности - регистры, текущее состояние процесса, счетчик адреса и т.д.

• op=4 или op=5 - запись данных, размещенных в параметре data, по адресу addr. Если происходит ошибка, ptrace возвращает -1 (уточнение в errno).

• op=6 - запись данных из data в контекст по смещению addr. Это означает, что можно прочесть регистры трассируемого процесса и при необходимости изменить их содержимое (в т.ч. счетчик адреса команды, т.е. сделать переход).

• op=7 - продолжение выполнения трассируемого процесса. Эта операция хитрая. Хитрость заключается в следующем. Пусть трассируемый процесс по какой-то причине был остановлен, например по причине прихода сигнала, процесс-отец дождался этого события с помощью функции wait и выполняет какие-то действия не запустив отлаживаемый процесс. Остановленному процессу могут приходить сигналы от других процессов. Что в этом случае делать с этими сигналами? Здесь как раз и используется ptrace с op=7. Если data=0, то процесс, который к этому моменту был приостановлен (сыновий), продолжит свое выполнение, и при этом все пришедшие (и необработанные еще) к нему сигналы будут проигнорированы. Если значение параметра data равно номеру сигнала, то это означает, что процесс (сыновий) возобновит свое выполнение, и при этом будет смоделирована ситуация прихода сигнала с этим номером. Все остальные сигналы будут проигнорированы. Кроме того, если addr=1, то процесс продолжит свое выполнение с того места, на котором он быт приостановлен. Если addr>1, то осуществиться переход по адресу addr (goto addr).

• op=8 - завершение трассируемого процесса.

• op=9 - установка бита трассировки. Это тот самый код, который обеспечивает пошаговое выполнение машинных команд. После каждой машинной команды в процессе происходит событие, связанное с сигналом SIG_TRAP.

Эта функция нами описана в некоторой модельной нотации, т.е. в разных системах ptrace может иметь несколько другую интерфейсную часть. В разных системах отличается доступ к контексту.
Все вышеописанные действия с функцией ptrace выполняются при остановленном отлаживаемом процессе (Он может быть остановлен из-за какой-то ошибке, может быть остановлен при приходе сигнала). Для того чтобы отцовский процесс мог остановить трассируемый сыновий процесс может быть выполнена следующая последовательность действий. Отцовский процесс посылает сыну сигнал (в сыне уже ранее выполнена ptrace c op=0), предположим SIG_TRAP, и после отправки сигнала отцовский процесс выполняет функцию wait. После ого как сигнал дошел до сыновьего процесса и тот остановился, отцовский процесс получает соответствующий код ответа из функции wait. После этого считается, что трассируемый процесс остановлен и можно выполнять все вышеописанные действия.
Давайте промоделируем работу отладчика с использованием функции ptrace. Мы не будем писать программу, мы просто на пальцах попытаемся понять, как можно реализовать каждую из функций отладчика. Давайте называть отцовский процесс отладчиком, а сыновий процесс - отлаживаемым.
Установка контрольной точки.
Считается, что в отладчике имеется некоторая таблица, которая содержит информацию о контрольных точках.

№ Контрольной
точки Адрес
контрольной точки Сохраненное
машинное слово Счетчик приходов
в контрольную точку

При установке контрольной точки с использованием функции ptrace происходит следующее.
• Отладчик устанавливает контрольную точку по некоторому адресу.
• Читает содержимое отлаживаемого процесса по данному адресу.
• Записывает это содержимое (машинное слово) в таблицу.
• По данному адресу записывает машинную команду, которая сформирует событие, связанное с некоторым фиксированным сигналом, к примеру команда деления на ноль.

После этого можно запустить отлаживаемый процесс. В тот момент, когда управление в отлаживаемом процессе перейдет на адрес по которому мы установили контрольную точку, произойдет прерывание выполнения нашей программы и произойдет некоторое событие, связанное с известным нам сигналом.
Для отладчика это будет видно так. Он запустил отлаживаемый процесс (ptrace(7,...)), и обратился к функции wait (ждет события в отлаживаемом процессе). Как только событие произошло (т.е. пришел сигнал), отладчик смотрит, не совпадает ли этот сигнал с сигналом, который связан с приходом в контрольную точку. Если не совпадает, то отладчик произведет действия соответствующие этому сигналу (какие-то).
Если сигнал совпадает, то есть подозрение, что мы пришли в контрольную точку. В этом случае отладчик читает из контекста процесса адрес, по которому процесс был остановлен. Если этот адрес совпал с одним из адресов контрольных точек в таблице отладчика, то это означает, что мы пришли в контрольную точку (и деление на ноль на самом деле - контрольная точка). Если отладчик не нашел соответствующего адреса, то это означает, что действительно произошло деление на ноль и отладчик должен выполнить какие-то действия (обработка АВОСТа).
Если отладчик зафиксировал контрольную точку, он может выполнить какие-то действия по отладке программы. Когда-нибудь настанет необходимость продолжить выполнение программы, и пусть при этом мы хотели бы сохранить эту контрольную точку. Отладчик делает следующее. Он восстанавливает оригинальное содержимое машинного слова, которое берет из таблицы. Затем включает режим трассировки и запускает программу с прерванного адреса. Выполняется одна эта команда и сразу после нее происходит остановка процесса на следующей команде. После этого отладчик восстанавливает контрольную точку (опять вписывает деление на ноль) и запускает выполнение процесса с прерванной точки (отключив режим трассировки).
Снятие контрольной точки делается также просто: восстанавливается содержимое по соответствующему адресу и из таблицы выбрасывается соответствующая строка. Можно сделать контрольную точку так, чтобы она работала, к примеру, только 10 раз. Для этого надо добавить в таблицу еще счетчик, из которого при каждом приходе в контрольную точку будет вычитаться единица, и как только он обнулится, контрольная точка будет автоматически снята.

Чтение/запись обсуждать не будем - это понятно. Остановка осуществляется через посыл сигнала, либо через возникновение события в отлаживаемом процессе, продолжение - через функцию ptrace(7,...). Шаговый режим отладки осуществляется через ptrace(9,...). Передача управления на любую точку - нет проблем. Обработка аварийных остановок - с помощью wait.
Вот, с точностью до некоторых деталей, схема организации адресного отладчика, т.е. отладчика, который оперирует адресами. Если возникает необходимость отладки в терминах языка высокого уровня, то в отладчике добавляются таблицы, из которых можно определить адреса и свойства переменных и адреса операторов.
В этом случае, предположим, чтение содержимого языковой переменной программы будет осуществляться следующим образом. Отладчик обращается к своей таблице и ищет строчку переменной с именем Name. В том случае, если эта переменная существует и находиться в области видимости и существования, из таблицы выбираются атрибуты этой переменной. Если эта переменная обыкновенная статическая, то выбирается ее адрес и мы обращаемся к ptrace с чтением данных по адресу. Если эта переменная автоматическая, то с ней связано смещение относительно вершины стека. Это означает, чтобы добраться до содержимого автоматической переменной мы должны из контекста прочесть вершину стека (это есть некий адрес), после этого к этому адресу прибавить смещение, связанное с автоматической переменной, и уже по полученному результату как адресу прочесть информацию из адресного пространства процесса. Третий вариант: переменная - регистровая. В этом случае с именем Name будет ассоциирована информация о том, что эта переменная регистровая, а, в этом случае, там будет указан номер регистра, на котором она размещена. Для чтения информации из регистров я обращаюсь к чтению информации из контекста и читаю соответствующий регистр.
Изменить содержимое переменной можно аналогичным путем в соответствии с тремя рассмотренными вариантами. Кстати, в языке Си, объявление регистровой переменной на самом деле есть пожелание программиста о том, чтобы при хорошем стечении обстоятельств в программе и добром желании системы программирования разместить эту переменную на регистре. Т.е. она будет размещена либо на регистре, и тогда она будет реально регистровой, либо она будет автоматической.

Давайте попробуем написать маленький пример. Мы будем писать программу в нотации операционной системы Free BSD. Для других операционных систем надо уточнить функцию ptrace в мануалах.

Отлаживаемый процесс

int main() /* эта программа находится в процессе-сыне SON */
{
int i;
return i/0;
}

Процесс - отладчик

#iinclude <stdio.h>
#iinclude <unistd.h>
#iinclude <signal.h>
#iinclude <sys/types.h>
#iinclude <sys/ptrace.h>
#iinclude <sys/wait.h>
#iinclude <machine/reg.h>

int main(int argc, char *argv[])
{
pid_f pid;
int status;
struct reg REG;

switch (pid=fork()){ /* формируем процесс, в pid - код ответа */
case -1: perror("Ошибка fork"); exit(25); /* Обработка ошибки */
case 0: ptrace( PT_TRACE_ME, 0, 0, 0); execl("SON","SON",0);

/* В сыне: разрешаем отладку и загружаем процесс SON. При этом произойдет приостановка сына перед выполнением первой команды нового тела процесса (а точнее в нем возникнет событие, связанное с сигналом SIG_TRAP) */

default: break; /* В отце: выход из switch */
}

for(;;) {
wait(&status); /* ждем возникновения события в сыне (сигнала SIG_TRAP) */
ptrace(PT_GETREGS,pid,(caddr_t)®,0); /* Читаем регистры, например, чтобы их распечатать */
printf("EIP=%0.8x\ + ESP=%0.8x\n",REG.r_eip, REG.r_esp); /* печатаем регистры EIP и ESP */

if(WIFSTOPPED(status)||WIFSIGNALED(status)){ /* проверяем с помощью макросов условия функции wait, и если все нормально, продолжаем разбирать причину остановки программы */
printf("Сигналы: ");
switch(WSTOPSIG(status)){ /*анализируем код сигнала, по которому произошла остановка */
case SIGINT: printf("INT \n"); break; /* выводим причину остановки */
case SIGTRAP: . . . . . . break;
.
.
.
default: printf("%d", WSTOPSIG(status));
}

if (WSTOPSIG(status)!=SIGTRAP) exit(1); /* Если процесс остановился не по SIGTRAP тогда выходим */
if (WIFEXITED(status)){ /* проверяем случай, если процесс завершился нормально */
printf("Процесс завершился, код завершения = %d \n", WEXITSTATUS(status));
exit(0);
}
ptrace(PT_CONTINUE, pid, (caddr_t) 1, 0); /* Если был SIGTRAP, продолжаем процесс */
} /* End for(;;) */
exit(0);
}
Мы обработали ситуацию остановки и ситуацию нормального завершения процесса. При первой итерации цикла, мы остановимся и дождемся первого сигнала SIGTRAP. По этому сигналу мы выведем нужную нам информацию. Затем, проверим, не закончился ли наш процесс нормально, и т.к. он не может закончиться нормально (он выполняет деление на ноль), то мы обратимся к функции ptrace, которая продолжит процесс с прерванного места. Мы снова попадем на wait. Здесь мы дождемся события, связанного с делением на ноль, и обработаем это событие. В итоге, на стандартный вывод попадут две порции данных: первая - вывод точки прерывания, вершины стека и сигнала для начальной ситуации, и второе - мы получим блок той же информации и код сигнала FPI (Float Point Interrupt) на делении на ноль.
Рекомендуется разобрать этот пример и адаптировать для ваших машин на практикуме.

Статьи по теме:

МЕЖДУНАРОДНЫЙ И ОТЕЧЕСТВЕННЫЙ ОПЫТ БОРЬБЫ И ПРЕДУПРЕЖДЕНИЯ КОМПЬЮТЕРНЫХ ПРЕСТУПЛЕНИЙ И ВНОВЬ ВОЗНИКАЮЩИЕ ПРОБЛЕМЫ
Установка охранных систем - актуальность возросла!
Внутренности микропроцессора
Рисование прямоугольника или квадрата
COSMOS/M интерфейсы
Будущие модули CompactPCI- которые будут производится в ближайшее время
Общие моменты при организации ЛВС
Черный Баннер - Угроза или новые технологии?
Обеспеченность Линукс: Важность в сегодняшнем мире
Типы Даных В С++ И Отличия От Java
Несколько слов об иных возможностях
Блокнот: Поиск и замена
Наиболее распространенные возможности Internet
Создание, использование и распространение вредоносных программ для ЭВМ
Входные и выходные данные
Требования к антивирусным программам
Логическое хранение и кодирование информации
СПОСОБЫ СОВЕРШЕНИЯ КОМПЬЮТЕРНЫХ ПРЕСТУПЛЕНИЙ
Шифрование. PGP-ключ
Проигрыватель Windows Media
Потенциальные пользователи в сети Internet
Законы алгебры логики
ДЕЙСТВИЯ ПРИ ЗАРАЖЕНИИ ВИРУСОМ
РЕДАКТИРОВАНИЕ И ФОРМАТИРОВАНИЕ ТЕКСТА
Архитектура Risc Вычислительных Ядер
Производительность и надежность Windows Vista
Spyware боя; Используйте предохранение от брандмауэра
TCO '92
Внедрение Crm Системы Sales Expert 2 В Компании «Сибаэроинж»
Свежая Версия Mobile Forex 2.16: Комфортный Мобильный Трейдинг
Математические модели
Возможность системы CompactPCI иметь более 8 слотов
Нормативно-техническая документация
Микропроцессор
Тестирование От А До Я. Часть 1 - Основополагающие Принципы И Подходы
Преимущества ЭС перед человеком - экспертом
Введение в Windows
Расследование создание: распространение и использование вредоносных программ для ЭВМ
Интеграция Ibm Rational Clearquest И Microsoft Project - Ключ К Успешному Планированию
Физическое хранение, методы кодирования информации
Использование анонимного ftp по e-mail
Изменение механизма входа в систему
Области в которых используются компьютерные системы на базе CompactPCI
Микширование аудиодорожек
Транзисторы
Способы краж в банковских информационно-вычислительных системах
Характеристика антивирусных программ
Черный Баннер - Миф или реальность
Модемы и факс-модемы
Характеристики CASE-средств
Открытие документа в процессе загрузки операционной системы
Блок питания
Работа с файлами в редакторе Paint
Монтирование и размонтирование дисков
Прокси-Сервер - Это Действенный Способ Защиты Информации, А Также Преграда Для Атак Хакеров