Cours de Systèmes d'exploitation avancé

TDTP2 -- Géstion de la mémoire

A.B.Dragut et V. Risch Vous êtes priés de rendre en fin de TP par mail:

un log avec vos commandes pour chaque point des exercices à faire et

une archive .tar.gz avec vos codes source.

Exo 01. Structure des fichiers executables (adresse et taille d'une variable)

Dans cet exercice

Nous analysons brièvement le format ELF pour les fichiers objet et exécutables.

Quoi de neuf :

Le format ELF divise le fichier en une zone en-tête (en-tête ELF, suivie des en-têtes des sections) et une zone avec des sections (pour les exécutables, contenues dans des segments).
Les sections sont dédiées à des informations de différentes sortes, et ont des drapeaux comme:

A -- à allouer dans l'image mémoire
W -- écrivable pendant l'exécution
X -- instructions exécutables

Parmis les types de sections il y a

.text -- les instructions -- AX
.data -- les variables initialisées -- WA
.bss -- les variables non-initialisées -- WA (pas de place dans le fichier, seulement en mémoire ; le -- système y met des zéros au chargement ; BSS=Block Started by Symbol)
.rodata -- les constantes -- A
.comment -- commentaires -- aucun drapeau, pas de chargement en mémoire

Le contenu d'un exécutable (comme a.out peut être regardé avec l'outil readelf. La partie de l'affichage de readelf qui nous interesse est celle-ci :

Section Headers:
   ...

Ensuite, avec l'outil od on peut regarder les sections. La section .comment est celle-ci :

000548  \0   G   C   C   :       (   G   N   U   )       4   .   2   ...

Travail à faire

Écrivez un très petit programme ainsi, dans un fichier nommé Exo1.c :

int main () {
  const char * enseignante = "AD";
}

Compilez et editez les liens, directement dans le fichier a.out avec

gcc Exo1.c

Regardez ensuite le contenu de a.out avec l'outil readelf, option -a, ainsi:

  readelf -a a.out

Off

Section headers

.comment

Off

.comment

od

  od -A x -c -j 0x548 a.out | less

D'après vous, dans quelle section (.data, .rodata, .bss) se trouvera la variable enseignante ? Refaites tout le chemin précedent (readelf, od, etc.) pour lire le contenu de la variable enseignante également. Trouvez l'adresse du segment mémoire de la section. Calculez le début de l'adresse et aussi la taille de la zone mémoire occupée par cette variable.
Rajoutez dans votre programme la variable enseignant

const char * enseignant = "VR";

Calculez le début de l'adresse de la zone mémoire occupée par cette nouvelle variable.

Rajoutez dans votre programme la variable

const unsigned int AgeEnseignante=40;

Calculez le début de l'adresse et aussi la taille de la zone mémoire occupée par cette variable. Comparez la taille de variable AgeEnseignante avec la taille de la variable enseignante. Sont-elles pareilles ? Pourquoi?

Peut-on obtenir directement les addresses sans avoir besoin des calculs? Oui si votre exécutable n'a pas été "déshabillé " (stripped en anglais)

nm

Compilez avec le niveau d'optimisation -O3 qui est le plus haut niveau d'optimisation possible (un drapeau -O4 n'a aucun effet) mais aussi du plus grand risque. Le temps de compilation sera plus long avec cette option qui en fait ne devrait pas être utilisée de façon globale à partir de GCC 4.x.

  gcc -O3 -m32 Exo1.c

Testez et verifiez si vos calculs précédents sont corrects.

   nm -f sysv Exo1.run

Symbols from Exo1.run:


Name Value Class Type Size Line Section

enseignante |..........| D | OBJECT|........| |.data

Value

Executez

     strip -s Exo1.run
     nm -f sysv Exo1.run

nm: a.out: no symbols

Comparez la taille d'Exo1 avant et apres le "strip" et répondez à la question: "Pourquoi "deshabille"-t-on les exécutables?"
Quel est le resultat de nm sur /bin/* ?
Refaites le même exercice mais avec les variables déclarées globales, donc avant la fonction main() Que voyez-vous ? Avec certaines versions de gcc les variables apparaissent explicitement.

Exo 02. Placer les variables du programme dans de sections mémoire d'un processus

Quoi de neuf :

La segmentation divise la mémoire virtuelle d'un processus dans des parties reliées logiquement, qui varient en taille. Il y a des segments mémoire de taille fixe et de taille variable.
La taille de la pile est connue d'avance. Son placement exact varie d'une version d'UNIX à l'autre.

segment texte
segment(s) données

une variable globale est une variable déclarée en dehors de toute fonction (de telles variables sont toujours "statiques" du point de vue des besoins d'espace mémoire pendant l'exécution du programme)
une variable statique locale est une variable déclarée dans une fonction avec le mot-clé static. Une telle variable garde sa valeur d'un appel de la fonction à l'autre.

variables globales/statiques initialisées (taille connue, stockées dans le fichier exécutable)
variables globales/statiques non-initialisées (taille connue, mais non stockées dans le fichier exécutable)
le tas ("heap" en anglais) -- espace alloué dynamiquement -- au fur et à mesure -- appels de malloc() ou calloc() en C, ou new en C++. Par exemple, les listes chaînées sont stockées ici. Les valeurs des adresses augmentent avec la taille du tas.

segment pile("stack" en anglais)

static

Par rapport aux sections du format ELF, les segments mémoire permettent une meilleure vérification et élimination des erreurs.
Il y a trois variables entières globales dans la bibliothèque C pour les manipuler: etext, edata, et end (faites man 3 end pour des détails). Ces variables indiquent les frontières de trois segments :

etext -- la première adresse après le texte du programme (code machine)
edata -- la première adresse après la région de données initialisées
end -- la première adresse après la région de données non-initialisées

La valeur de la variable etext est une borne supérieure de la taille de l'image exécutable.
Deux fonctions (système et bibliothèque) permettent de réajuster la taille du tas (heap), c'est-à-dire l'allocation dynamique de la mémoire.

#include <unistd.h>
int brk(void *nvelleAdresseFin);
void *sbrk(intptr_t deplacement);

Les deux sont obsolètes en tant que fonctions pour les programmeurs "utilisateur" -- elles sont censées être utilisées uniquement pour le développement du noyau.
brk() change directement l'address et renvoie 0 si succès sbrk() ajoute un déplacement (y compris 0) et renvoie l'adresse de ébut de la nouvelle zone.

Travail à faire

Récupérez le programme. Compilez et testez-le.
Complétez le diagrame suivant

       +------------------+
       |  TEXT            | x
       |                  |
       |  instructions    | x 
       |  code machine    | 
       |                  |
       +------------------+ x      = etext
       |  DATA            | x      = globales initialisees
       |  - variables     | 
       |    initialisees  | x      = statiques locales initialisees
       |                  | 
       |                  | x      = edata
       |                  | x      = statiques locales non-initialisees
       |                  | 
       | ---------------  |
       |  - variables     | x      = 
       |  noninitialisees | x      = globales noninitialisees
       |                  | 
       |                  |
       |                  | 
       | ---------------  | 
       |  - tas pour      | x      = pointe par
       |    l'allocation  | x	   = pointe par
       |    dynamique     |
       |                  |
       |                  |
       +------------------+ x	   = fin segment(s) données
                |
                |
                V

                .
                .
                .

                ^
                |
                |
       +------------------+
       |  PILE            |  
       |  - fonction      | x         = init local | Instruction empilee
       |                  | x         = init local | pour PtrFct
       |                  |
       |  - variables     | x         = loc        | Instruction empilee
       |    locales       |                        | pour main()
       |    automatiques  |         
       +------------------+

Calculez la fin du tas/heap qui est la fin du segment de données (data segment) et rajoutez dans le programme un appel à sbrk(0) pour vérifier vos calculs.

Optionnels

Trouver l'adresse d'une variable. Est-elle là où l'on s'y attend? Non, il y a du "padding".

Quoi de neuf :

les variables booléennes (donc bool, en C++), peuvent être alignées sur un octet, donc peuvent apparaître à n'importe quel octet
les variables short (deux octets) doivent être alignées sur deux octets, donc peuvent apparaître à n'importe quel octet d'adresse paire. Donc par exemple 0x1005 n'est pas une adresse valide pour une variable short, mais 0x1006 si.
les variables entières (donc int, sur quatre octets) doivent étre alignées sur quatre octets, donc peuvent apparaître à n'importe quel octet d'adresse multiple de 4. Donc par exemple 0x1006 n'est pas une adresse valide pour une variable int, mais 0x1008 si.

Travail à faire

MaStruct

bool

int

unsigned short

Quelle est la taille minimale de cette structure ? (Indication: la somme des tailles des membres)
Soit la définition de la structure MaStruct suivante :

struct MaStruct {
    bool           qDrapeau;
    unsigned short nShort;
    bool           qAutreDrapeau;
    int            nInt;
};


    |          |          |                   |
    | qDrapeau |  PADDING |       nShort      |    ....
    +----------+----------+---------+---------+--- ....
    0          1          2         3         4    ....

Montrez-le, en écrivant le programme suivant dans le fichier exo2OptPad.cxx

#include <iostream>

struct MaStruct {
    bool           qDrapeau;
    unsigned short nShort;
    bool           qAutreDrapeau;
    int            nInt;
};

int main(void) {
    MaStruct maStruct;
    std::cout << "taille: " << sizeof(maStruct) << "\n";
    return(0);
}

Recopiez le fichier exo2OptPad.cxx dans exo2OptPad2.cxx, et changez l'ordre des données membres dans la définition, pour obtenir la taille minimale lors de l'exécution. (Indication : taille minimale veut dire absence de padding. Absence de padding veut dire alignement "parfait" des données-membres dès qu'on les met simplement les unes à la suite des autres. Alignement "parfait" veut dire respect des règles, et celles-ci font aussi que l'adresse APRÈS une variable de taille T soit multiple de T, puisque n*T + 1 = (n+1)*T. Enfin, observez que les multiples de 4 sont aussi des multiples de 2, et que les multiples de 2 sont aussi des multiples de 1.). Montrez qu'on obtient en effet cette taille minimale en compilant et exécutant ce programme.

Pointeurs-racine pour les "ramasse-miettes" (garbage collector) dans des programmes single-thread

www.opensource.apple.com/source/libauto/libauto-77.1

Exo 03. Changements dans les variables d'un exécutable

Quoi de neuf :

On approfondit l'utilisation de readelf et d'od et on modifie directement un fichier exécutable après en avoir analysé le contenu et la structure.

Travail à faire

Écrivez dans un fichier exo3Ini.cxx le petit programme C++ suivant

#include <iomanip>
#include <iostream>

using namespace std;

int main (int argc, char * argv []) {
    const char * enseignant = "AD";
    cout << enseignant << endl;
    return 0;
}

Compilez-le avec
```
   g++ -o exo3Ini.run exo3Ini.cxx
```
et exécutez-le -- vous devez bien entendu voir la sortie AD.
Dans quelle section ELF se trouvera la variable enseignant, sachant qu'elle donc constante et initialisé ?
Cherchez-en l'adresse dans exo3Ini.run avec la commande

    readelf -a exo3Ini.run

Vérifiez maintenant la présence de la chaîne de caractès "AD" avec la commande
```
    od -A x -c -j 0xAdresseTrouveeParVous a.out | head
```
(donc en y mettant la valeur trouvée au point précédent). Vous devez voir quelque chose du genre
```
  .... A   D  \0   .....
```
Déduisez l'adresse exacte où commence la chaîne (donc où se trouve le 'A' de "AD") et vérifiez en relançant la commande od comme plus haut, mais avec cette valeur plus précise. Supposons que l'adresse en question est 0x8bd, vous devez alors voir

0008bd   A   D  \0  .....
...........

Écrivez dans le fichier exo3.cxx un autre petit programme C++ qui utilise des fonctions système pour modifier le fichier exécutable exo3Ini.run afin qu'ensuite l'exécution de exo3Ini.run affiche "VR" (donc au lieu d'afficher, comme avant, "AD"). Il faut donc ouvrir exo3Ini.run en écriture (c'est bien un fichier, après tout, qui nous appartient, donc on peut bien faire cela) et écrire "ce qu'il faut", mais au bon endroit -- utilisant donc le travail des points précédents.
Compilez exo3.cxx en exo3.run avec

   g++ -o exo3.run exo3.cxx

Testez le tout, en lançant
- la compilation de exo3Ini.cxx en exo3Ini.run
- l'exécution de exo3Ini.run -- vous devez voir "AD"
- l'exécution de exo3.run
- une autre exécution de exo3Ini.run -- vous devez voir "VR"
Trouvez entre quelles adresses en hexadecimal est comprise la variable enseignant. Quelle est sa taille en octets ?

Exo 04. `exec()` vide les segments mémoire d'un processus

Quoi de neuf :

Un exécutable peut avoir l'air de bien fonctionner, sans aucun problème apparent. Néanmoins, un programme peut comporter bien des fuites de mémoire qui mettent en danger le système si le programme tourne de manière cyclique. Apres execve(), le man nous dit qu'on met à zéro le tas, le .data, .rodata, etc. Que se passe-t-il avec le tas?

Travail à faire
Le but du jeu ici est d'utiliser strace -f pour voir l'enchaînement des appels système et les changements successifs des zones mémoire du processus durant son exécution, regardant dans /proc/LePIDduProcFils/maps au fur et à mesure qu'on l'exécute. C'est pour cela que la solution de cet exercice est parsemée de sleep() (et de plus, ceux-ci sont bien visibles avec strace en tant qu'appels système à nanosleep()).
Enfin, pour une analyse "pure" avec strace on se prend un X trè simple et "gentil" à execve()er. Téléchargez l'archive de travail depuis ici. Dedans vous trouverez la structure habituelle des exercices de TP, et notamment deux programmes principaux. Occupons-nous d'abord du plus petit et simple -- le m.c, qui contient déjà ceci :

int main() {
    sleep(30);
    return(0);
}

Compilez-le en m.run. Ainsi, ceci sera notre X (sans arguments).
Regardons en détail le code de exo4.cxx, qui est une des variantes de la solution de l'exercice du TP Processus portant sur execve(). Notamment, le premier appel à new engendrera à un appel système à brk(unGrandNombreEnHexa) (visible bien entendu avec strace -f). Une fois cet appel exécuté, dans /proc/LePIDduProcFils/maps on pourra alors voir effectivement apparaître une ligne avec le mot heap commençant exactement à l'adresse donné en retour de l'appel système à brk(unGrandNombreEnHexa).
La suite de ces explications est à lire deux fois: une fois vous ne faites que la lire, pour comprendre. Ensuite, vous pouvez refaire ces manipulations pas à pas, et donc en relisant le texte qui suit.

On ouvre deux terminaux. Dans un terminal on lance

   strace -f exo4.run 'm.run' 2>&1 | tee log.txt

[pid 19630] write(2, "My pid is ", 10My pid is )  = 10
[pid 19630] write(2, "19630", 519630)        = 5
[pid 19630] write(2, "\n", 1
)           = 1
[pid 19630] rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
[pid 19630] rt_sigaction(SIGCHLD, NULL, {SIG_DFL, [], 0}, 8) = 0
[pid 19630] rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
[pid 19630] nanosleep({1, 0}, 0x7ffff2801c20) = 0
[pid 19630] rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
[pid 19630] rt_sigaction(SIGCHLD, NULL, {SIG_DFL, [], 0}, 8) = 0
[pid 19630] rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
[pid 19630] nanosleep({2, 0}, 0x7ffff2801c20) = 0

Alors on récupère ainsi le pid (19630) et "vite-vite" on va dans l'autre terminal et on fait

   less /proc/19630/maps

00400000-00403000 r-xp 00000000 08:07 14344203                           /home/....
7fc087321000-7fc087477000 r-xp 00000000 08:06 156058                     /lib64/libc-2.11.2.so
...
7fffec018000-7fffec039000 rw-p 00000000 00:00 0                          [stack]
...

heap

Quittons alors le less (avec la touche q) dans cet autre terminal (gardons le terminal ouvert).
Revenons à l'autre terminal et continuons à regarder le déroulement :

...
[pid 19630] nanosleep({3, 0}, 0x7ffff2801c20) = 0
[pid 19630] rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
[pid 19630] rt_sigaction(SIGCHLD, NULL, {SIG_DFL, [], 0}, 8) = 0
[pid 19630] rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
[pid 19630] nanosleep({4, 0}, 0x7ffff2801c20) = 0
[pid 19630] rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
[pid 19630] rt_sigaction(SIGCHLD, NULL, {SIG_DFL, [], 0}, 8) = 0
[pid 19630] rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
[pid 19630] nanosleep({1, 0}, 0x7ffff2801c20) = 0
[pid 19630] brk(0)                      = 0x605000
[pid 19630] brk(0x626000)               = 0x626000
[pid 19630] rt_sigprocmask(SIG_BLOCK, [CHLD], [], 8) = 0
[pid 19630] rt_sigaction(SIGCHLD, NULL, {SIG_DFL, [], 0}, 8) = 0
[pid 19630] rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
[pid 19630] nanosleep({1, 0}, 0x7ffff2801c20) = 0

Nous venons de voir le brk(unGrandNombreEnHexa) en question.
Regardons vite notre /proc/19630/maps à nouveau (juste touche Flêche-en-haut et ensuite touche Entrée (si vous utilisez bash), pour rappeler la dernière commande dans l'autre terminal). Cette fois on voit bien une nouvelle ligne

00605000-00626000 rw-p 00000000 00:00 0                                  [heap]

brk(0x626000)

/heap

/

less

Quittons à nouveau le less et revenons à l'autre terminal avec l'exécution.
On y voit par la suite apparaître d'autres nanosleep(), etc., et enfin l'execve() de notre m.run, suivi d'un nouveau brk(0), et après plein d'autres appels, on voit enfin un nanosleep(30), qui est celui du programme m.c.

[pid 19630] execve("/home/.../m.run", ...) = 0
[pid 19630] brk(0)                      = 0x602000
[pid 19630] mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0x7eff6fc8a0
...
[pid 19630] rt_sigprocmask(SIG_SETMASK, [], NULL, 8) = 0
[pid 19630] nanosleep({30, 0}, 0x7ffff3e98f50) = 0

Une dernière fois on va alors vite dans l'autre terminal et on regarde à nouveau notre /proc/19630/maps, et là on voit un paysage bien différent. Les premières lignes maintenant parlent de m.run (et non plus d'exo4.run), et il n'y a plus de ligne avec heap.

Vous pouvez remplacer les less par des cat et même sauvegarder dans des fichiers leur résultats. Ainsi vous aurez le déroulement complet, ensemble avec log.txt sauvegardé avec le tee comme suggéré plus haut et vous allez ensuite pouvoir réexaminer le déroulement pour mieux comprendre le tout.

Exo 05. Allouer des segments de mémoire partagée

Dans cet exercice

On met en oeuvre le mécanisme de mémoire partagée d'une manière simple, pour en illustrer le principe de base de son utilisation. On écrit un programme qui demande une zone de mémoire partagée suffisamment grande pour y loger une variable entière, se duplique, et le fils incrémente cette variable entière un nombre de fois. Le père affiche la valeur de la variable avant et après, et on doit ainsi constater qu'elle a bien changé.

Quoi de neuf :

Les wrappers pour acceder à la mémoire partagée sont

Shmget(::key_t key, ::size_t size, int shmflg) -- pour en obtenir une zone aupres du systeme
Shmat(int shmid) -- pour s'y attacher
Shmctl(int shmid, int cmd, ::shmid_ds * buf) -- pour obtenir des valeurs ou changer des attributs
Shmdt(const void * addr) -- pour s'en detacher (comme close() pour les fichiers)
Shmctl(int shmid) -- pour effacer une zone memoire (i.e. la detruire, comme unlink() pour les fichiers)

Travail à faire

Téléchargez l'archive de travail depuis ici. Dedans vous trouverez la structure habituelle des exercices de TP.
Dans exo5.cxx

dans l'espace de noms anonyme, écrivez une fonction FilsPlus() à laquelle on passe :

une variable entiere Var, passée en paramètre donnée-résultat (i.e. réference),
un nombre N de fois qu'elle doit l'incrementer.

Var

N

Var

dans le try-catch du main()

récupérez les deux valeurs de la ligne de commande : la valeur initiale de la variable à incrémenter, ainsi que le nombre d'incréments
créez un segment de mémoire partagée (Shmget()), de taille suffisante pour stocker une variable entière, de clé IPC_PRIVATE, utilisant Shmget()
associez le segment ainsi crée à une variable entière, utilisant Shmat()
initialisez la variable avec la valeur donnée sur la ligne de commande
affichez la valeur de la variable
créez un fils qui exécute la fonction FilsPlus() avec les bons arguments (la variable et la seconde valeur récupérée depuis la ligne de commande
dans la partie père

attendez proprement la fin du fils
affichez la valeur finale de la variable
libérez la ressource, utilisant Shmctl()

Compilez et testez, vérifiant bien en regardant dans /proc/meminfo qu'on libère ce qu'il faut.

Exo 06. Utilisation de `mmap()`

Dans cet exercice

On illustre l'utilisation de mmap(), avec un programme similaire à celui de l'exercice 5.

Quoi de neuf :

L'appel système mmap() permet de mapper des zones de fichiers directement en mémoire, et, si le drapeau MAP_SHARED est è configurè, alors la zone mèmoire sera partagèe (d'habitude entre processus apparentès).
Par ailleurs, le système offre certains fichiers et "périphériques" spéciaux, comme par exemple /dev/zero. Celui-ci est une source infinie d'octets nuls en lecture, acceptant également n'importe quelle valeur en écriture (et l'ignorant).
Si on ouvre alors ce périphérique spécial en lecture/écriture (avec l'appel système open() "classique") et on le mappe en MAP_SHARED> avec mmap() (pouvant ensuite même fermer le périphérique avec close()), ceci nous fournit eégalement un méchanisme de mémoire partagée entre tous ces processus et tous ses descendants.
Le wrapper pour mapper la mémoire est

void * Mmap (void *addr, size_t length, int prot, int flags,int fd = -1, off_t offset = 0)

Travail à faire

Téléchargez l'archive de travail depuis ici. Dedans vous trouverez la structure habituelle des exercices de TP.
Dans exo6.cxx
reprenez l'espace anonyme de exo5.cxx, mais enlevez l'appel à Shmdt()
dans le try-catch du main()

récupérez les deux valeurs de la ligne de commande : la valeur initiale de la variable à incrémenter, ainsi que le nombre d'incréments
ouvrez /dev/zero en lecture/écriture et récupérez son descripteur de fichier
mappez ce descripteur de fichier en mémoire, utilisant MAP_SHARED, ainsi que les bonnes PROT_... pour la lecture/écriture, pour la taille suffisante pour stocker une variable entière
fermez le descripteur de fichier
associez le résultat du mapping à une variable entière
initialisez la variable avec la valeur donnée sur la ligne de commande
affichez la valeur de la variable
créez un fils qui exécute la fonction FilsPlus() avec les bons arguments (la variable et la seconde valeur récupérée depuis la ligne de commande
dans la partie père

attendez proprement la fin du fils
affichez la valeur finale de la variable

Exo 07. `ptrace()` et le changement dans les instructions d'un exécutable --

Dans cet exercice

On met en oeuvre le principe de base d'un débogueur/virus, avec l'appel systèeme ptrace() et la manipulation des registres CPU.

Quoi de neuf :

Présentation de l'appel systèeme ptrace()

L'appel système ptrace() sert essentiellement dans le debogage. Il permet à un processus parent d'interrompre un autre processus, de le faire tourner pas-à-pas, de l'inspecter et même de le modifier. Le processus parent traceur utilise wait() pour être informé de chaque moment où le processus tracé est ainsi interrompu. Le traceur peut alors donc l'inspecter, le faire tourner "encore un peu", le modifier, etc. et l'attendre à nouveau avec wait() pour itérer ainsi.
Afin de pouvoir utiliser pleinement ptrace() il faut également une connaissance de l'architecture du CPU qu'on utilise. Les requêtes de ptrace() sont

PTRACE_{TRACEME,ATTACH,DETACH} -- s'attacher à et se détacher d'un processus
PTRACE_PEEK{USR,DATA,TEXT} -- lecture de la mémoire
PTRACE_POKE{USR,DATA,TEXT} -- écriture dans la mémoire
PTRACE_{SET,GET}REGS -- manipulation des registres
PTRACE_{SYSCALL,SINGLESTEP,CONT} -- mode de traçage

Il y a deux façons de s'attacher :

PTRACE_TRACEME : Le processus parent traceur fait d'abord un fork(), et dans le fils, ptrace() est appellé donc ainsi :

ptrace(PTRACE_TRACEME, 0 ,NULL, NULL);

wait()

ptrace()

PTRACE_ATTACH : Le processus traceur s'attache à un processus déjà existant, en stipulant la requête PTRACE_ATTACH ainsi que le PID du processus auquel on souhaite s'attacher.

ptrace(PTRACE_ATTACH, PID ,NULL, NULL);

getppid()

PTRACE_TRACEME

Vie du processus tracé (suivi) :
Une fois que le processus commence à être suivi, il s'arrêtera à chaque fois qu'un signal lui sera délivré, meme si le signal est ignoré (à l'exception de SIGKILL qui a les effets habituels). Ainsi, si un masque est actif, on suit le processus même dans le traitant du signal. On peut également lui faire ignorer le signal, lui envoyer un autre signal ou meme exécuter un tout autre traitant ! Et le scheduler redonne donc la main au processus traceur, qui sera prevenu au premier wait(). Il pourra alors inspecter et/ou modifier le processus fils pendant son arrêt.
De plus, un processus suivi reçoit automatiquement un signal SIGTRAP lorsqu'il fait l'appel systeme execve(), donc le traceur peut dans ce cas aussi en être prevenu avec un wait(). Enfin, si le traceur utilise par exemple PTRACE_SINGLESTEP, alors le processus suivi exécute une seule instruction, et le traceur peut à nouveau utiliser wait() pour savoir quand le processus suivi a fini cette instruction. Dans tous ces cas, le traceur utilise donc wait() (et les macros connues -- WIFSTOPPED, WSTOPSIG, etc.) pour "savoir ce qui se passe".
Quand le traceur a finit de tracer le fils, il peut le libérer avec PTRACE_DETACH ou le tuer avec PTRACE_KILL. De même, le traceur sera aussi inform&eauite; si son fils tracé est mort, avec par exemple wait() (et les macros habituelles).

Manipulation des registres CPU avec l'appel systèeme ptrace() Les registres CPU sont des "petits bouts de mémoire", et ils sont directement logés sur le processeur. Ils servent à contenir les opérandes et résultats des opérations arithmétiques, logiques, de lecture/écriture dans la mémoire, etc. effectuées par le processeur. Pour un processus donné, les valeurs de ces registres font partie de qu'on appelle le contexte du processus (qu'on sauvegarde lors des changements de contexte, pour les retrouver quand on reprend l'exécution du processus).
Chaque type de processeur (architecture) a son propre jeu de registres et conventions pour leur utilisation. Ainsi, le code du noyau et les appels système ont également des implémentations spécifiques en termes d'utilisation des registres. Typiquement les processeurs ont des registres à usage général, ainsi que des registres spéciaux, comme le pointeur d'instructions et celui de pile.
Pour les processeurs Intel x86

eip est le pointeur d'instructions (Extended Instruction Pointer)
esp est le pointeur de pile (Extended Stack Pointer)
eax est utilisé pour les appels système -- on y met le code de l'appel souhaité
ebx, ecx, edx, etc. utilisés (entre autres) pour les paramètres des appels système

Chaque appel système (comme read(), write(), etc.) est identifié par un code numérique. Ce code est accessible en C/C++ puisqu'il est défini symboliquement dans les fichiers d'en-tête système, typiquement sous la forme SYS_NomDeLAppel :

SYS_getpid pour getpid()
SYS_write pour write()
etc.

Donc par exemple pour un appel système à write(), la valeur SYS_write sera mise dans eax et le paramètre nombre d'octets à écrire sera mis dans edx:

#include 
#include 
const char str[] = "Ca va\n les enfants?\n";
int main() {
  write(1, str, strlen(str));
  return 0;
}

L'appel système ptrace() avec PTRACE_GETREGS remplit une structure spéciale nomméee user_regs_struct avec les valeurs des registres. La définition de cette structure est bien entendu dans les fichiers d'en-tête système (et change d'une architecture à l'autre). Pour x86 32 bit on retrouve comme champs exactement eax, edx etc., ainsi que le champ orig_eax. Pour x86 64bit, le 'e' est remplacé par 'r': rip, rsp, rax, rdx, etc.
Lors d'une interruption de traçage qui survient quand le processus suivi est sur le point de faire un appel système, quand on fait ptrace() avec PTRACE_GETREGS, c'est donc orig_eax qui est rempli avec la bonne valeur SYS_NomDeLAppel de l'appel. On peut ainsi savoir quel appel système allait être exécuté. Enfin, si on met des valeurs dans ces champs et qu'on appelle ensuite ptrace() avec PTRACE_SETREGS, on arrive à modifier les valeurs se trouvant dans les registres du CPU pour le contexte du processus tracé, donc lorsque l'exécution de celui-ci est reprise, il trouvera ces valeurs-là changées "à son insu". Cceci peut ou pas être "grave" -- par exemple, lors de son déboguage, on peut légitimement souhaiter changer une variable du programme, et si celle-ci se trouve dans un registre, on aura donc bien besoin de changer la valeur de ce registre.
Pour compléter la discussion, il faut mentionner l'appel système syscall() qui reçoit comme argument justement la valeur donnant le code d'un appel système souhaité (donc comme SYS_write, ou SYS_read, etc.) et exécute cet appel (il faut bien entendu avoir proprement mis ses paramèetres dans les registres, etc.). (Ceci est d'ailleurs exactement une partie du rôle des wrappeurs des appels système, pour qu'on puisse les utiliser depuis des programmes C sans avoir à manipuler des registres).
Enfin, il faut noter qu'on peut également manipuler la pile, à l'aide des registres eip et esp pour faire un processus exécuter du code arbitraire : on peut écrire le code machine souhaité sur la pile (donc là où esp pointe dans la mémoire, on sauvegarde le eip sur la pile (pour avoir comment revenir au code initial), et on écrase la valeur d'eip avec la valeur d'esp. Ainsi, le flot d'exécution des instructions arrive sur la pile sur le code arbitraire ainsi mis. Ceci ne fonctionne pas si le système protège la pile en la rendand non-exécutable.
Travail à faire

Créez un processus père qui compte les instructions asm effectuées par son fils qui fait exec() d'un utilitaire (e.g. /bin/ls), utilisant bien entendu PTRACE_TRACEME dans le fils, et wait() dans une boucle avec PTRACE_SINGLESTEP dans le père.
Comment peut-on faire en sorte qu'un processus ne puisse pas être tracé ?
Sauvegardez le petit programme ci-dessus qui tente d'écrire "Ca va\n les enfants?\n" sous le nom exo7f.c, compilez-le
```
   gcc -o exo7.run exo7.c
```
et testez-le. Écrivez un petit programme qui se duplique et dont le fils et tracé par son père et fait exec() de exo7f.run. Le père fait en sorte que le fils n'affiche pas toute la chaîne mais seulement les cinq premiers caractères.

Cours de Systèmes d'exploitation avancé

TDTP2 -- Géstion de la mémoire

Exo 01. Structure des fichiers executables (adresse et taille d'une variable)

Dans cet exercice

Quoi de neuf :

Exo 02. Placer les variables du programme dans de sections mémoire d'un processus

Quoi de neuf :

Optionnels

Quoi de neuf :

Exo 03. Changements dans les variables d'un exécutable

Quoi de neuf :

Exo 04. exec() vide les segments mémoire d'un processus

Quoi de neuf :

Exo 05. Allouer des segments de mémoire partagée

Dans cet exercice

Quoi de neuf :

Exo 06. Utilisation de mmap()

Dans cet exercice

Quoi de neuf :

Exo 07. ptrace() et le changement dans les instructions d'un exécutable --

Dans cet exercice

Quoi de neuf :

Exo 04. `exec()` vide les segments mémoire d'un processus

Exo 06. Utilisation de `mmap()`

Exo 07. `ptrace()` et le changement dans les instructions d'un exécutable --