Langage machine

Le langage machine, ou code machine, est la suite de bits qui est interprétée par le processeur d'un ordinateur exécutant un programme informatique.



Catégories :

Langage machine - Microprocesseur

Recherche sur Google Images :


Source image : blogs.onisep.fr
Cette image est un résultat de recherche de Google Image. Elle est peut-être réduite par rapport à l'originale et/ou protégée par des droits d'auteur.

Définitions :

  • Langage permettant de donner des instructions à un processeur, et qui dépend du type de processeur (source : fr.wiktionary)

Le langage machine, ou code machine, est la suite de bits qui est interprétée par le processeur d'un ordinateur exécutant un programme informatique. C'est le langage natif d'un processeur, c'est-à-dire l'unique qu'il puisse traiter. Il se compose d'instructions et de données à traiter codées en binaire.

Chaque processeur possède son propre langage machine par conséquent un code machine ne peut s'exécuter que sur la machine pour laquelle il a été préparé. Si un processeur A est capable d'exécuter l'ensemble des instructions du processeur B, on dit que A est compatible avec B. L'inverse n'est pas nécessairement vrai : A peut avoir des instructions supplémentaires que B ne connaît pas.

Le code machine est actuellement généré automatiquement, le plus souvent par la compilation d'un langage de programmation ou par l'intermédiaire d'un bytecode.

Instructions du langage

Les «mots» d'un langage machine sont nommés instructions. Chacune d'elles déclenche une commande de la part du processeur (par exemple : chercher une valeur dans la mémoire pour charger un registre, additionner deux registres, etc. ).

Un processeur à architecture RISC ne reconnaît que peu d'instructions différentes, tandis qu'un processeur à architecture CISC en possède un large éventail. Néanmoins certains processeurs CISC récents transforment en interne les instructions complexes en une suite d'instructions simples, qui sont alors exécutées.

Un programme est juste une longue séquence d'instructions qui sont exécutées par le processeur. Elles sont exécutées séquentiellement sauf lorsque une instruction de saut transfère l'exécution à une autre instruction que celle qui suit. Il existe aussi des sauts conditionnels qui sont soit exécutés (l'exécution continue à une autre adresse) ou ignorés (l'exécution continue à l'instruction suivante) selon certaines conditions.

Opcode

Chaque instruction débute par un numéro nommé opcode (ou code opération) qui détermine la nature de l'instruction. A titre d'exemple, pour les ordinateurs d'architecture x86, l'opcode 0x6A (en binaire 01101010) correspond à l'instruction push (ajouter une valeur en bas de la pile). Donc, l'instruction 0x6A 0x14 (01101010 00010100) correspond à push 0x14 (ajouter la valeur hexadécimale 0x14 en bas de la pile).

Longueur des instructions

Certains processeurs codent toutes leurs instructions avec le même nombre de bits (par exemple : ARM, MIPS, PowerPC), alors que chez d'autres la longueur de l'instruction dépend de l'opcode (exemple : x86). L'organisation des combinaisons de bits dépend beaucoup du processeur. Le plus commun est la division en champs. Un ou plusieurs champs spécifie l'opération exacte (par exemple une addition). Les autres champs indiquent le type des opérandes, leur localisation, ou une valeur littérale (les opérandes contenus dans une instruction sont nommés immédiat).

Avantages et inconvénients

Quand l'ensemble des instructions ont la même taille elles sont aussi alignées en mémoire. Par exemple si l'ensemble des instructions sont alignées sur 32 bits (4 octets), alors les deux bits de poids faibles de l'adresse mémoire de n'importe quelle instruction sont à zéro. Cela permet surtout une implémentation plus aisée du cache des prédictions de branchement bimodales.

En revanche le code machine prend moins de place en mémoire s'il ne possède pas de taille minimum, étant donné qu'on élimine les champs non utilisés.

Écriture du code

Bien que le langage machine était l'unique disponible à l'aube des ordinateurs, il est actuellement particulièrement long et fastidieux de développer en binaire ; il faut passer par un et fréquemment plusieurs langages intermédiaires.

De particulièrement nombreux langages de programmation sont transformés en langage machine lors de la compilation. L'ensemble des programmes exécutables contiennent au moins une petite partie en langage machine.

Le langage le plus facile a convertir en code machine est l'assembleur car il possède presque les même instructions. Des langages de plus haut niveau comme C ou C++ sont convertis en assembleur au cours de la compilation. Les langages utilisant une machine virtuelle passent par un bytecode qui est convertie à la volée par la machine virtuelle.

Exemples

Processeur MIPS

Comme exemple spécifique, regardons l'architecture MIPS. Ses instructions ont toujours une longueur de 32 bits. Le type général de l'instruction est donné par les 6 bits de poids les plus forts (dans une représentation sur 32 bits, les 6 de gauche), qu'on nomme le champ op.

Les instructions de type-J et de type-I sont pleinement spécifiées par le champ op. Les instructions de type-R ont un champ supplémentaire, fonct, pour déterminer la nature exacte de l'opération. Les champs de ces 3 types d'instructions sont :

   6      5     5     5     5      6 bits
[  op  |  rs |  rt |  rd |shamt| fonct]  type-R
[  op  |  rs |  rt | adresse/immédiat ]  type-I
[  op  |        adresse cible         ]  type-J

rs, rt, et rd indique des opérandes de type registre ; shamt indique un décalage (shift amount)  ; et le champ adresse ou immédiat contient un opérande sous forme de valeur.

A titre d'exemple, ajouter les registres 1 et 2 et placer le résultat dans le registre 6 est codé :

[  op  |  rs |  rt |  rd |shamt| fonct]
    0     1     2     6     0     32     décimal
 000000 00001 00010 00110 00000 100000   binaire

Charger une valeur depuis la cellule mémoire 68 cellules après celle pointée par le registre 3 dans le registre 8 :

[  op  |  rs |  rt | adresse/immédiat ]
   35     3     8           68           décimal
 100011 00011 01000 000000000001000100   binaire

Sauter à l'adresse 1025 (la prochaine instruction à exécuter se trouve à l'adresse 1025)  :

[  op  |        adresse cible         ]
    2                 1025               décimal
 000010 000000000000000000010000000001   binaire

Processeur ARM

Les processeurs de l'architecture ARM sont un cas spécifique étant donné que l'ensemble des instructions sont conditionnelles. Elles sont toutes d'une longueur de 32 bits, et leur 4 premiers bits indiquent dans quelles conditions l'instruction doit être exécutée.

Voir aussi

Recherche sur Amazone (livres) :




Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Langage_machine.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu