Comme son nom l’indique, une image de synthèse est une image créée par ordinateur, une représentation en trois dimensions d’un monde virtuel.
L'image de synthèse est tout d'abord définie par la scène, qui contient tous les objets (cubes, sphères...) ainsi que les lumières et les caméras. Cette scène est communément appelée "world" ( du mot anglais qui signifie "monde" ), et elle est munie d'un repère à trois axes, composé des vecteurs X ( longueur ), Y ( hauteur ) et Z ( profondeur ), ces vecteurs étant perpendiculaires deux à deux, ainsi on obtient une base orthogonale.
Mais les objets eux-mêmes peuvent posséder leurs propres repères, et il est donc nécessaire de distinguer les différents repères :
- le repère global, qui est fixe et qui sert de repère général à la scène.
- les repères objets, ou repères locaux, qui sont des repères spécifiques à certains objets, qui permettent la plupart du temps d'exprimer les coordonnées des différents sommets de ces objets.
- le repère caméra, qui est comme un repère objet, mais qui sert à la caméra.
- le repère écran, qui est un repère "physique", qui représente la surface de l'image obtenue, et il ne possède que deux coordonnées puisqu'il est en deux dimensions X et Y. Sur un PC par exemple, les coordonnées de ce repère écran sont définies à partir du point en haut à gauche de l'écran, qui correspond au point de coordonnées ( 0; 0 ), l'axe X allant de la gauche vers la droite et l'axe Y du haut vers le bas.
Chaque point est défini par ses coordonnées dans le repère global et dans les repères objets, et on peut ensuite grâce à ces points réaliser un modèle en "fil de fer" de l'image, les fils correspondant aux arêtes des objets, puis on peut appliquer des textures sur ces modèles en fil de fer, et grâce aux lumières elles aussi définies dans le repère global, on obtient des effets de lumière et d'ombre sur les objets, qui varient en temps réel.
Puis on définit le repère caméra, qui correspond au point de vue que l'on aura sur les différents objets, et on définit enfin le repère écran, qui montre quelle image on obtiendra sur l'écran de l'ordinateur ; ainsi, à chaque position de la caméra correspond une image différente qui s'affiche sur le moniteur.
Le rendu fil de fer d’un objet peut être considérée comme son squelette. Cette technique vise à afficher uniquement les arêtes de l’objet. Il s’agit de l’ébauche de la construction de l’image. Cette technique permet une vision en 3D de l’objet voulu. Elle est très rapide, mais manque de clarté. Cette vision de l’objet peut être rendue plus facile en masquant les arêtes en arrière plan et en ne laissant que les arêtes visibles de l’objet.
A partir de celle-ci, on peut parvenir à une image 3D de grande qualité. L’image 3D est donc composée de polygones. Pour les rendre exploitables, on leur attribue des coordonnées. Pour cela, chaque coin du polygone est relié par un trait au point lui faisant face. Cela permet de diviser le polygone en triangles (ou triangles de surface) qui sont alors calculables à partir de trois points. On obtient ainsi toute une série de coordonnées (X, Y, Z) qui vont permettre de représenter l’image voulue. X représente la coordonnée horizontale, Y représente la coordonnée verticale et Z représente la profondeur.