C’est l’une des spécificités originelle de MPEG-4 que d’intégrer les objets de synthèse. Pour la reproduction du corps humain, MPEG-4 définit un modèle standard en 3D et va assurer la description des paramètres pour la gestion et l’animation des visages et des corps. A la base, un modèle “neutre”, (préalablement téléchargé ou déjà inclus dans le terminal) et la possibilité d’une animation (expression, configuration des lèvres pour la parole) réalisée grâce aux différents paramètres transmis dans le flux numérique. Il est aussi possible de personnaliser ce modèle (en modifiant la forme et les textures du visage par exemple...) ou de faire appel à des modèles complets (les modèles ne sont pas normalisés, seuls les paramètres le sont). La même technique peut être appliquée pour la représentation du corps dans sa totalité : 175 paramètres (dont 50 pour les deux mains) répartis en 19 groupes sont alors nécessaires.
Même si cet aspect de MPEG-4 n’est plus (provisoirement) sous les feux de la rampe, des travaux ont néanmoins été poursuivis dans ce sens. Ainsi par exemple l’unité de projet ARTEMIS au sein de l’INT (Institut National des Télécommunications à Evry) qui travaille sur un dispositif destiné aux personnes déficientes auditives et qui permet, à travers l’animation d’un personnage virtuel, la traduction semi-automatique de texte dans le langage des signes.