Les Archives des Forums du Repaire
Forum MPEG, DVD, SVCD...

Discussion : Paramétrage MPEG2
Author : Sly
Posted : 19-May-2000 17:54:46
J'aimerai ouvrir un nouveau sujet, sur ce forum, sur le paramétrage MPEG. Voilà quelques temps que je bidouille pour parvenir à une qualité acceptable mais sans connaître, dans le détail, l'influence de chacun des paramètres. Si les plus avertis d'entre nous veulent bien aider à la compréhension des grands principes, ça nous éviterait (à moi tout particulièrement) de longues heures de tests infructueux !
Je me lance dans le débat avec ce que je crois savoir ou avoir compris, merci de corriger :
1. GOP (Group Of Pictures) : c'est un groupe d'images (bravo la traduction !) composé de frames ; I (intra), P (« prédictées ») & B (bidirectionnelles). La I est une frame (de type « JPEG » pour simplifier) calculée complètement à partir de l'image originale, elle se suffit à elle-même. La P reprends le calcul de la I ou de la P précédente et ne recalcule que ce qui a changé (en fonction du vecteur de mouvement « motion vector » spécifié !?). La B est constituée sur la même démarche que la P mais en fonction des frames I et/ou P qui l'entourent (précédentes et suivantes).
Ceci étant dit, j'imagine que la taille d'un GOP dépend du bit rate disponible ! Je m'explique, avec un GOP réduit à sa plus simple expression (que des I) il faut un bit rate véloce pour pouvoir encoder/décoder chaque image entièrement ! J'ai essayé d'encoder que des I frames avec un VBR de 2.5mbps, pensant obtenir la « meilleure » qualité (que des images clés construites à partir de l'AVI original), hé bien c'est tout le contraire, je pense que chaque I est super compressée (une mosaïque) pour tenir dans le VBR, vrai ? !
Inversement, plus le GOP sera long et plus on entrera facilement dans le bit rate mais au détriment de quoi ! ? De la qualité bien sûr, mais laquelle ! ? La finesse des images ; je ne crois pas ! Si les images clés (I) sont bonnes, les P & B le seront puisqu'elles en découlent ! ? Par contre, on va trouver ici et là des parties d'images qui sembleront figées parce qu'elles sont considérées comme inchangées par l'algorithme de calcul (on trouve cela même sur les meilleurs DVD ou sur les images numériques du câble), vrai ? ! Donc, on va perdre de la qualité en distorsion d'images et peut être en fluidité (ça serait logique) mais à ce point de vue, je n'arrive pas à avoir une opinion réelle (parce que finalement j'ai plutôt expérimenté le contraire, ça m'embrouille). Les frames P & B permettent de gagner de l'espace ... d'accord, mais quelle est la bonne proportion (j'ai testé pas mal de démos d'encodeurs et chacun y va de sa formule par défaut, je n'ai pas trouvé un tronc commun) ?
Mais tout cela, n'est-ce pas du détail, si on arrive pas à encoder une I frame dans une qualité acceptable, c'est la clé de tout le reste ! Or en faisant un calcul bête et méchant (les spécialistes seront peut être choqués par cette approximation), pour une qualité DVD on dispose d'un bit rate maxi de 7.5mbps, autrement dit 307 kb/frame (38Ko) ce qui paraît suffisant pour une image 720x576 quand on compare au JPEG ! Par contre, pour du SVCD on ne dispose que de 2.6mbps maxi, autrement dit 106kb/frame (13Ko) pour une image 480x576 ; 3 fois moins pour une image seulement 1.5 fois plus petite, donc 2 fois plus compressée ! Pour le VCD (MPEG1) on a une image compressée seulement d'un tiers par rapport au DVD (mais il y a 4 fois moins de points, par conséquent moins de « piqué »). Je ne sais pas si cette « théorie » est exacte car je me base sur un bit rate maxi par frame, si c'est au niveau du GOP, j'ai tout faut (sauf quand il n'y a que des I) !
2. Motion Vector (Vecteur de Mouvement) : je pense que c'est la zone de recherche d'un changement dans le calcul d'une frame P ou B. On doit fixer les valeurs verticales et horizontales par multiples de 8 pixels (8 étant le minimum). A 8 en H&V, on divise l'image SVCD en 4320 rectangles (60x72). Chaque rectangle est comparé à sa référence, s'il a suffisamment changé, on le recalcule sinon il est copié de l'image de référence (c'est schématique). Autrement dit, plus il est de petites dimensions et moins il y a de chance de déceler un changement. Ce qui provoque, à mon sens, un effet mosaïque, quand un rectangle ne change pas alors que ses voisins ont évolués (discontinuité). En conséquence plus le motion vector est grand, plus l'image sera recalculée, meilleure sera la qualité restituée mais au détriment de l'espace disque. Encore une fois ce raisonnement ne tient que si le bit rate maxi est fixé par frame ! S'il l'est par GOP, ça complique car si les P&B doivent être fortement recalculées, il ne restera plus assez de bit rate pour que l'image I soit bonne (et inversement).
3. Profile & level : je ne sais pas ce que cela représente concrètement (j'ai la définition des différents profils et niveaux mais à part ça ! ?). Je pense avoir déceler un meilleur rendu avec HP@HL mais c'est subjectif.
4. Performance dans LSX : là encore c'est le mystère, very fast, fast, normal, slow, very slow, on comprend que c'est la vitesse d'encodage mais sur quelle base ?
En écrivant ces lignes, je suis de plus en plus convaincu que le bit rate est attribué par GOP et distribué entre I, P & B de différentes manières selon le mode de performance sélectionné, ce qui n'est pas fait pour simplifier le raisonnement.

Il y a sûrement beaucoup de contrevérités dans ce qui précède, mais bon j'ai essayé de lancer le débat, à vous de me corriger.
Salut

Author : Phil29
Posted : 21-May-2000 14:31:44
J'ai pas tout lu (désolé on est dimanche matin) mais le GOP n'est pas le seul paramètre de qualité pour le DVD. Je ne peux pas te répondre pour le paramétrage des softs qui calculent à partir d'un AVI car je travaille sur une station autonome pour du MPEG2. Sur cette station, je ne joue jamais sur la longueur du GOP qui reste à 12 ce qui est en général la "norme" en DVD. Raccourcir la longueur du GOP ne présente pour moi qu'un avantage c'est l'accès à l'image clé pour mettre des marqueurs de chapitre ou couper le fichier dans le logiciel d'authoring si celui si le permet. En maintenant un GOP de 12, tu peux jouer sur le débit soit en paramétrant un débit constant (cbr) plus élevé, soit en travaillant en taux variable (vbr) de façon à ce que le logiciel encode en fonction de la complexité de l'image (bonjour le temps de calcul).Pour simplifier et comparer à la vidéo, tu as toujours 25 images par secondes mais tu peux paramétrer ton débit pour avec une plus forte compression (par exe en maquette)ce qui détruit plus de données redondante mais ce qui ne modifie en rien ta fréquence d'image. Pour le MPEG2 c'est idem. TU peux très bien conserver le même GOP et encoder avec des flux différents.
Pour du DVD, la source d'origine et la qualité de l'encodage est primordiale pour obtenir du bon boulot et notamment le niveau de bruit est important. Une bonne carte d'encodage MPEG2 permet de descendre en dessous des 5 mégas sans que celà se voit et les tests que j'ai fait entre un encodage à 8 méga et à 5 mégas ne montrent pas de différences fondamentales, en tous les cas pas visible sur une diffusion dans des conditions "normales" (sur écran en pal et enliaison composite) alors que j'encode régulièrement des images pas évidentes. Par contre, une donnée importante aussi est le bit budgeting. Quand je sais que j'ai de la place sur le média final, je monte un peu le débit, en général à 6 mégas. De toute façon, si tu montes trop le débit (audio et vidéo confondus) on risque de dépasser la norme du DVD et un bon logicile d'authoring te le signale et refuse la création du Vidéo TS

En encodage soft, j'ai pas encore réussi à avoir la qualité suffisante dans tous les cas de figure et celà même si la source d'origine est bonne.

Author : Michel LP
Posted : 24-May-2000 15:37:44
bonjour à tous,

vos réflexions sont tout à fait intérressantes.

Pour ma part, si je me suis intérressé au MPEG, c'est qu'il m'est vite apparu que c'était une science ... inexacte !

En effet, le cinéma (et la vidéo) n'est possible que par une particularité de l'homme : la perstitance rétinienne.
Grâce à elle, le cerveau humain est capable de reconstituer une illusion du mouvement.
A noter que de nombreux animaux, pour lesquels l'accuité visuelle et surtout la détection des moindres mouvements est vitale, n'ont que très peu ou pas de perstitance rétiniennne. C'est le cas des prédateurs en général et de notre ami le chien ,entre autres. Quoiqu'en disent certaines pubs, ils ne peuvent pas regarder la télé !
(Je le sais : mon chien JAZZ me l'a dit !)

Revenons à la vidéo et plus particulièrement au MPEG. On a poussé l'analyse de la perception visuelle de l'homme dans ses retranchements et utilisé à profit les imperfections de notre oeil et de notre cerveau.

C'est un peu la démarche inverse de celle qui a conduit à la "Haute Fidélité" à l'époque des premiers tourne-disques. Ceux-ci étaient bien incapables de rendre les sons graves d'une contre-basse, mais les cerveaux humains qui avaient déjà entendu les notes réelles de cet instrument, étaient capables de reconstituer le son global à partir des harmoniques hautes de la musique, et ainsi de reconnaître l'artiste.

Avec le MPEG (et autres ondelettes) on essaye de dégrader le signal le plus possible "sans que cela se remarque".
Et c'est là que tout devient subjectif et inexact (au sens scientifique).
Et passionant donc !

Cela est bien connu : la qualité du rendu des images est de moins en moins perceptible au fur et à mesure que les qualités artistique et du scénario croissent.

Je suis sûr d'ailleurs, que lorsqu'un (ou une) d'entre nous sur ce forum, trouve un résultat MPEG bon, d'autres (s'ils pouvaient le voir) y trouveraient à redire, et réciproquement.

Pour être plus pragmatique cependant, je dirais (très subjectivement donc, mais basé sur mon expérience...) :

- le plus important, c'est la qualité de la source, avec son débit le plus élevé possible.
L'absence d'images "agitées".
Pour la petite histoire, pour certains films en VideoCD, on a du refaire la prise de vue de certaines séquences (ou les suprimer) pour que cela passe correctement.
L'absence de bruit de fond vidéo est aussi très importante. Les encodeurs pro utilisent des filtres très sophistiqués (et très difficiles à bien paramétrer...) avant l'encodage proprement dit.

Mais déjà, cela varie d'une scène à l'autre...

- ensuite le bitrate. La qualité croit avec le bitrate, dans certaines limites bien sûr.
Le bitrate variable du MPEG-2 est à choisir dans presque tous les cas.
Le choix "slow" de LSX peut (je dis bien : peut !) être intéressant.

- ensuite la qualité de l'encodeur. Ils sont loins d'être équivalents, car dans la course aux performances de temps de conversion, ils jonglent avec la norme MPEG et font des impasses.
Ce qui complique tout (avec les softs amateurs) c'est que l'un peut être meilleur qu'un autre sur une scène de votre film et réciproquement sur une autre scène.
De plus leurs codec sont différents, au point de ne pas toujours être compatibles.
Je pense que c'est pour cela qu'il est pratiquement impossible de concaténer correctement des MPEG-2 faits avec des encodeurs différents.

- ensuite, le choix MPEG traditionnel (I,P,B) ou en images I seules.

- enfin, ... eh bien il n'y a pas d'enfin vous vous en doutez déjà, les autres modifications de paramètres deviennent subtiles et n'influent que peu sur le résultat final.

Un dernier conseil, faites regarder vos MPEG par une autre personne : contrairement à vous, elle sera interressée par le sujet du film avant sa qualité MPEG, et sera
subjectivement... objective !

Oh, là là qu'est-ce que j'ai dit !

MLP
Author : tmikul
Posted : 02-Jun-2000 22:58:26
bonjour

Desolé pour ce hors-sujet mais il y a une chose qui m'a surpise dans le message se Michael. Tu dis que les chiens ne voient rien sur la télé. Mais ce qui est bizarre c'est que mon chien voit les animaux sur notre TV. Quand il est couché devant elle, dès qu'un animal commun apparait (chat, chien...) sans qu'il y ait le son , il commence à se jeter sur l'écran et aboie. J'ai fait le test avec le son coupé et ca marche encore. Est-ce que j'ai un chien qui sort hors du commun? Paradoxalement, les animaux sur des photos ne lui font aucun effet.

Tom
Author : jop
Posted : 03-Jun-2000 12:52:20
C'est grandiose, le web !!
Je cherche du paramétrage MPEG, je trouve des chiens qui regardent la télé ! Ce forum est une mine de savoir !
Sinon, côté mpeg , quand j'exporte en mpeg2/wav avec Impression CD 2, ça marche mais le son a 3 s de retard. On parle de "multiplexage" pour réglé le pb. C'est quoi ?

(mon chien, il n'aime pas la télé, mais je ne sais pas si c'est qu'il ne peut pas ou qu'il ne veut pas)
A bientôt
Author : Michel LP
Posted : 08-Jun-2000 15:49:48
Bonjour,

pour Tmikul :
Cette histoire de chien qui n'ont pas de persistance rétinienne je ne l'ai pas inventée, ce sont des souvenirs de lecture d'un livre sur le cinéma. Je ne n'ai bien sûr fait aucun test là-dessus ! mais je pense que cela s'appuie sur des éléments scientifiques sérieux.

pour Jop :

Le multiplexage peut être défini comme l'action de réunir dans un meme signal deux signaux différents, sans les mélanger.
C'est une technique très employée, par exemple, en téléphonie où l'on fait passer dans la meme "paire" (2 fils) plusieurs conversations téléphoniques différentes qui ne se mélangent pas.
Il y a de nombreux procédés de multiplexage.
Dans le cas qui nous occupe, il s'agit de véhiculer dans un meme stream (courant, signal) le signal vidéo et le signal son.
Le MJPEG est en fait un procédé de multiplexage d'images JPEG avec du son (PCM/WAV le plus souvent).

Je ne connais pas Impression CD 2, et ne comprend pas bien ton expression "MPEG2/wav".

Ce que je peux dire c'est qu'en MPEG-1, qui est à débit vidéo quasiment constant, on peut multiplexer la vidéo et le son "au fil de l'eau" sans trop de problème, mais ce n'est pas la meilleure méthode.
Ce n'est plus du tout le cas en MPEG-2 à débit variable, tant pour la vidéo que pour le son.
Il est alors indispensable de faire le multiplexage en mettant des points d'ancrage régulièrement entre image et son pour conserver la synchro.
Dans les softs de montage comme MSP, on peut choisir la fréquence de ces points d'ancrage (ce peut être au mieux image par image).

Il est possible que tu ais oublié un paramètre de ce genre dans Impression.

L'autre possibilité est que ton player MPEG-2 décroche complètement en démultiplexant pour la lecture : trop de difficultés (manque de ressources ?) pour décoder quelques images et la désynchro est telle qu'elle ne peut plus être remise d'aplomb. Elle ne fait que s'amplifier.

La pluspart du temps cependant, les players donnent la priorité au son, quitte à avoir des saccades dans certains passages si le système manque de ressources.

cordialement
MLP