module inscription newsletter haut de page forum mobile

Rejeter la notice

Nouvelle Formation Prise de son : les inscriptions sont ouvertes !
Maîtrisez la qualité de vos prises de son avec notre formation théorique et pratique de 3 jours ! Du 14 au 16 mai 2024 à Paris.

[Problème] Qu'est-ce qu'un FORMAT de VIDEO ?

Discussion dans 'Les formats' créé par guy-jacques, 17 Janvier 2014.

Tags:
  1. guy-jacques

    So

    Points Repaire:
    9 200
    Recos reçues:
    156
    Messages:
    9 236
    Appréciations:
    +83 / 289 / -3
    Aujourd' hui... 17 jan 2014 ... deux discussions m'interpellent qui impliquent la notion de FORMAT VIDEO.
    En photo "argentique" le terme "format" ne posait pas problème: on avait un appareil 6 x 9 ; 6 x 6 ; 4 1/2 x 6 ; 24 x 36... pour les plus populaires et amateur (pas que)...
    En vidéo, on a tendance à voir l' analogie et à confondre format d' image et format vidéo... et mêm avec autre(s) chose(s) comme codec ou conteneur.

    Je ressors des oubliettes ce pensum un peu rafraîchi pour l' occasion.

    Pour moi, un format vidéo est un cahier des charges qui définit les caractéristiques de la vidéo produite par un camescope ou un logiciel selon certains choix de ces caractéristiques, alors, de quoi estil question dans le:

    CAHIER des CHARGES d’un FORMAT VIDEO

    1- Ratio d' image
    C’est la proportion Largeur : Hauteur de l’image indépendamment de ses dimensions effectives et de sa pixellisation.
    -- 4 : 3
    -- 16 : 9
    -- Autres comme ratio(s) cinéma

    2- Définition d' image
    -- est déterminée par la fréquence d' échantillonnage de la Luminance
    -- 1 échantillon de Luminance = 1 pixel
    Ainsi,
    - les formats SD (Définition Standard) "ponctionnent" 720x576 (25 fois par seconde en zône "pal") ou 640x480 (30 fois par seconde en zône "ntsc") valeurs de Luminance
    - pour les formats HD c'est soit 1280x720 ou 1440x1080 ou "full" 1920x1080 pixels/image
    - avec le 4K une déclinaison double les facteurs du Full HD avec 3840x2160 et une autre (avec K=1024) et se base sur 4096x2160… D'autres définitions 'hyperHD' sont attendues…
    -- Définition et Ratio provoquent "pixel carré" ou bien "pixel rectangulaire" (expression "commode")
    --Ratio et/ou définition d’image sont assez souvent dénommés format d’ image , ce n’est qu’une information parmi celles comprises dans format vidéo .

    3- Sous-échantillonnage de la Chrominance
    -- chaque signal de Chrominance [ U ou V ] est très rarement échantillonné à la même fréquence que la Luminance, mais, si c'est le cas, c'est noté 4;4;4; chaque pixel est unique propriétaire de chacune des composantes Y, U et V.
    -- pour fournir assez d' information pour un travail approfondi de post-production, chaque signal de Chrominance est échantillonné à une fréquence moitié de celle de la Luminance, si c'est le cas, c'est noté 4;2;2 chaque échantillon de chrominance est commun à 2 pixels.
    -- beaucoup de formats se contentent d' échantillonner chaque signal de Chrominance à une fréquence 4 fois moindre que la Luminance, si c'est le cas chaque échantillon de chrominance est commun à 4 pixels et, c'est noté:
    --- 4;1;1 lorsque les 4 pixels "copropriétaires" sont consécutifs sur une même ligne,
    --- 4;2;0 lorsque les 4 pixels "copropriétaires" sont disposés en carré ( ou losange ) sur deux lignes consécutives.

    4- Profondeur d' échantillonnage ( ou d' analyse)
    -- c'est le nombre de bits consécutifs affectés au codage d'un échantillon de chacune des trois composantes, plus il y a de bits plus il est possible de "nuancer" les couleurs.
    -- couramment, c'est 8 bits ( soit 1 octet ) pour chaque échantillon, cela distingue 256 niveaux par composante et au total, "plus de" 16 millions de teintes ou nuances.
    -- pour fournir un travail approfondi de gestion de la couleur ( ) certains formats offrent une profondeur de 10 bitss: 1024niveaux par composante et environ 1 milliard de nuances.
    -- la "profondeur" 12 bits offre 4096 niveaux par composante et env. 68 milliards de teintes.

    5- Mode d' exploration de l' image
    -- mode "progressif", noté "p", les composantes de chaque image sont échantillonnées ligne par ligne en 1 seule passe.
    -- mode "entrelacé", noté "i" ( interlaced ), les composantes de chaque image sont échantillonnées en deux passes consécutives, l'une pour en constituer la trame des lignes impaires et l' autre la trame des lignes paires [ selon les formats, la "première" de chaque image est parfois celle des lignes impaires : trame du "haut" en premier, ou le contraire, trame du "bas" en premier = celle des lignes paires ]

    6- fréquence image / fréquence trame
    - pour les "marchés" de la zone "ex-ntsc",
    -- ces fréquences ont été primitivement copiées sur celles du réseau électrique 60Hz et 30Hz
    -- lors du passage à la télé couleur un aménagement des fréquences y est devenu nécessaire : 59,94 Hz et 29,97Hz ont été adoptés pour la TV.
    -- la fréquence du cinéma ( 24 Hz ) est accessible et peut, en réalité, être 23.97Hz…

    - Pour les "marchés" de la zone "ex-pal" ( ce qui inclus ex-secam )
    -- ces fréquences ont été primitivement copiées sur celles du réseau électrique 50Hz et 25Hz qui sont ainsi restées fréquence trame ou image
    -- 24 Hz est accessible ,

    Maintenant des fréquences plus élevées ( 100Hz / 120Hz ou plus) sont envisagées sans effet ralenti et même offertes en choix occasionnel pour ralenti (comme des inférieures pour accélération),

    - Jusque là, les fréquences "hautes" [ 50 / 59,94 / 60 ] étaient celles du mode entrelacé donc des "fréquences trames",
    - maintenant, elles deviennent des fréquences-images… en mode progressif.
    Les fréquences basses sont des fréquences-images parfois en mode entrelacé mais, plus souvent maintenant, en mode progressif.
    La fréquence "24" est celle d' images en mode progressif.

    7. Compression intra-image(dite spatiale )
    Les pixels d' une image sont décrits collectivement en "blocs"
    - DCT ( analogue photo JPEG ) : les blocs sont "carrés" et de dimension fixe, algorithme mathématique relativement simple.
    - DWT ( analogue photo JPEG2000 ) : les blocs sont déterminés selon la "complexité locale" et/ou le "repérage d' objets", algorithme mathématique relativement complexe .
    Si le flux vidéo est enregistré après cette étape, bien qu'il n'y figure aucune image entant que telle, on dit que "les images sont indépendantes".

    8- Compression Inter-image (dite temporelle )
    Les images du flux sont décrites collectivement par "Groupe d' images" [ Group Of Pictures = GOP ]
    - Il s' agit d'une suite d' images consécutives dont seule la première est décrite indépendamment des autres, en général cette description est soit DCT ( MPEG2 )soit DWT ( MPEG4 ), pour les autres images seules les "changements" ou "mouvements" sont décrits par "interpolation" ou "prévision".
    -Deux variantes:
    -- les GOP ont tous la même structure (même nombre d'images décrites et même alternance des interpolées et prévues ) : MPEG 2
    -- les GOP sont adaptables selon le flux : MPEG 4

    9- Enregistrement
    - Qu'il décrive les images pixel par pixel ( non compressé) ou les images une à une mais pas les pixels ( compression intra ) ou le flux d' images mais pas les images une à une et encore moins leurs pixels ( compression INTER ), l' enregistrement ne concerne pas que le flux vidéo, il s'y ajoute d' autres informations ( comme certaines concernant le format vidéo ) ou des facilités pour le gérer ( imagettes / Time-Code ).
    - Bien que tout y soit maintenant "écrit" en langage informatique certains enregistrements n' y sont pas "encapsulés" dans une structure de fichier directement reconnaissable par un système d' exploitation d' ordinateur personnel [ Windows, MacOS ou Unix ] : c'est le cas des enregistrements linéaires sur bande magnétique, il n'empêche qu'ils y ont une structure.
    - Les médias d' enregistrement informatiques qui depuis peu d' années équipent maintenant tous les camescopes ( Disque Dur interne, Mémoire Flash interne ou sur carte ) sont lisibles par les OS des ordinateurs personnels; le flux vidéo y est découpé en "clips" directement accessibles et enregistrés en tant que "fichiers informatiques", ce qui inclut une "entête" et les instructions de "lecture" par le système d' exploitation de l' ordinateur, on parle d' "encapsulage"; il en existe plusieurs dont "mov", "avi", mais aussi MTS ou m2ts etc. nb: l' encapsuleur ou conteneur, n'est ni le flux vidéo, ni son format, et donc peut être trompeur.
     
    • J'aime J'aime x 2
    • Je recommande ! Je recommande ! x 1
  2. saint kro

    saint kro Conseiller Technique Son numérique
    Modérateur So So

    Points Repaire:
    16 450
    Recos reçues:
    249
    Messages:
    22 043
    Appréciations:
    +588 / 3 304 / -76
    Bonsoir guy-jacques,
    Ca partait bien, mais ca coince sur le format image.

    Le ratio 4:3 et 16:9 ou 4/3 et 16/9 est réservé au format vidéo (le support), pour le format image il est d'usage d'utiliser le ratio 1:1.33 dit 1.33 ou 1:1.78 dit 1.78 ou 1:2.35 dit 2.35.
    En film, la confusion est évitée, on peut filmer en S8 et faire du 2.35 ou filmer en 35 et faire du 1.37...

    C'est en utilisant l'appellation du support pour définir un format d'image que tout le monde se mélange les pinceaux.

    A+
     
  3. guy-jacques

    So

    Points Repaire:
    9 200
    Recos reçues:
    156
    Messages:
    9 236
    Appréciations:
    +83 / 289 / -3
    Merci SaintKro, en regard de 4:3 ou 4/3, oui donner 1,333 est exact id pour ... la suite.

    Cependant, je m'aperçois aussi d'un "manque" plus critique... c'est l' audio associé, alors, à l'aide ;-)
     
  4. saint kro

    saint kro Conseiller Technique Son numérique
    Modérateur So So

    Points Repaire:
    16 450
    Recos reçues:
    249
    Messages:
    22 043
    Appréciations:
    +588 / 3 304 / -76
    L'audio n'est pas lié uniquement au format vidéo, mais aussi au support physique et à l'encodage audio.

    C'est, hélas, plus diversifié que la partie image

    A+
     
Chargement...

Partager cette page