Authoring DVD: i segreti dell’home video - Seconda parte

Immagini

Immagine 1

Video digitale: concetti base
Distinzione tra video digitale e analogico e  Codifica PAL / NTSC / SECAM
A questo punto prima di iniziare a pensare al nostro DVD dobbiamo imparare alcuni dei concetti fondamentali sul video digitale. Utilizzerò dei termini a volte forse poco comprensibili ai non addetti ai lavori, ma credo che sia possibile trovare sulla Rete molte delle definizioni date nell’articolo.

VIDEO ANALOGICO - ha una codifica simile (analoga) alla realtà stessa, si basa su un segnale di tipo continuo, cioè senza soluzione di continuità. E’ memorizzato su supporto magnetico (nastro videocassette).
VIDEO DIGITALE - ha una codifica di tipo discreto (segnale non continuo). E’ memorizzato su supporti magnetici (hard disk) o ottici (CD-Rom e DVD-Rom). Ogni informazione è tradotta in una serie di numeri 0-1 (bit) combinati senza un effettivo “referente reale”. Ogni punto di una immagine ha un suo specifico colore e solo quello (le sfumature di colore sono solo simulate attraverso la dimensione estremamente piccola e ravvicinata dei pixel che formano l’immagine).

É importante sapere che la TV è analogica e cioè il segnale trasmesso è analogico quindi  per acquisire il VHS e su un computer è necessario avere una scheda di acquisizione che digitalizzi il segnale analogico. Nel VD per acquisire un video su pc viene usata una Firewire (IEEE 1394) (è quello che avviene quando scarichiamo dei materiali video da una mini VD per esempio).

Questo significa che per acquisire un video per realizzare il nostro DVD dovremmo usare l’attrezzatura adatta a seconda della fonte da cui partiremo.

Sicuramente trasferire un video da una VHS ad un DVD sarà interesse di molti, visto che il VHS è ormai un supporto obsoleto e che tende a deteriorarsi con il tempo; meglio ancora se saremo in grado di aggiungere un menù carino e facile da navigare al nostro DVD.
Lo standard component digital video però, noto come CCIR Recommendation 601, stabilisce proprietà comuni all’analogico del video e al digitale del video su PC come:

  • La frequenza di campionamento dei pixel
  • Lo spazio di colore usato (YcrCb)

indipendentemente da come il segnale è trasmesso

  • Cr e Cb sono combinati insieme a Y in un segnale unico: YCrCb
  • CCIR 601 definisce anche varie modalità di campionamento dell’informazione di colore: 4:2:2 e 4:4:4.

La definizione dei bordi delle captions (testi) della TV è influenzata più dalla differenza di luminosità che di colore; è mio compito qui soltanto segnalare per il futuro, che Premiere e After Effects lavorano in 4:4:4 per cui non si notano i bordi smussati delle scritte.

Un altro dei concetti indispensabili da conoscere per lavorare con Scenarist e in generale per non rendere il nostro DVD inutilizzabile è la differenza tra PAL e NTSC.

PAL – NTSC – SECAM
Attualmente, nel mondo, vengono utilizzati tre standard per la trasmissione del segnale televisivo. Vedi Immagine 1.
I tre sistemi hanno caratteristiche differenti ma funzionano sullo stesso principio. L’immagine che si vede sullo schermo del televisore è composta di pixel (Picture Element). Ciascun pixel è a sua volta composto da tre punti (fosfori) colorati: rosso, verde e blu. Poiché questi tre punti sono molto piccoli e molto vicini tra di loro l’occhio umano li percepisce come un unico punto colorato.

Il Phase alternating line o PAL è un metodo di codifica del colore usato da gran parte del mondo. Fanno eccezione il continente americano, alcune nazioni dell’est asiatico, parte del Medio Oriente, dell’Europa orientale e la Francia.
Il PAL fu sviluppato in Germania da Walter Bruch, che lavorava alla Telefunken, e fu usato per la prima volta nel 1967. Alle stesse conclusioni, nello stesso periodo dei tedeschi arrivò anche una squadra di tecnici RAI nei laboratori di Torino, ma l’invenzione rimase in un cassetto e fu quindi attribuita giustamente alla Telefunken che la pubblicò per prima.
Il termine “PAL” è spesso usato informalmente per riferirsi al formato video digitale a 625 linee/50 Hz (576i, comune nei paesi europei), così come il termine “NTSC” indica spesso il formato a 525 linee/60 Hz (480i), usato in Nord America e in Giappone. Questo uso del termine è scorretto ma comunque di largo impiego, tanto che spesso i supporti DVD sono etichettati come “PAL” o “NTSC” anche se dal punto di vista tecnico sul DVD non c’è un segnale a colori composito codificato PAL.

È importante sottolineare il fatto che il termine PAL non indica numeri di linee o frequenze di scansione, ma indica esclusivamente il sistema usato per la codifica dei colori. Per contrasto, lo standard NTSC definisce il numero di linee e dei semiquadri.

Nell’uso comune, quindi, si considera come PAL un formato video interlacciato a 625 linee orizzontali, dove 50 semiquadri formano 25 fotogrammi al secondo, con una frequenza di 50 Hz, e cioè CCIR 601.
Per realizzare un’immagine conforme allo standard PAL con un programma di elaborazione d’immagini (ad esempio photoshop), le dimensioni devono essere di 720 pixel in orizzontale e di 576 pixel in verticale, con una risoluzione di 72 pixel/pollice, considerando che esistono dei margini oltre i quali l’immagine non viene visualizzata sullo schermo televisivo e dei margini al di fuori dei quali è meglio non posizionare testi.

L’NTSC è uno standard per la creazione, trasmissione e ricezione di contenuti video per le aree geografiche Corea, Giappone, Canada, USA e alcuni paesi americani.
Sviluppato negli USA fra il 1939 e il 1941 come sistema di trasmissione in bianco-e-nero e proposto come sistema a colori nel 1953. Il suo nome è la sigla di National Television System(s) Committee, l’ente di standardizzazione industriale che lo ha creato. NTSC è anche l’acronimo di “Never Twice Same Color”, dal senso ironico poiché deriva dalla mancanza di un sistema di correzione automatico degli errori di fase, che rende necessaria la presenza di una regolazione di tinta manuale sui monitor.

Esiste poi il SÉCAM, acronimo del francese SÉquentiel Couleur À Mémoire (traduzione letterale: colore sequenziale con memoria); questo è un sistema di codifica della televisione a colori utilizzato per la prima volta in Francia. Il SÉCAM fu inventato da un team guidato da Henri de France, che lavorava alla Thomson e si propose come standard alternativo al NTSC statunitense e al PAL tedesco: fu adottato, oltre che dalla Francia e da numerosi stati francofoni africani, anche dai paesi del blocco sovietico dati i rapporti maggiormente distesi tra questi stati e la Francia.

Quindi diversi paesi usano diversi tipi di sistemi di trasmissione del segnale televisivo, molti dei quali sono incompatibili l’un l’altro. E però possibile trasformare o meglio transcodificare il video per esempio da PAL a NTSC e viceversa. La transcodifica trasforma un segnale in modo che possa essere “visualizzato” sulla tv di destinazione.

I segnali analogici compositi usati sono YUV (PAL) e YIQ (NTSC.
Le informazioni sul colore UV (e IQ) sono combinate assieme in un segnale di chroma (nel segnale video le informazioni sul colore sono date sottraendo la luma dalle componenti RGB rosso e blu: R-Y e B-Y, insieme queste due componenti sono chiamate chroma), che a sua volta è combinato con la luma Y (luminosità).

YUV e YCrCb sono simili per quanto riguarda il metodo di calcolo. Il segnale video analogico quando viene digitalizzato viene convertito in formato YCrCb; YCrCb è lo spazio di colore usato in molti schemi di compressione come:

  • MPEG
  • JPEG

Parlando di telecamere digitali  oggi queste offrono diversi tipi di collegamento: digitale (DV) e analogico (S -VHS o RCA). La scelta dell’acquisizione dipende dalla scheda usata e questo ci dà diverse disponibilità di compressione (DV, MJPEG o MPEG) di connettori e di scelta nel bitrate (unità di misura della velocità di trasmissione dati tra dispositivi elettronici) fisso o variabile.

Il sistema component assegna un collegamento ad ogni segnale e genera una migliore qualità dell’immagine. Il video field è un insieme di campioni di un’immagine, ripresi praticamente nello stesso istante, composto da linee alternate dell’immagine:
NTSC: 242 linee attive per field – tipicamente 483 pixel per linea.
PAL: 290 linee attive per field – tipicamente 576 pixel per linea.

Un filmato è essenzialmente una sequenza di immagini, riprodotte sullo schermo in rapida successione per dare l’illusione del movimento. Il numero di fotogrammi visualizzati al secondo è detto frequenza dei fotogrammi. La frequenza dei fotogrammi viene misurata in fotogrammi al secondo (fps).

A una frequenza di fotogrammi superiore corrisponde un numero maggiore di fotogrammi per secondo utilizzati per visualizzare la sequenza di immagini e per ottenere un movimento più fluido.
L’alta qualità, tuttavia, comporta uno svantaggio, in quanto le frequenze di fotogrammi superiori richiedono una maggiore quantità di dati (e quindi di larghezza di banda) per visualizzare il video.

I vari field di un filmato sono campionati ad istanti diversi, secondo il field rate.

Il field rate NTSC (analogico e digitale) è di ~60 field/secondo (29,97 fps -  fotogrammi per secondo)
Il field rate PAL (analogico e digitale) ha 50 field/secondo (25 fps)

Il computer non usa i field ma i frame. L’uso dei field ha ragioni storiche dovute alla banda limitata per la trasmissione del segnale televisivo. I field sono mostrati interfacciati (interlaced), le righe del secondo field sono alternate rispetto a quelle del primo. NTSC, PAL e SECAM condividono la medesima tecnica di interallacciare i fotogrammi video. Interallacciare significa che ogni fotogramma (quadro) è suddiviso in due sequenze distinte: una contenente le linee dispari e l’altra quelle pari. Il risultato è che in una sequenza vengono visualizzate le linee numero 1, 3 ,5 ,7 ecc., e quindi quelle numero 2, 4, 6 ,8 ecc.; questi due gruppi spesso sono anche chiamati “top-frame” per le linee dispari e “bottom-frame” per le linee pari.

Noi percepiamo questi fotogrammi interallacciati come un singolo fotogramma video perché il nostro occhio non è in grado di distinguere variazioni luminose così rapide.
I dati di un video field sono temporalmente e spazialmente distinti. In una sequenza video quindi metà dell’informazione spaziale è omessa ad ogni istante temporale. I formati video del computer sono invece non interfacciati (noninterlaced oppure progressive scan) quindi potrà essere necessario deinterlacciare il video a volte per lavorare su altre piattaforme/programmi/formati.

L’interlacciamento può essere un problema ma, per fortuna, esistono vari filtri per deinterlacciare video.
Per ottenere un video nitido su un monitor di computer, quindi, i fotogrammi del video devono essere deinterlacciati allo scopo di eliminare uno dei campi. Metà delle informazioni di ogni fotogramma viene pertanto eliminata e le informazioni rimanenti vengono duplicate o interpolate. Nel caso di NTSC si ottengono 30 fotogrammi di 30 punti distinti nel tempo. Gli attuali standard video della televisione digitale hanno eliminato l’interlacciamento a favore di tecniche di visualizzazione a scansione progressiva. Le videocamere a scansione progressiva in genere sono in grado di passare dalla scansione progressiva al video interlacciato e la maggior parte di esse dispone di un’ampia varietà di frequenze di fotogrammi con e senza interlacciamento.

Per il momento credo sia abbastanza, avete parecchie informazioni da assimilare. É importante avere delle basi per comprendere i meccanismi dell’authoring di un dvd, questi primi articoli sono un pò la grammatica prima di iniziare a scrivere un tema. Alla prossima puntata!