Le caratteristiche sensitometriche delle Camere digitali per Cinematografia Elettronica
Criteri di progetto di una camera
Il progetto di una camera digitale per cinematografia elettronica è centrato intorno alle caratteristiche del sensore, affinché presenti il più ampio range dinamico, la migliore sensibilità e un’ottima resilienza al rumore elettronico. Occorre, per questo, valutare l'effetto degli stimoli di ingresso e le possibili distribuzioni spettrali di potenza delle scene riprese, filtrate dalla trasmissività dall'ottica applicata. Il prodotto di tali caratteristiche determina la distribuzione di energia per lunghezza d'onda incidente sulla superficie del sensore. Occorre altresì considerare la caratteristica spettrale dei filtri applicati al sensore di immagini: la maschera Bayer – necessaria per generare le componenti RGB – e le lamine ottiche IR e passa basso, da moltiplicare infine per la caratteristica del chip CMOS. Il prodotto complessivo di questi termini individua il modo con cui i segnali RGB emergenti sono modellati e si comportano al variare degli stimoli luminosi esterni. La loro combinazione lineare risulterà nella componente Luma, responsabile della riproduzione tonale; in altre parole del rapporto di contrasto ai vari livelli di esposizione e di guadagno. Il rumore elettronico – di entità diversa su ciascun canale RGB – sarà particolarmente evidente nelle zone più scure, in quanto associato ai livelli più bassi del segnale Luma e amplificato allo stesso modo del segnale utile. All'estremo opposto, il sensore saturerà in modo diverso su ogni canale RGB, influenzando il modo con cui saranno riprodotte le aree più intensamente illuminate della scena.
Punto di riferimento sulla funzione di trasferimento lineare del sensore
Complessivamente si ottengono delle caratteristiche di trasferimento RGB pressoché lineari, con le quali gli ingegneri lavorano per determinare il miglior bilanciamento per gli scopi del progetto. Il compito più delicato risulta nell'ancorare un punto delle caratteristiche quale riferimento per l'esposizione. L’operazione consiste nel determinare i livelli dei segnali RGB e dei relativi codici numerici nel dominio digitale corrispondenti all’assegnato livello di esposizione. Fissato tale punto, restano da ottimizzare intorno ad esso le prestazioni della camera in tutta la gamma dinamica permessa dalle proprietà del sensore. La scelta del riferimento dipende strettamente dallo scopo del progetto. Nello specifico, se si tratta di una camera per applicazioni broadcast convenzionali in standard BT.709, ancora legato all’eredità di tecniche di presentazione su monitor a tubo (CRT), oppure se si tratta una camera per cinematografia elettronica, realizzata per esplicitare il massimo delle prestazioni sensitometriche. Lo sviluppo tecnologico della fisica dei semiconduttori e delle tecnologie di presentazione ha portato rapidamente all'affermazione di una nuova e promettente strada, di cui si è discusso ampiamente in precedenti articoli, la quale è capace di restituire immagini più aderenti alla realtà tangibile, indipendentemente dalla loro risoluzione: High Dynamic Range (HDR) (rif Figura 1).
In termini fisici, la scelta del riferimento sulla funzione di trasferimento lineare del sensore definisce la sensibilità della camera in quel punto e, a seconda del leitmotiv del progetto, il range dinamico e/o le prestazioni in termini di rapporto segnale/rumore (S/N). Esse saranno individuate dal numero di F-stop al di sopra e al di sotto del punto di riferimento scelto e dalla misura del piedistallo di rumore per ogni valore del guadagno elettronico del sistema. Un F-Stop in più costituisce un raddoppio dell’intensità luminosa; uno in meno un dimezzamento.
La Gamma Dinamica e la latitudine di esposizione
Uno dei concetti da definire correttamente è il range dinamico di una camera digitale: si tratta del rapporto tra il valore massimo e il valore minimo dell'intensità di illuminazione di una scena, tali da rendere ancora distinguibili i dettagli associati nella rispettiva rappresentazione elettrica/digitale. Se all'estremo superiore si supera il massimo consentito dalla fisica dei fotositi sul sensore, si entra irreversibilmente in zona di saturazione e tutti i dettagli contenuti nella scena originale saranno persi nel bianco risultante. Analogamente, livelli inferiori al minimo riproducibile saranno riprodotti come neri e i relativi dettagli cancellati nel rumore di fondo. Nella terminologia corrente è consueto utilizzare come sinonimi range dinamico e latitudine di esposizione. Sebbene misurati entrambi in F-Stop sono in realtà nozioni differenti, benché legate tra loro. In un paragone con la tecnologia dei materiali, il range dinamico di una camera è a tutti gli effetti equiparabile con “l'elasticità meccanica” di un metallo; è la capacità del sensore di registrare il contenuto informativo nell'intervallo più ampio possibile dell'energia incidente. Utilizzando lo stesso paragone, la latitudine di esposizione può essere associata con la “malleabilità” dell'immagine memorizzata; quanto essa può essere “stirata” in post-produzione senza introdurre artefatti da rumore o da compressione lossy in fase di registrazione. La latitudine di esposizione definisce dunque lo spazio a disposizione della post-produzione per correggere eventuali errori di esposizione, oppure per estrarre dettagli nascosti da zone particolarmente in ombra. In questo aspetto non è difforme dallo spazio di correzione accessibile su un negativo analogico con le tecniche di sviluppo chimico. E, in modo similare, non consente di rivelare ciò che non esiste. Un errore di sovraesposizione, che porti una zona dell'immagine ripresa al di sopra dell'estremo superiore della gamma dinamica del sensore fa perdere definitivamente i dettagli lì contenuti. Un errore grave di sottoesposizione, che porti i dettagli utili dell'immagine molto vicini all'estremo inferiore – o al di sotto di esso – risulta solo in un'esaltazione del rumore per ogni tentativo di correzione effettuato in post-produzione (rif Figura 2).
Dunque, è evidente la differenza: la gamma dinamica indica il massimo intervallo di F-stop entro il quale dettagli nelle alte luci e nelle basse luci sono contemporaneamente leggibili nella stessa immagine. La latitudine di esposizione indica qual è lo spazio di correzione selettiva della stessa immagine a seconda della dinamica occupata. Si può usare il secondo concetto per stabilire in che modo esporre un'immagine. Maggiore è la gamma dinamica, più ampia sarà la libertà di scelta del punto di esposizione ottimo per la post-produzione desiderata. Qui sarà possibile evidenziare i dettagli di interesse senza perdere contenuto informativo nel resto dell'immagine e senza enfatizzare oltre misura il rumore.
Camere sempre più specializzate
In termini astratti è piuttosto immediato effettuare confronti, comparazioni e stabilire scale di merito tra camere diverse soltanto sulle specifiche numeriche dichiarate. Come è lecito attendersi, la realtà è più articolata: le caratteristiche fotografiche di una camera si possono adeguare per coniugarsi ad una determinata tecnica di presentazione del risultato finale. Esistono difatti ulteriori fattori da tenere in considerazione: il dispositivo di visione e le caratteristiche psico-fisiche dell'occhio umano. Le immagini processate da una camera sono presentabili soltanto attraverso un monitor LCD/OLED di visione o uno schermo cinematografico con il suo sistema di proiezione. Per entrambi occorre nuovamente considerare il prodotto delle rispettive distribuzioni spettrali per la caratteristica di visione umana in una specifica condizioni di adattamento. Nei due casi citati l'occhio si comporta molto differentemente. Se oggi parlare di un monitor di visione in High Dynamic Range (rif. le specifiche della Ultra High Definition Alliance, confermate dalla raccomandazione EBU 3320. In questo testo non si specifica quale standard HDR si stia utilizzando, ma le considerazioni sono in linea di principio valide sia per PQ che per HLG) con riproduzione di neri profondi fino a 0,05 nits e bianchi almeno di 1000 nits (specifiche già valide per la classe Grade 1B PQ/HLG definita da EBU) può risultare usuale anche per televisori consumer, è da osservare che in un ambito di proiezione cinematografica su grande schermo, i livelli massimi di intensità luminosa sono indicati rispettivamente in 48 nits in SDR e 100 nits in HDR. Quest'ultimo valore è dettato da considerazioni tecnologiche sulla massima quantità di energia incanalabile attraverso una lente di proiezione, dalla conservazione del rapporto di contrasto sullo schermo, e, nuovamente, da valutazioni psico-fisiologiche. il valore di 100 nits è il minimo indispensabile per garantire un'esperienza HDR e per evitare che nella visione di scene a contenuto luminoso medio e basso, l'occhio si adatti prevalentemente in zona mesopica, dove la percezione dei colori risulterebbe falsata (rif. Figura 3).
Tenendo conto che le caratteristiche percettive dell'occhio sono molto differenti nella visione da monitor e nella visione da schermo cinematografico, è naturale comprendere che lo stesso contenuto necessiti di un grading differenziato per la visione sui due mezzi. In SDR e visione su monitor CRT, il limite naturale di 100 nits permetteva di tollerare -nel ridotto contrasto generale- dei grading indirizzati principalmente al grande schermo. In HDR le differenze sono più marcate, gli spazi colore diversi, e i contenuti devono essere necessariamente rielaborati per ogni destinazione, al fine di garantire la continuità dell'esperienza.
La progressiva introduzione di di camere digitali sempre più avanzate lascia intuire una ricerca indirizzata a renderle ottime per la destinazione di impiego più probabile: colorimetria, contrasto, tecniche di bilanciamento del bianco e curve di trasferimento native calibrate per il mezzo di visione. Ulteriormente per ampiezza e modulazione del range dinamico, tecniche di riduzione del rumore impiegate e mantenimento della fedeltà cromatica in tutte le condizioni operative.
E' importante a questo punto indicare i metodi misura della gamma dinamica di una camera, partendo dal Broadcast tradizionale in SDR.
L'approccio tradizionale nella misura della Gamma Dinamica
Valido prevalentemente per camere in standard dynamic range (SDR), parte da un modello in cui il riferimento è l'ampiezza massima del segnale video a disposizione, inteso sia in termini analogici che numerici. Il suo merito è che consente di enfatizzare la sensibilità e la resilienza al rumore di un dato sistema di acquisizione nella rappresentazione televisiva vera e propria. In altre parole, il metodo non indaga particolarmente sulla distribuzione relativa della dinamica sul range di esposizioni consentite, ma privilegia la capacità del sistema di allontanarsi il più possibile dal rumore elettronico.
In termini tradizionali, il punto di riferimento per le applicazioni video tradizionali è la barra bianca con riflettività 89.9{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} di un tipico cartello con la scala dei grigi (ad esempio il TE223 della Image Engineering .Rif Figura-4).
Come specificato nella raccomandazione EBU 3335 (“Methods of measuring the imaging performance of television cameras for the purposes of characterisation and setting”, punti 2.3 e 2.4), si imposta la camera nel frame rate desiderato con il Gamma Standard 709 e sue eventuali regolazioni aggiuntive disattivate (Knee, black stretch, etc.), il Master Gain a 0 dB (guadagno unitario, dunque caratteristica di trasferimento Luma nominale). A questo punto si illumina il cartello di test con una sorgente a 2000 Lux e temperatura colore di 3200 K regolando l'apertura dell'ottica applicata alla camera fino a leggere il livello Luma del 100{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} su un Waveform monitor. L'apertura dell'ottica così misurata definisce la sensibilità della camera (Fno@2000 Lux). La misura è inoltre completa quanto si aggiunge il rapporto S/N per lo stesso segnale di Luma (procedura al punto 2.2 – EBU 3335). Valutando il numero di stop di distanza dal limite superiore (a 0 dB) fino al livello del sottofondo di rumore si può determinare la gamma dinamica in tali condizioni. Sensibilità tipiche misurate per camere Broadcast HDTV 2/3″ in SDR sono di F8-10@2000 lux, S/N 52-54 dB, con range dinamici di 6-6.5 F-stop al massimo, senza l'intervento di metodi di correzione elettronica delle estremità della curva del gamma.
E' interessante considerare che dovendo essere conformi al BT.709, le intenzioni dei progettisti in termini di riproduzione tonale, precisano fortemente la scelta del punto della caratteristica di trasferimento lineare del sensore legato al guadagno unitario (0 dB). In particolare, i criteri per tale scelta sono:
1) ottenere il miglior rapporto S/N al livello 0 dB
2) Ottenere una desiderata riproduzione tonale (cioè un certo rapporto di contrasto)
3) Permettere al sensore una certa capacità di sovraccarico, cioè consentire di poter gestire uno specifico intervallo di sovraesposizione nelle luci più alte.
I costruttori di telecamere per il mercato broadcast mainstream hanno sempre privilegiato la realizzazione di camere in SDR che presentassero il valore più alto possibile del rapporto S/N . Ciò al fine di superare le limitazioni dello standard BT.709 nella parte bassa della curva di trasferimento non lineare; la curva OETF “gamma” (Optical to Electric Transfer Function) infatti accentua l’effetto del rumore per livelli di esposizione molto bassi. In conseguenza, il range dinamico ne risulta limitato: al più 100:1 – circa 6-6.5 F-stop. Per aggirarne la limitazione imposta dallo standard, i costruttori di telecamere modificano abitualmente la curva OETF nelle zone terminali aggiungendo un “knee” e un “toe”, rispettivamente per estendere il contrasto nelle alte luci e per modellare la riproduzione dei neri nelle basse luci (rif. Figura 5). Il knee comprime il contrasto nella zona alta della curva, cercando di accomodare un range di esposizioni più elevato in un ridotto numero di parole codice. Ciò non è trasparente dal punto di vista qualitativo: la curva del gamma non è infatti applicata soltanto al segnale Luma, ma alle componenti individuali RGB! Manipolare eccessivamente la OETF risulta in artefatti di varia natura: posterizzazione e distorsioni nella colorimetria degli oggetti riprodotti nelle zone delle alte e delle basse luci.
Chiaramente, lo standard BT.709 non renderebbe giustizia alle capacità dei sensori moderni, soprattutto quelli di largo formato Super-35 o Full-frame. Alcune delle camere più moderne esibiscono un range dinamico di >14-15 stop, che, nel confronto con quanto ottenibile precedentemente, possono essere definite HDR. Evidentemente i 14-15 stop di dinamica devono essere mappati differentemente per trovare uno spazio di rappresentazione pratico. Ciò impone di uscire dai limiti della OETF del BT.709, per andare verso una rappresentazione semi-logaritmica della caratteristica di trasferimento. Si noti che una rappresentazione lineare RGB sarebbe altrettanto valida – un approccio da forza bruta- ed in effetti implementata in alcune camere (es. la Sony F-65). Tuttavia, una rappresentazione semi-logaritmica permette di comprimere in modo “percettivamente uniforme” un elevato numero di intervalli di intensità luminosa in un insieme limitato di parole codice, risparmiando bit per campione e quindi potenza di calcolo, spazio di memorizzazione, energia elettrica, dimensioni, pesi, costi, etc. La rappresentazione semi-logaritimica è inoltre raccomandata dalle tecniche più moderne attivate per controllare e ridurre il rumore nei sensori di ultima generazione, rendendo possibile un'allocazione mirata dei livelli digitali.
Approccio della cinematografia elettronica alla misura della Gamma Dinamica
In cinematografia la sensibilità operativa è misurata con il parametro “Exposure Index (EI)”, nel passato identificato dal numero di ASA; più modernamente espresso come numero ISO. La pratica corrente per realizzare una camera destinata alla comunità del cinema e della cinematografia elettronica è quella di utilizzare come riferimento il valore ISO letto con un esposimetro su un cartello grigio con riflettività del 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} (rif Figura.6). Si regola poi l'esposizione sulla camera per leggere un livello Luma del 20{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} sul Waveform monitor.
La scelta del cartello grigio al 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} deriva da considerazioni del tutto euristiche: l'oggetto naturale più riflettente è la neve fresca, con una riflettività di circa il 95{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16}. All'estremo opposto c'è il terriccio con una riflettività del 3-4{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16}. La media geometrica (radice quadrata del prodotto dei due fattori) porta proprio al valore 0,1823… Da questo punto di riferimento si apre e si chiude il diaframma dell’obiettivo in F-stop successivi per misurare poi l'ampiezza dell'intervallo che va rispettivamente verso i neri profondi e il bianco di saturazione. La somma dei due semi-intervalli restituisce il range dinamico della data camera per un certo valore del guadagno (e degli altri parametri di esposizione). La scelta del 20{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} del livello video Luma assegnata alla riflettività del 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16}, implica una grande attenzione all'ampiezza dei due semi intervalli. In particolare, quello inferiore determina la raffinatezza con la quale si potrà descrivere i dettagli illuminati da basse intensità.
Per camere con ampia gamma dinamica, gli ultimi stop verso il basso sono rappresentati da livelli video equivalenti di frazioni di mV (mentre il bianco di riferimento al 100{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} ha un Luma equivalente di 700 mV) ed è oggettivamente difficile farli corrispondere a elementi significativi di un’immagine reale. Soprattutto, è arduo immaginare un monitor di riferimento in grado di riprodurli correttamente senza annegarli nei neri oppure uno schermo cinematografico campione in grado di non diluirli nell'alone generato dalle riflessioni in zone adiacenti più luminose. Dal punto di vista pratico, una data camera è effettivamente in grado di leggere dettagli nelle bassissime luci se essi sono visibili su un certo numero di display di riferimento (Rif Figura 7). Allora quei dettagli sono reali e possono essere recuperati in post-produzione. A questi livelli così estremi, è giusto indicare che gli stessi potrebbero essere completamente annullati se l'ottica impiegata non riuscisse ad abbattere le riflessioni interne allo stesso modo. In altre parole, il livello del rumore di origine ottica potrebbe essere più alto di quello elettronico!
Tuttavia, per la comunità e i creativi dell'industria cinematografica sono proprio tali livelli ad essere fondamentali. In molti film, serie televisive, documentari, spot pubblicitari, le scene riprese nelle ombre sono attentamente progettate e strutturate. Sono illuminate al fine di generare un “carattere”, e post-prodotte per donare una dominante cromatica che sia identificativa del particolare genere. Sebbene suoni come un paradosso, “colorare” i neri è una delle pratiche più diffuse nel grading professionale. E' proprio nelle zone più scure delle immagini che si intarsia quella miriade di dettagli e trame la cui visibilità è parte integrante della narrazione per immagini. Mantenerle visibili, estrarle dalle ombre senza esasperare il rumore attiguo è il compito più complesso della post-produzione moderna.
Curve OETF di camere reali in HDR: Canon C-300 MK-II e Canon C-700
Occorre fornire, a questo punto, qualche riferimento pratico per motivare la trattazione finora condotta. L'autore ha avuto modo di lavorare con le ultime camere della serie Canon EOS Cinema C-300 MK-II e C-700 (rif. Figure 8 e 9), le quali condividono lo stesso sensore e le stesse curve OETF pur esibendo caratteristiche di impiego completamente diverse. La C-300 MK-II è una macchina che segue la traccia della prima versione, rinnovandone totalmente elettronica, codec e interfacce. La C-700 per caratteristiche meccaniche, interfacce e configurazione, è invece orientata ad essere una Camera-A in un sistema di produzione cine-televisiva di alto livello. Rappresentano senz'altro esempi notevoli e popolari delle potenzialità del processo digitale, a partire dalla fisica optoelettronica del nuovo sensore CMOS 4K HDR impiegato. A monte, ciò che ha reso popolare l’intera serie EOS Cinema, al di là dell'innovazione portata dall’inconfondibile fattore di forma, è stata l'elevata qualità complessiva delle immagini. Anche nella prima declinazione della C-300, nonostante il codec Broadcast standard MPEG-2 Long Gop 4:2:2@50 Mbps e i “soli” 8 bit per componente (R, G1, G2, B), la camera riusciva a garantire un’incredibile qualità d'immagini e un rumore impercettibile per un ampio intervallo di impostazioni ISO. La straordinaria resa alle basse luci, la colorimetria naturale molto vicina alle camere dominanti del settore cinematografico, gli skin tones perfettamente riprodotti anche al variare dello spettro della luce di scena, hanno reso celebre questa camera, che continua ancora ad essere preferita a quasi 7 anni dalla sua introduzione.
Note preliminari sulla colorimetria e sulla resa degli skin tones
La fedeltà di riproduzione dei toni della pelle è uno degli aspetti più importanti della tecnologia delle camere e, ovviamente, anche uno di quelli che determinano il successo di una realizzazione tecnologica rispetto a un'altra. Come è noto, lo spettro della luce bianca non è continuo; ha una composizione che dipende dalla forma e dalla natura della sorgente. Il contenuto spettrale e la distribuzione di potenza di ogni singola lunghezza d'onda influenzano il modo in cui gli oggetti reali risultano colorati per riflessione. L'occhio umano ha, peraltro, una meravigliosa capacità di adattare il bilanciamento del bianco ad ogni condizione di illuminazione atmosferica, artificiale ed ambientale. Un foglio di carta appare bianco alla percezione della mente, qualunque sia il tipo di luce che lo illumini, perché il cervello ne conosce già il colore atteso e adatta la sensazione fisiologica per incontrare il ricordo memorizzato. Ciò vale, a maggior ragione, per i toni dell'incarnato in quanto rappresentano l'elemento riconoscibile per eccellenza nella vita e nell'interazione tra esseri umani. Essi sono di conseguenza i più importanti per determinare la fedeltà della riproduzione colorimetrica in elettronico. Le telecamere non hanno alcun dispositivo di adattamento automatico allo spettro della luce che illumina la scena ripresa. Per questo scopo è efficacemente integrato un circuito di bilanciamento del bianco che può operare in automatico (adattando continuamente l'amplificazione istantanea dei canali RGB), in manuale, impostando direttamente la temperatura colore (letta con un termo-colorimetro esterno e poi impostata in camera) oppure con una misura a campionamento in una certa area dell'immagine ripresa. Il limite di questi sistemi risiede nel fatto che tentano di rendere bianche le zone bianche dell'immagine secondo le regole matematiche impostate nella composizione del segnale Luma. Tuttavia, a seconda del tipo di spettro della sorgente luminosa, l'effetto sugli altri colori rappresentati può essere dissimile. Senza un controllo di ordine superiore, questo aspetto potrebbe rendere problematico l'impiego di una stessa camera in interni ed esterni, nonostante il bilanciamento del bianco sia corretto nei due ambienti. Tale valutazione assume un peso specifico importante considerando che lo spazio colore BT.2020 associato con una ripresa HDR è molto più ampio di quanto possibile in BT.709. Il “volume del colore” aumenta considerevolmente sia in termini di saturazione sia di palette di tinte. Gli stessi oggetti, o gli stessi attori potrebbero così apparire “colorati” diversamente. Ed in alcuni casi -e con alcune camere- è esattamente quello che accade. Tali differenze possono essere normalmente corrette in post-produzione da un colorist esperto. Ma anche il tempo ha un costo, e deve essere aggiunto al totale economico di una produzione!
Una delle qualità più riconosciute alle camere citate risiede proprio nell’estrema robustezza della riproduzione degli skin tones e della colorimetria in generale al variare del tipo di sorgente luminosa. Gli specialisti della casa nipponica hanno evidentemente perfezionato il sottosistema del bilanciamento del bianco, introducendo trasformazioni digitali ad hoc in correlazione con la temperatura colore misurata. E' probabile che nei processori della camera sia presente una trasformazione legata, verosimilmente, alla forma dello spettro della probabile sorgente luminosa di origine. Un segreto industriale, una piccola “magia” che è presente in tutti i modelli EOS Cinema, inclusi, naturalmente gli ultimi citati in 4K HDR BT.2020.
Canon Log-2 e Canon Log-3
Per illustrare meglio l'importanza dell'approccio cinematografico nella misura della gamma dinamica di una camera moderna, è utile analizzare nel dettaglio le curve OETF non lineari integrate nella C-300 MK-II e nella C-700 (rif. Figura 10). Ciò farà comprendere, anche in linea generale, come si riesce e quali sono le scelte di progetto atte a rappresentare adeguatamente 15 stop di gamma dinamica all'interno del numero di parole codice a disposizione (circa 1000 per una quantizzazione a 10 bit/campione/componente; circa 4000 per 12 bit/campione/componente).
Una camera delle prestazioni della EOS C-300 MK-II o C-700, impostata in BT.709 e misurata con l'approccio tradizionale evidenzia i seguenti risultati: a 2000 lux, 3200 K, ISO 800, la camera impostata in 1980×1080@25P 1/50 s shutter, mostra un impressionante F14@2000 Lux e un S/N di 68 dB! Ma tali numeri non dicono molto sulla reale estensione della dinamica del sensore. Indicano soltanto un livello di rumore estremamente contenuto ed un’elevata sensibilità.
Con riferimento alla Figura 11, il Canon Log è la curva originariamente progettata per la C300, ottimizzata per campioni a 8 bit/campione/componente. Strutturata dunque per gestire un massimo di 800{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} rispetto al 100{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} del bianco di riferimento. Risulta ancora inserita nei sistemi della C300 MK-II e della C-700 per facilitarne l'impiego insieme al il primo modello nel caso di produzioni multicamera. Con meno di 256 livelli disponibili, grande cura fu apportata per limitare il più possibile il banding nelle alte e altissime luci, privilegiando, viceversa, la capacità di lettura dei dettagli nelle basse luci.
Ciononostante, permetteva un range dinamico di 12.5 stop, a limite per essere considerato HDR (le ultime produzioni RAI con la Eos Cinema C-500: “Linea verticale” e “Meraviglie” (rif. Figura 12) sono state girate in Canon-Log@10 bit/4K-HDR RAW con risultati eccellenti). Con l'introduzione della seconda serie, è stato sviluppato il Canon Log-2 per gestire il range dinamico di 15 stop disponibili dal nuovo sensore. Consente di accomodare all'interno di parole codice a 10/12 bit/campione il 1600{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} rispetto al bianco di riferimento al 100{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16}. Questa curva si estende ulteriormente per ulteriori 2 stop virtuali, tali da garantire flessibilità addizionale in post-produzione: è definito “Sensitizing margin” che porta il range effettivamente gestibile al 6400{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} del bianco di riferimento/100 nits. La C-300 MK-II e la C-700 sono state dotate anche di una curva ulteriore, denominata Canon Log-3 in grado di essere più facilmente gestibile in post-produzione rispetto al Canon Log-2, qualora non fosse necessario disporre di tutti i 15 stop di dinamica. In particolare, nella regione alle basse luci, al di sotto del grigio di riferimento, il comportamento ritorna ad essere simile a quello del Canon Log del primo modello (declinato su 10 bit/campione/componente).
La Figura 13 mostra invece un diagramma semilogaritmico dove in ascissa si hanno gli intervalli di F-stop centrati rispetto al grigio di riferimento al 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} e in ordinata le parole codice/livello video. Questo diagramma evidenzia meglio le differenze tra le varie curve nella zona delle basse luci.
Relativamente al Canon Log-2 (Gain nativo) si può osservare quanto segue:
1) all'estremo inferiore la curva si estende di quasi 9 stop sotto al grigio 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} (il livello del nero è raggiunto al 9.3{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} del segnale video equivalente)
2) all'estremo superiore la curva si estende di 8.3 stop, sebbene il sensore saturi dopo 6.3.
3) il livello del video corrispondente al grigio 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} è il 39.8{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} (parola codice 407 /10bit).
4) la porzione lineare della curva è la più ampia delle tre rappresentate, portando il Canon Log-2 ad essere molto vicino alla curva OETF di una pellicola.
Relativamente al Canon Log-3 (Gain nativo) si osserva che:
1) si estende di 6.3 stop al di sopra del grigio 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} (coincidente con il livello di saturazione del 1600{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16})
2) al di sotto del grigio 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} la curva si fonde con il Canon Log e termina a 7 stop di distanza dal riferimento (il livello del nero è raggiunto al 12.5{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} del segnale video equivalente). Il range dinamico risultante è dunque di circa 13.5 stop
3) in questo caso il grigio di riferimento ha un livello video equivalente del 34.3{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16} (parola codice 351/10 bit). E' dunque una curva più ripida e più contrastata rispetto al Canon Log-2 nella parte inferiore al grigio 18{37a1cbb90f7391cfe4eed903db5565496762ce8571b0882a5d3f821ea66dad16}.
Il significato delle differenze tra le parti inferiori delle due curve diventa evidente quando sono esaminate rispetto alle capacità del sensore e i livelli video/rumore associati. Il Canon Log-2 permette di risolvere un incredibile livello video equivalente di 0,27 mV quando il rapporto S/N raggiunge il valore 1 (cioè quando segnale utile e rumore hanno la stessa ampiezza media). Deve essere notato in simili condizioni di ripresa, il guadagno differenziale della curva OETF diventa piuttosto elevato e quindi enfatizza anche il rumore presente nella stessa zona. Tuttavia, il rumore generato dalle camere EOS cinema è piuttosto organico (approssimabile da una curva di densità di probabilità di tipo gaussiano) e dunque ben trattabile dai de-noiser dei moderni software di grading. Una differenza qualitativa tra l’aspetto dei fotogrammi girati in Canon-Log, Canon Log-2 e Canon Log-3 si apprezza nella Figura 14. È evidente il maggior contrasto nelle basse luci della curva Canon Log-3 rispetto al Canon Log-2. Ancora una volta emerge la domanda su quanto concreti e frequenti siano segnali utili di ampiezza così bassa in una produzione reale. Potrebbero essere effettivamente visualizzati su uno schermo TV? Tale aspetto diventa ancora più importante quando si considera che essi sono in realtà immersi nel rumore elettronico. In ogni caso, molte produzioni di alto livello cercano proprio la modellazione e enfatizzazione dei dettagli nelle basse e bassissime luci per i motivi prima accennati. In altri tipi di produzione, più vicini al mondo della televisione mainstream (anche in 4K -HDR), ciò non è richiesto; anzi, potrebbe rendere più lunga e dispendiosa la post-produzione! In caso del genere si preferisce impiegare il più immediato Canon Log-3 rinunciando a qualche dettaglio nelle bassissime luci, ma semplificando la gestione del rumore.
I vari Canon-Log illustrati – ma il concetto si applica identicamente a qualsiasi camera che lavori con lo stesso principio delle curve di tipo semi-logaritmico – sono dunque curve OETF percettivamente uniformi che trasformano le caratteristiche native lineari ad elevata profondità di quantizzazione dei segnali RGB in uscita dal sensore in segnali digitali non lineari mappati su componenti con numero di bit inferiori (10 o 12 nel caso Canon) e dunque adatti ad essere registrati non compressi oppure veicolati attraverso l'interfaccia standard dell'industria 3G-SDI.
In conclusione, i sensori contemporanei e l’elevata potenza di calcolo disponibile a bordo delle ultime camere per cinematografia elettronica rendono tali strumenti molto potenti e flessibili. È anche vero, come è stato mostrato, che non sempre è necessario, o addirittura consigliabile, adoperare le curve OETF più estreme. Qualora il particolare tipo di produzione richiedesse l’esplorazione delle bassissime luci è senz’altro lecito privilegiarle. Viceversa, se i benefici del sensore di largo formato, della sua fotografia, gamma dinamica, risoluzione 4K/UHD, spazio colore esteso BT.2020 devono essere impiegati per produzioni non estreme, rinunciare a due stop nel semi intervallo inferiore porta innegabili vantaggi in termini di efficienza del work-flow.
Sergio Brighel
Technical Director
Trans Audio Video s.r.l.
Articolo tratto da Digitalproduction.tv – Numero 6