Alla fine mi sono deciso a scrivere questo pezzo, meglio tardi che mai! L'ho diviso in due parti: la prima dedicata a chiarire - spero! - cosa sia ed in cosa consista realmente il processo di interpolazione che è il cuore della demosaicizzazione (che comprende anche altro, ma non ne parleremo in questa sede), mentre la seconda riguarderà il sensore Foveon Quattro ed anche in questo caso cercheremo di chiarirci le idee e liberarci dalle sciocchezze che circolano in rete e che hanno avuto un'impennata negli ultimi tempi.
L'Interpolazione nel Mosaico
a confronto con quanto avviene nel Foveon Quattro
ovvero cosa sono e perché non hanno nulla a che vedere tra loro
Parte Prima - Demosaicizzazione mediante Interpolazione nei Sensori a Mosaico
La demosaicizzazione dell'informazione prodotta dai sensori a mosaico è ottenuta fondamentalmente mediante l'applicazione di un "algoritmo di interpolazione cromatica spaziale, basata sugli assunti ipotetici che: 1) il gradiente di luminanza tra due pixel adiacenti sia pari al rapporto tra la differenza di luminanza e la distanza spaziale degli stessi; 2) la luminanza complessiva di ogni fotosito sia pari alla somma dei valori cromatici calcolati."
Tali assunti, però, non hanno e non trovano alcun riscontro nella realtà, né teorico né pratico, ma sono adottati unicamente perché tra tutti gli assunti possibili sono quelli che meglio di ogni altro ingannano l'occhio umano.
Chi realmente comprende appieno la definizione sopra riportata tra virgolette, non necessità di alcuna ulteriore spiegazione per calcolarsi da solo l'attendibilità attesa dei risultati ottenuti tramite tale preteso "processo di ricostruzione": potrà quindi constatare per proprio conto dai calcoli fatti che tale attendibilità è sostanzialmente nulla e, di conseguenza, sapere per certo e per proprio auto-convincimento che il processo di interpolazione non è in grado di ricostruire alcunché, poiché ciò che produce non è e non può essere informazione ma è soltanto "ipotesi", alla quale ipotesi non spetta neanche il diritto di fregiarsi dell'aggettivo "ragionevole" (che è riservato ai casi che presentano un grado di attendibilità apprezzabilmente superiore a 0.5). Anzi, per dirla tutta, chi è in grado di procedere per proprio conto molto probabilmente non perderà neanche un istante a fare alcun calcolo perché la cosa gli apparirà del tutto evidente, ma in un caso o nell'altro per lui sarà comunque una questione di fatti e non di opinioni.
Chi invece non è in grado di verificare formalmente in modo autonomo si trova nei guai, perché per lui tutto si riduce al confronto della propria opinione contro quelle altrui, senza alcun modo per far assurgere una di queste al rango di fatti: o decide di fidarsi dell'opinione di terzi oppure della propria, ma in un caso o nell'altro per lui sarà comunque una questione di opinioni e non di fatti.
Ovviamente ciò non riguarda specificatamente la questione dell'interpolazione, ma la situazione è identica per qualunque argomento tecnico-scientifico per il quale non si possiedano sufficienti basi per procedere in modo autonomo "infischiandosene" delle opinioni degli altri.
Purtroppo è assolutamente impensabile affrontare qualsiasi argomento tecnico-scientifico sviscerandolo dalle basi (o quantomeno certamente non in questa sede e in ogni caso il tempo necessario sarebbe degno di miglior causa), quindi di seguito cercherò di fare l'unica cosa sensata e fattibile, ossia di presentare i fatti in forma discorsiva (che ovviamente la maggior parte dovrà necessariamente considerare alla stregua di mia opinione personale da confrontare con la propria), sperando di riuscire a renderla sufficientemente comprensibile da risultare utile. Vediamo perciò di tradurre in soldoni la definizione che abbiamo visto sopra, analizzando in concreto un esempio base del processo di interpolazione.
Partiamo da un pixel verde e procediamo con l'assegnare al fotosito i valori per gli altri due colori. Prendiamo i due pixel adiacenti del rosso (che saranno in orizzontale o in verticale), facciamo la media tra i due e questo sarà il nostro valore di base; poi prendiamo i due pixel sempre di rosso più vicini sull'altro asse (che non saranno adiacenti) e facciamo la media anche fra questi. Adesso, se queste due medie saranno uguali questo sarà il valore di rosso che assegneremo al pixel, se invece sono differenti faremo una media tra i due valori, ma assegnando ad essi un peso che sarà inversamente proporzionale alla loro distanza dal pixel verde di partenza. Dopo di che ripeteremo identicamente il procedimento per assegnare un valore al blu. Nei mosaici RGBG (cioè con due pixel verdi per ogni blu e rosso) il processo finisce qui ed il valore di luminanza complessiva del pixel è dato dalla semplice somma dei tre valori cromatici. Applicheremo poi l'intera procedura per ogni fotosito, escludendo quelli perimetrali per i quali non avremo a disposizione pixel esterni (per questa ragione i sensori hanno sempre almeno un pixel in più per ogni lato rispetto all'immagine effettivamente prodotta). La sostanza del procedimento è tutta qui, davvero molto semplice.
Ora, è necessario riflettere attentamente sul fatto che calcolare la media tra i due valori cromatici esterni al fotosito non è altro che la stretta applicazione pratica del primo assunto affermato nella definizione data, ossia che "il gradiente di luminanza tra due pixel adiacenti sia pari al rapporto tra la differenza di luminanza e la distanza spaziale degli stessi". Detto in linguaggio comune, si "suppone" che "ogni" variazione cromatica sia "sempre" graduale (ossia lineare). Ciò ovviamente non soltanto non è vero ma neanche rappresenta la norma, anzi nella realtà una variazione cromatica e/o di luminosità che sia lineare rappresenta una eccezione e qualunque verifica sperimentale lo conferma. Ma anche a prescindere dalle verifiche sperimentali, c'è una dimostrazione pratica di tutto questo ben presente nell'esperienza visiva di ognuno: la pittura. Noi riusciamo di solito molto facilmente a distinguere un dipinto da una fotografia, ci vuole una maestria davvero fuori dal comune per riuscire ad ingannare il nostro occhio ed il motivo è proprio questo: l'estrema difficoltà da parte dell'artista a simulare sottili variazioni cromatiche che di norma nella realtà sono tutto tranne che lineari. Insomma, nella realtà sia le variazioni cromatiche sia quelle di luminanza sono sistematicamente non-lineari.
Quanto al secondo punto della definizione, ossia al fatto di ipotizzare che "la luminanza complessiva di ogni fotosito sia pari alla somma dei valori cromatici calcolati", ritengo che sia palese che se in ogni pixel due valori cromatici su tre sono "supposizioni ipotetiche" altrettanto ipotetica sarà la loro somma. Se ancora non basta per convincersi, basta riflettere sul fatto che questo equivale palesemente ad ipotizzare che in ogni quadratino di quattro pixel adiacenti tutti e quattro i fotositi debbano presentare la stessa identica luminosità, il che è manifestamente privo di riscontro nella realtà, sia teorico che pratico.
A questo riguardo, un discorso a parte meriterebbe il mosaico RGBW (ossia con un pixel per ogni colore più uno neutro pancromatico detto bianco), nel quale come luminosità complessiva viene adottato il valore del pixel W ed i tre valori cromatici sono di conseguenza aggiustati in proporzione per far tornare i conti. La sostanza del discorso non cambia minimamente sotto il profilo cromatico, ma indubbiamente un mosaico RGBW è "leggermente meno inattendibile" di uno RGBG per quanto riguarda i valori di luminanza.
In sintesi, i "numeri" prodotti dal processo di interpolazione sono soltanto una "irragionevole ipotesi", che presenta l'unico ma sostanziale pregio di ingannare agevolmente l'occhio umano. Perché lo inganna? Semplice: perché l'occhio umano quando non riesce a distinguere l'informazione intermedia che cerca tende in prima battuta ad applicare un meccanismo molto simile, quindi finché non va ad osservare con attenzione non si accorge dell'inganno.
Vediamo adesso di tirare le somme di quanto abbiamo detto. Le implicazioni e le relative conseguenze della natura del mosaico e del processo di demosaicizzazione indissolubilmente legato ad esso sono molteplici (e per la maggior parte sconosciute ai più), ma qui ci limiteremo alle tre principali e maggiormente deleterie.
A) Un sensore a mosaico è DEL TUTTO INCAPACE di rilevare un "salto di luminosità", ossia una variazione netta della stessa, ed al confine di tale salto introdurrà SEMPRE un tono intermedio DEL TUTTO INVENTATO, che non esiste nella realtà (per esempio in un passaggio netto dal bianco al nero o viceversa introdurrà sempre nel mezzo un grigio circa medio del tutto inventato).
B) Un sensore a mosaico è DEL TUTTO INCAPACE di rilevare un "salto cromatico", ossia una variazione netta da un colore ad un altro, ed introdurrà SEMPRE in mezzo ad esso un colore intermedio DEL TUTTO INVENTATO, che non esiste nella realtà (per esempio in un passaggio netto dal verde al blu o viceversa introdurrà sempre nel mezzo una sorta di cyan del tutto inventato).
C) Un sensore a mosaico tenderà sempre ad appiattire qualunque variazione tonale (cromatica e/o di luminanza) che non sia lineare, cosa che avviene sistematicamente dato che nella realtà il 99% delle variazioni tonali non è lineare. Detto in altre parole, il microcontrasto viene sistematicamente ed inesorabilmente ridotto.
Ce ne sono molti altri da considerare, ma questi tre bastano ed avanzano ed hanno il pregio di essere evidenti. A tutto questo ci sarebbe inoltre da aggiungere il danno nefasto provocato dal filtro anti-aliasing, ma per questo contesto ce n'è d'avanzo e ci fermiamo qui, altrimenti mi accusano di sparare sulla croce rossa!
Ritengo che tutto quanto detto sia sufficiente per farsi un quadro chiaro della questione ed al netto delle leggende "webbopolitane" imperanti in rete e non solo. Nella seconda parte vedremo di chiarirci le idee anche sul sensore Foveon Quattro, sul quale "se ne dicono di tutti i colori" sia in senso lato sia letterale! Anticipo solo una cosa: nel Quattro non è presente alcun tipo di interpolazione comunemente intesa, né in senso matematico esteso, né per analogia discorsiva e meno che mai dal punto di vista pratico. Chi pensa il contrario è fuori strada come uno che parte da Roma per andare a Ciampino e si ritrova a Roncobilaccio!