NULLA VAGY SEMMI – AZAZ A BINÁRIS VILÁG MEGKETTŐZŐDÉSE
1. A technikai alapokról
Néhány évszámElőzmények1913 – Beindul a Ford T modell futószalagos gyártása. Ch. Sorensen dán mérnök (a futószalag létrehozója), és Galamb József – aki a T modellt a tömeggyártás igényeinek megfelelően alakította ki – voltak a mozgatórugói ennek a lépésnek. (A tény jelentősége a második részletben kerül vizsgálat alá) 1946 – Neumann János iránymutató részvételével létrejött az első, programozható elektronikus számítógép az úgynevezett EDVAC (Electronic Discrete Variable Automatic Computer) A hardware fejlődési állomásai1969–70 – A Bell Laboratórium sikeres kísérleteket folytat használható fényérzékelők kialakítására (CCD)1972 – Texas Instruments: szabadalom egy elektronikus képrögzítő rendszerre1975 – S. J. Sasson digitális kamerával kísérletezik (Kodak)1981 – Sony: elektronikus képrögzítő, az első kommerciálisan hozzáférhető termék. 1989 – Sony Mavica – irány a professzionális vásárlócsoport1994 – Apple: Quicktake digitális kamera1995 – Kodak: DC40 0 a PC kompatibilis kamera első példája Digitális képfeldolgozás, látványteremtés:1975 – Martin Newell létrehozza a ,,Utah teaset” (az utahi teáskészlet) háromdimenziós modelljét, ami később a numerikusan generált látványok szimbóluma lett1982 – Industrial Light & Magic (ILM): Genesys szekvencia – az első numerikusan generált látvány a Star Trek II. filmben.1985 – Pixar: digitális képfeldolgozási fázisok kialakítása, kísérlet a folyamatok rendszerszerű kialakítására1989 – ILM: The Abyss film, amelyben egy nume-rikusan generált, vízből készült szörnyeteg élő színészekkel együtt jelenik meg1990 – Adobe Photoshop 1.0 Mit takar a ,,digitális fotográfia” kifejezés? A digitális fogalom eredete a latin, ujjakon történő számlálgatást kifejező szóra vezethető visz-sza (digit, digitus). Jelenlegi értelme szerint ez a jelző csak az ugrásokkal, azaz nem folytonosan változó jellegzetességekkel rendelkező rendszerekre alkalmazható. Az ilyen típusú rendszerek legegyszerűbb, legelterjedtebb képviselői az ún. bináris rendszerek, amelyekre az a jellemző, hogy az alapvető elemeknek két lehetséges állapota van. Esetenként az alkotó elemeknek a két állapot közötti átmenetét külső vezérléssel a szándékoknak megfelelő módon lehet irányítani. Ez a lehetőség vezetett a számítógépes ipar megteremtéséhez.A bináris elemeknek a két lehetséges határállapotát szimbolikusan (és itt nagyon komolyan kell venni a szimbolikus jelzőt!) 0- val és 1- gyel szokás jelölni. Egyes esetekben az így generált számértéknek nincs semmiféle jelentősége. Más esetekben – főleg a numerikus manipuláció követelményeinek megfelelően – az adott állapot leképezése egy számhalmazra gyakorlati előnyökkel jár és az egyetlen járható útnak bizonyul.Ez azonban nem igazán a lényeg. A ,,digitális fotográfia” ki-fejezés ugyanis nem fedi a valóságot. A fényérzékeny detektorok – az adott megközelítésben – ,,analóg” receptorok. Ez azt jelenti, hogy az expozíció alatt elnyelt fényenergia mennyiségével arányos jelet szolgáltatnak. A folyamat egy következő fázisában alakul át ez a jelrendszer binárisan kódolt, szimbolikus számokká. Éppen ezért sokkal helyesebb lenne a ,,binárisan tárolt fotográfia” megnevezés bevezetése a ,,digitális fényképezés” megjelölés helyett. A probléma azonban nyilvánvalóan az, hogy ennek a megnevezésnek a marketing értéke elhanyagolható korunk kedvenc ,,digitális” jelzőjének marketing eredményességéhez képest. Érdemes megjegyezni, hogy az elvileg is ,,digitális” receptorokra épülő fotográfia tulajdonképpen az ezüstalapú fényérzékeny rendszereket alkalmazó fotográfia! Az emulzióban található ezüsthalogenid kristályok az előhívás és fixálás során vagy fémezüst kristályokká alakulnak át, vagy kioldódnak a rétegből. Egy ezüsthalogenid részecskét alapul véve ,,nulla ezüst kristály” vagy ,,egy darab ezüst kristály” a két lehetséges kimeneti állapot. (Az elveket tekintve teljesen jelentéktelen az a tény, hogy tízmillió vagy százmillió elemi detektort alkalmaz a folyamat.) A legegyszerűbb digitális reprodukció Adott esetben szükség lehet a Mona Lisa reprodukálására. Ehhez első lépésként 16 324 ládára van szükség melyek mindegyikében 8 rekesz található egy oszlopban. Szükség van még elegendő mennyiségű, világosan megkülönböztethető tárgyak két csoportjára, melyek beleférnek a rekeszekbe. A folyamat szempontjából a dolgok jellege nem bír jelentőséggel. A két csoport lehet például krumpli és fokhagyma vagy rágógumi, esetleg Kínában készített műanyag Piroska és farkas bábuk, stb. Az egyszerűség ked-véért essen a választás ebben a fázisban a Piroska–farkas párra.Kell még a Mona Lisa színvilágát jól megközelítő és lehetőleg teljesen felölelő, összességében 256 különböző színminta. A színminták azonosítására nyolc bábuból álló sorozatokat lehet használni. A fekete színű minta ,,neve” legyen pl. a nyolc farkasból álló sorozat, míg a fehér színminta azonosítására nyolc Piroska használható. Arra kell csak ügyelni, hogy minden színminta egyedi nevet kapjon. Ez minden további nélkül lehetséges, mert a két állapotú elemek 256 különböző, nyolcas sorozatba állíthatók.Ezután a festményt 16 324 5x5 mm-es darabra kell vágni ügyelve a darabkák sorrendjére. (A festmény 77x53 cm méretű.) A bal felső sarok az első, a mellette jobbra következő a második és így tovább balról jobbra és fentről lefele. Ezt követően a 16324 dobozt egymás után meg kell tölteni a darabkákat legjobban megközelítő színmintákat meghatározó Piroska–farkas sorozatokkal.A ládákat elszállítva a kijelölt helyre gondoskodni kell elegendő mennyiségű , 5x5 mm méretű, a kiindulási minták színeit jól megközelítő színes négyzetekről . Itt a színes lapocskák legyenek a krumpli–rágógumi párokkal azonosítva. Az azonosító sorozatok feleljenek meg a Piroska–farkas nyolcasoknak úgy, hogy Piroska feleljen meg a rágóguminak és a krumpli a farkasnak. Most már csak a ládák sorozatát követve a megfelelő darabkákat kell a falra ragasztani. Eközben követni kell a balról jobbra, fentről lefelé történő sorrendet és meg kell tartani a sorok eredeti hosszúságát. Megfelelő távolságból nézve az eredményt fel lehet ismerni a Mona Lisát.Az abszurd igazság az, hogy a képvagdalás kivételével a folyamat tulajdonképpen a binárisan tárolt fotográfia pontos megfelelője! A színkezelés problémája A fentiekben vázolt, elvi jelentőségű eljárás gyakorlati hasznosítása több lépés megtételét követeli meg. Első sorban a színeket kell numerikusan manipulálható rendszerbe állítani. Ez nem egy egyszerű feladat, mert a színérzet és a szín interpretálása nem kizárólag fiziológiai folyamat. Pszichikai, kulturális és az adott állapottal kapcsolatos tényezők is befolyással vannak a folyamatokra. Tovább bonyolítja a helyzetet, hogy a reprodukció egymást követő lépéseiben olyan elektromos vezérlésű rendszereket kell használni, amelyek a bonyolult folyamatok következtében alapvető eltéréseket mutathatnak fel . Egy egységes platform megteremtése ezért alapvető fontosságú. A színek intézményesített klasszifikációja és reprezentációja sokkal régebbi keletű igény mint a binárisan tárolt fotográfia megjelenése. Az egyik legelső, matematikailag leírt színtér a CIE 1931 XYZ színtér volt, amely – az elengedhetetlen modernizálás után – még ma is gyakorlati jelentőségű. Jelentőségteljes tény, hogy az International Commission on Illumination (CIE) szervezet ezt a lépést 1931-ben tette meg.A vizuális eszközöket felhasználó kommunikációs csatornák rohamos fejlődése, majd később a globális digitalizálás (fotó, film, nyomtatás) igényei szükségessé tették egy, rendkívül sokoldalú technológiát felölelő terület egységes kezelését. Ezt a rendszert manapság színvezérlésnek szokták nevezni. A kidolgozandó rendszerrel szemben támasztható egyik alapvető követelmény az, hogy a technológiai váltás (például a számítógép képernyője és a végső nyomat) ne befolyásolja az érzékelhető látvány tulajdonságait, azaz mindkettő közel azonos színérzeteket keltsen a szemlélőben.A feladat korántsem egyszerű. A képernyőn a látványt a vezérlő, bináris rendszer utasításai alapján, kvantummechanikai, fotontermelő folyamatok hozzák létre, míg a nyomat éppen ellenkezőleg a fotonokat elnyelő vagy transzformáló folyamatok segítségével produkálja a ké-pet.A színeket szám hármasokkal szokás azonosítani a digitális fotográfia és a nyomtatás területén egyaránt. A szint, mint egy szubjektív érzetet persze igen nehezen lehet egyértelműen és konzekvensen egy szám hármassal jellemezni. Következésképpen ugyanaz a három paraméter a képernyőn egészen más színérzetet kelthet, mint a papíron. Íly módon nagyszámú színrendszer jött létre és az egyik rendszerből a másikra való áttérés jelentős nehézségekkel és bizonytalanságokkal jár. A területen tapasztalható elvi és gyakorlati problémák vezettek az általában színkezelésnek nevezett ismerethalmaz megteremtéséhez. Az eleve meglévő általános ismerethiány, a rendszerek eltérései valamint a sokszor összeegyeztethetetlen tulajdonságok szabad teret adnak a félismereteket nyújtó, főleg a marketing érdekeket követő ,,felvilágosító” tevékenységnek. Természetesen a színkezelési technológia eredményei tagadhatatlanok. A megjegyzés célja a figyelemfelkeltés. A prospektusok, marketing szakemberek által nyújtott információt sok esetben kritikus analízis alá kell vetni. Fényérzékelő rendszerek Említést nyert már az a tény, hogy az úgynevezett digitális fotográfia tulajdonképpen egy analóg fényérzékelő rendszer binárisan feldolgozott és tárolt eredménye. Maga a fényérzékelő detektor egy, a kamera típusától függő méretű lapka, amelyen nagyszámú, egyedi fényérzékelő receptor és a szükséges kiolvasó elektronika foglal helyet. Rendszerint három csoport receptor található a lapkán a három alapszín érzékelésére. Ezek a receptorok az expozíció ideje alatt az adott hullámhossz tartományban terjedő fotonok mennyiségével arányos, mérhető jelet (feszültség, töltés mennyiség, stb.) szolgáltatnak és tárolnak a kiolvasás idejéig. Az egyedi receptorok kialakítása és elrendezése rendkívül sokféle lehet. Így pl. ismeretes a Fuji-féle ,,Super1 CCD” amelyik egy méhkasra emlékeztető, nyolcszögletű receptorokra épü-lő rendszer. Az ismeretes két változat egyikében két, eltérő érzékenységű detektor alrendszer található, míg a másikban ez a tulajdonság nem található meg. A Bayer elrendezést követő detektorokban kétszer annyi zöld színre érzékeny receptor van mint a vörös, illetve a kék fényre érzékeny receptor. Ennek az alaptípusnak tekinthető detektor kialakításnak további változatai ismeretesek. Vannak négy színtartományt érzékelő detektoro. Az alkalmazott alapszíneknek megfelelően ezeket CYGM (cyan, yellow, green, ma-genta), az RGBM vagy RGBE (red, green, blue, emerald/white) rendszereknek nevezik. Kodak ,,panchromatic” detektornak ne-vezett csipje szintén ebbe a kategóriába tartozik a megfelelő nosztalgikus asszociációkra utalva. Végül megemlítendő a Foveon X3 detektor, amelyikben a különböző spintartományokra érzékeny receptorok nem egymás mellett, hanem egymás alatt helyezkednek el.2Van még olyan detektor, amelyikben a teljes felületet elfoglalja az aktív érzékelő réteg, míg más rendszerekben ez csak mintegy 75%-ra, vagy akár 25% - ra tehető ez a paraméter3. A probléma azonban abban rejlik, hogy minden kialakítás kényszerű kompromisszumokkal jár és így egyes felvételi körülmények között az egyik az optimális megoldás, míg más esetben egy eltérő kialakítás a kedvezőbb. Itt van egy olyan pont, amiről nem sok szó esik. A cégek a fejlesztés folyamán a megcélzott felvevő réteg igényeit veszik alapul, ami tulajdonképpen egy statisztikai ismerethalmaz. Amint az a későbbiekben kiderül a primer, szolgáltatott jelek teljesen használhatatlanok a képszerű fázisok céljaira. Miután adott felvételi körülmények bizonyos statisztikai tulajdonságokkal jellemezhetők az expozíciót követően egy intenzív statisztikai feldolgozási fázis következik. Éppen ezért a hardware eltérő tulajdonságai mellett a receptorjelek utólagos feldolgozásának eredményessége is igen fontos az elérhető fotografikus képminőség szempontjából.4 A lehetséges megoldásoknak vannak közös jellemzői is. A receptorjelek általában nem teljesek, azaz a hiányzó számadatokat a környező receptorok jeleiből kell meghatározni. Ezek a primer jelek a maguk voltában használhatatlanok a képmegjelenítés céljaira. Következésképpen a kiolvasás és időleges tárolás után egy soklépéses, előzetes feldolgozási folyamat kezdődik el.A kiolvasás és a primer feldolgozási folyamat tulajdonképpen egy jelanalízissel kapcsolatos feladatnak tekinthető. Ebből a szempontból az első, igen fontos lépés a receptorjel (feszültség, töltésmennyiség, stb.) bináris jelsorozattá történő átalakítása. Az ezt követő lépés a primer bináris adatok előzetes feldolgozása. Ez a folyamat tulajdonképpen meghatározó jelentőségű a fotografikus (technikai!) minőségét tekintve. Következésképpen a részletek nehezen hozzáférhetőek, illetve ipari titoknak tekintendők. A feladat tulajdonképpen a három alapszín eloszlásának meghatározására irányul. A feltételrendszer, amelyek között az adott célt kell elérni sokrétű és messzire vezető problémákkal terhes. ? Az egyes képpontok színértékeit több receptor jeléből kell meghatározni. Az elemi receptorok fizikai tulajdonságai jelentősen eltérhetnek egymástól.? Az egyetlen képpontra vonatkozó mért adatok nem azonos helyről származnak. Ez gyorsan változó eloszlás esetében igen jelentős probléma. Pl. éles határok mentén okoz nehézségeket ez a tény.? A mérhető fizikai mennyiségek igen kicsik, ezért mesterségesen fel kell azokat erősíteni. Egy igen jelentős hibaforrás!? Az alacsony szintű mért értékek jelentős zajtartalommal rendelkeznek.5 ? A gyártási technológia eltérései az egyes elemek, csipek között megnehezítik egy mindenkor alkalmazható algoritmus kifejlesztését.? Az eltérő felvételi körülmények között jelentős statisztikai eltérések léphetnek fel.A megoldás koránt sem egyszerű. A fejlesztés folyamán talán a hardware fejlesztésnél is költségesebb ennek az elsődleges feldolgozási fázisnak a kifejlesztése. Nyugodtan kijelent-hető,hogy a folyamat eredményessége fontosabb a technikai minőség biztosításában mint magának a hardware-nak a paraméterezése. Magában a kamerában egy viszonylag nagy teljesítményű cél számítógépnek kell jelen lennie és ezt optimálisan kell felhasználni. Tovább bonyolítja a helyzetet, hogy a szűkséges statisztikai ismeretek nehezen hozzáférhetőek, sok esetben nem is állnak rendelkezésre és végül nehezen implementálhatóak.6 Az eredmények viszont meghatározó jelenségűek a kamerának a minőségi hierarchiában elfoglalt helye szempontjából. Miről esik kevesebb szó? A digitális fényképezőgépek egyik kevésbé nyilvános jellemzője a fényérzékeny detektor teljes, geometriai mérete. Ennek persze stratégiai okai vannak. Van egy – az optikában ismert abszolút határérték – az ún. Fresnel-határ, ami a leképezett jelenet részleteinek finomságát határolja be. Kissé pongyola ,,fordításban” (és nagy jóindulattal) ez úgy adható meg, hogy egy jó minőségű objektív kb. 100 párhuzamos vonalat képes úgy, ahogy pontosan leképezni a képtér egy milliméterére. Miután a fényképezés tulajdonképpen egy jelátviteli folyamat, alkalmazható az un. Nyquist– Shannon, a bináris alapú jelanalízissel kapcsolatos frekvencia paraméter. Ismét egyszerűsítve a dolgokat (de nem a lényeget!) ez az adat tulajdonképpen a gyorsan változó jelek frekvenciájának felső határát határozza meg. A paraméter azt mondja, hogy egy periodikus jelet akkor lehet megbízhatóan reprodukálni, ha egy hullámhosszban legalább két detektor működik egyszerre. Egy átlagos fényképezőgépben a detektor mérete kb. 7x5 mm. Ez azt jelenti, hogy ha a hosszabb oldal mentén kb. 1500, a rövidebb oldal mentén pedig 1000 szenzorelem van (azaz a szokásos nyelven a detektor kb. 1,5 effektív megapixel értékű) akkor az adott számhalmaz még nem tartalmaz jelentős mennyiségű, redundáns információt.7A kijelentés természetesen pusztán a jelátviteli tulajdonságokra vonatkozik. Az utólagos feldolgozás, a már említett statisztikai folyamatok és az egyéb szempontok nem teszik értelmetlenné a magasabb receptorszámok alkalmazását. A kijelentés egyetlen célja újfent az, hogy felhívja a figyelmet a ,,közkézen” forgó ismeretanyag kritikus vizsgálatának fontosságára. A következő lépés: az adatok tárolása A detektorból kiolvasott és előzetesen feldolgozott adatokat a számítógépek számára érthető formátumban kell tárolni.