A FOTOGRÁFIA MÉRHETŐ ÉS LÁTHATÓ PARAMÉTEREINEK KAPCSOLATA – NEGYEDIK RÉSZ
Számlálgatja Mehemed, hányfélék a tehenek...(1) – A digitális képgenerálás technológiai alapjai
Elöljáróban
Elérkezettnek látszik az idő, amikor az ezüst-alapú fotográfia és a bináris technológiára alapozott képrögzítés, képgenerálás alapvető különbségeit lehet vizsgálat tárgyává tenni. A továbblépés érdekében két alapvető tény kiemelése látszik szükségesnek.
Az egyik megemlítendő szempont az az, hogy az adott technológia tudományos háttere mélyreható, jelenleg is gyors fejlődés alatt álló ismeretanyagot ölel fel. Így nem csoda, hogy a népszerű, közérthető szinten sokszor gyermekes félreértések, félremagyarázások érhetők tetten. Ennek egyik ,,kiemelkedő” példája a már idézett MTF-fel (Modulation Transfer Function), egy mérhetőnek tekintett jellemzővel kapcsolatos interpretációs káosz.
A közölt ábrák nagy részében a görbe a nulla milliméterenkénti vonalpár értéknél kezdődik. A görbék sokszor az egy ezred vonalpár milliméterenkénti értékét a nulla vonalpár átviteli értékénél alacsonyabbnak mutatják. Az így felvetődő logikai és méréstechnikai problémákat lásd a lábjegyzetben.(2) Itt csak az a kérdés említhető meg, hogy hogyan lehet egy milliméterenként nulla vonalpárat tartalmazó tesztábrát előállítani.
A másik messzire vezető szempont az az, hogy az ezüstalapú fotográfiában az érzékelő réteg – a fényérzékeny emulzió – egy inert, lényegében csak a fotonáram jellemzőire reagáló fizikokémiai rendszer. A képkialakítási folyamatban tehát az elsődleges feladat az adott lépésben aktív fotonáram célszerű manipulálása. Nincs lehetőség a nagyításkor az expozíció idején jelenlevő viszonyok befolyásolására. Egyedül az adott lépésben uralkodó viszonyok korrekciós kialakítására van lehetőség.
Ezzel szemben a bináris képgenerálási folyamatban egyetlen adathalmaz, a számítógép memóriájában helyet foglaló adattömeg manipulálása történik. A két másodlagos adatrendszer: a videó alrendszert és a nyomtató akcióit vezérlő adathalmaz az előzőekben említett memóriatartalomnak a technikai rendszer által meghatározott következményei.
Miután a numerikus manipuláció minden egyes aktusa globális jelentőségű, azaz az adott lépés minden addigi akció eredményét befolyásolja, illetve az addigi lépések együttes eredményére támaszkodik, a teljes folyamat tulajdonképpen egyetlen jelátviteli rendszernek tekinthető.
Ebben a megközelítésben az optika és a detektorrendszer feladata csak a primer adathalmaz létrehozására szorítkozik. Ennek következtében szerepük az eredményül kapott technikai minőség szempontjából viszonylagos és nem egyeduralkodó jelentőségű.
Miután a leképező és a detektáló rendszer optikai és szilárdtest fizikai tulajdonságai numerikusan egyedenként és rendszerszerűen is modellezhetőek, illetve analizálhatóak, ezek jellemzőinek egymástól független, egyedi vizsgálata csak korlátozott információ tartalmú eredményeket szolgáltathat. A látható végeredmény vizuális tulajdonságai csak a teljes jelátviteli folyamat ismeretében jósolhatóak meg.
A kiindulási adathalmaz kialakítása
Az első lépés ebben a jelátviteli folyamatban a kiindulási adathalmaz kialakítása.
Az előző cikkekben már említést nyert, hogy majdnem az összes detektor elrendezés nem egyenlő számú elemi érzékelőt tartalmaz az alapvető három szín-tartományban. Ezzel szemben a képfeldolgozó numerikus rendszerek azonos számú adatot követelnek meg ezekben a tartományokban. Nincs más kiút, a hiányzó információt a rendelkezésre álló adatokból kell meghatározni.(3)
Tovább bonyolítja a helyzetet, hogy az egyes színtartományokban működő detektorok – egyetlen detektorrendszert kivéve(4) – nem azonos pontban gyűjtik be a színeket reprezentáló mérési adatokat. Nyilvánvalóan ez további elvi és gyakorlati problémákhoz vezet. Így például a gyors, sokszor azonnali átmenetek környékén az eltérő pontokból származó információk torzulásokhoz vezethetnek.
Az is említést nyert már, hogy az elemi detektorok által szolgáltatott mért értékek véletlenszerű ingadozásokkal terheltek. A számos (már részben említett) zaj összetevő két alapvetően eltérő tulajdonságú csoportra osztható. Az egyik csoportra az jellemző, hogy stabil, ismert fizikai folyamatok következtében kvalifikálható, számszerűsíthető zaj összetevőt szolgáltatnak az ide tartozó folyamatok.
Egy másik, jelentős számú elemet tartalmazó csoport viszont a felvételi körülmé-nyektől függő zajtartalomra vezet. Ebben az esetben az ideális megoldás az volna, hogy a felvétel készítésekor a primer numerikus feldolgozás azonosítani tudná a felvételi körülmények jellemzőit, amiből következtetéseket lehetne levonni az aktuális zajtartalom tulajdonságait illetően. Ez igen mélyreható statisztikai ismereteket és az implementáláshoz szükséges numerikus technológiai tapasztalatokat követel meg –még a részleges megvalósítás esetén is.(5)
A lényeg megértése érdekében a részleteket figyelmen kívül hagyva az alábbi tények említhetők meg.
A primer feldolgozás, azaz a kiindulási adathalmaz származtatása néhány alapvető problémát kell, hogy megoldjon. Az egyik a véletlenszerű tulajdonságokat felmutató számadatból viszonylag jó megbízhatósággal meg kell határozni az adott pontban valószínű, reális értéket.(6) A másik problémákkal terhelt feladat a környező pontokban nyert mérési eredményékből az adott pontban várható, feltételezett reális érték meghatározása.(7) Ebben a lépésben is jelentős szerepet kap a jelenlevő, véletlenszerű ingadozásokat felmutató zajtartalom hatásainak minimalizálása.
A harmadik fontos fázis a tárolás megvalósítása. Ebben a fázisban például a veszteséges kompresszió esetén (JPEG, JPEG2000) nem is a pontok megvilágítási értékei kerülnek tárolásra, hanem meghatározott közelítő függvények együtthatói.(8)
Végül, az egyik legfontosabb szempontot kell megemlíteni. Az előzőek alapján talán világos, hogy a vizsgált folyamat gyakorlati megvalósítása a fényképezőgép, a számítógép és a nyomtató együttes rendszerében elkerülhetetlen kompromisszumok meghozatalát teszik szükségessé. Figyelembe kell venni, hogy a felvétel készítésekor csak véges idő áll rendelkezésre az említett statisztikai, numerikus és tárolási lépések véghezvitelére. Nyilvánvaló, hogy végül is a kialakított numerikus kapacitás, a tudományos ismeretek implementálásának mélysége tulajdonképpen marketing probléma. Meg kell határozni a befektetések és a várható visszatérülés elfogadható arányait. Ez végső soron szociálpszichológiai kérdés:(9) ismerni kell a célcsoport adott pillanatban kialakított reakcióit.
Paraméter becslés
Az előzőek alapján talán nyilvánvaló, hogy jelentős probléma az adott felvételi körülmények helyes felismerése. A természetes környezet sajátos, véletlenszerű ingadozásokat mutathat fel. Példa lehet erre egy távoli fa lombozatának képe, vagy egy füves terület fényképezésekor kialakuló reális ingadozások rögzítése. A természetes emberi bőr is ebbe a kategóriába tartozik.
Ezeket a véletlenszerű ingadozásokat kell effektív módon elválasztani a detektor sajátos, fizikai-elektronikai zajkomponensétől. A feladat – tudományos szinten tekintve – természetesen jó hatásfokkal oldható meg. A fényképezés területén azonban vannak praktikus behatároló tényezők. A korlátozott numerikus kapacitás, a numerikus lépések végrehajtásra rendelkezésre álló idő természetes hatarai egyértelműen kompromisszumok meghozatalát teszik szükségessé.
Az interpoláció rejtelmei
Végül is a primer numerikus feldolgozás problémája visszavezethető egy egyszerűnek tűnő feladat megoldására. A környező pontokban(10) rendelkezésre álló, vagy a detektorok értekéiből levezetett adatokból egy a közbülső pontban várható érték meghatározására. Kissé pontosabban vizsgálva a kérdést a feladat nem is olyan könnyen megoldható. A környezeti értékek természetszerűen hibával terhelt adatok. A látható élesség szempontjából fontos gyors átmenetek esetén (kontúrok, hirtelen színváltozások, …) a numerikus megoldás korántsem egyszerű. Elegendő legyen megjegyezni, hogy a különböző módszerek eltérő mértékben ugyan, de mindenképpen hibás kontúrokat produkálnak az éles átmenetek környezetében.(11)
Képméret változtatás
Az egyik legkézenfekvőbb probléma a képméret változtatása, azaz a pixelszám növelése, vagy csökkentése. Ezen a területen az eddig említett problémák teljes spektruma jelen van.(12)
A lábjegyzetben megadott okok miatt a következtetés természetszerű. Bármely képméret változtatás egy numerikusan produkált látványt alakít ki – amely esetében az eredeti felvételi viszonyokkal való kapcsolat pontossága nagymértékben a numerikus lépések teljesítőképességétől függ.(13) A megjegyzés értelme nyilvánvalóan a következő: technikai (és nem intellektuális!) szempontból nincs sok értelme az optikai tulajdonságok, a pixelszám adatok egyedi vizsgálatának, illetve propagálásának.
Az is meggondolandó, hogy a képernyőn megjelenő látvány drasztikus képméret csökkentést jelent.(14) A nyomtatás bonyolult fizikai, numerikus háttere csak tovább növeli a problémákat. Kézenfekvő a következtetés. Ily módon a látható képhez vezető lépések sorozata tulajdonképpen numerikusan produkált adathalmazok vizsgálatából és azok felhasználásából áll.
A primer feldolgozás további jellegzetességei
A primer numerikus manipuláció további lépései messzire vezető statisztikai problémákat tartalmaznak. Így például a felvételi körülményeket jellemző megvilágítási színhőmérséklet felmérése és az egyes színcsatornák értékeinek helyes egyensúlyának megvalósítása egy rendkívül problematikus feladat. Itt ugyanis a színeket reprezentáló adathalmazok egymáshoz való viszonyát kell változtatni a természetszerű benyomások kialakítása érdekében. Az alkalmazandó korrekciók mértéke pedig az adott felvételi körülmények függvénye. Másfajta nehézségeket jelent az ún. ekvivalens fényérzékenység hardver szintű, vagy numerikus implementálása. A megoldás két irányban lehetséges. Vagy mesterségesen csökkenteni kell a szolgáltatott jelnagyságot, vagy növelni kell azt. Mindkét esetben mesterséges hardver vagy szoftver beavatkozás a kivezető út. Mindkét esetben – különösen a magasabb ekvivalens érzékenységi tartományokban – a zajtartalom jelentős erősítése a következmény.
A másodlagos képi manipuláció
A kiindulási adathalmaz létrejötte tulajdonképpen csak az első lépés a látható végeredmény kialakítása során. Az adott ,,nyersanyag” tulajdonképpen csak akkor lesz látható amikor a számítógép memóriájába beolvasott adattömeg az operációs rendszer és a videó vezérlő egység együttműködése után a monitor kijelző részlegét vezérlő jelsorozatává válik. Az adott folyamatban minden, az eddigiekben megemlített probléma szerepet játszik (játszhat).(15)
A kiindulási pont azonban csak kezdete a felvétel készítésekor elképzelt végeredményhez vezető útnak. A cél eléréséhez számos korrekciós lépés megtétele lehet szükséges. A végrehajtandó korrekciós aktusok például kiterjedhetnek az optikai elégtelenségek vagy a perspektivikus torzulások javítására. Ezen túlmenően lehetőség van az alapszintű manipulációkat meghaladó, tulajdonképpen a kreativitás területéhez tartozó, a vizuális – illetve az intellektuális – tartalom változtatására.(16)
A jelenlegi témakör határain belül maradva, itt csak a technológiai szintű beavatkozásokra lehet kitérni. (Lásd a 15. lábjegyzetben elmondottakat.)
Optikai és perspektivikus korrekciók
Ellentétben az optikailag vezérelt képrögzítési technológiákkal, a bináris technológiára épülő fotográfiában lehetőség nyílik a kiindulási torzulások korrekciójára. Ha a felvételkor alkalmazott optikai rendszer tulajdonságai ismeretesek, akkor lehetséges az optikai hibák(17) javítása. Egyes, magas szintű programok előre meghatározott teszt-ábrák alapján automatikusan szolgáltatják az említett korrekciókat.
Ennél sokkal mélyebbre ható beavatkozást jelent a perspektivikus torzulások numerikus helyreigazítása. Ebben az esetben a teljes képtartalom újra generálódik.
Ez egy újabb adalék abba az irányba, hogy a folyamat lokális paramétereinek vizsgálata csak korlátozott jelentőségű. A technológiai folyamat jellegzetességei egy globális, a teljes jelátviteli rendszerre kiterjedő megközelítést tesznek szükségessé.
Egyéb vizuális jellegzetességek manipulálása
Közismert, hogy a megfelelő programok segítségével a képi tartalom igen széles határok között manipulálható.(18) Ezek közül egy tulajdonság érdemel különös figyelmet. Ez pedig az érzékelhető élesség kérdése. A fotografikus leképezés tulajdonképpen egy bonyolult, de matematikailag megfelelő pontossággal leírható transzformációja az objektív előtt található konfiguráció és a leképező rendszer együttműködésének.(19) Tulajdonképpen a transzformációs lépések egyszerűsítésének igénye vezetett az MTF az előző cikkekben megadott, pontos definíciójához. Az MTF megfelelő alkalmazása ugyanis jelentősen megkönnyíti a matematikai manipulációk egy részét.
Nem teljesen meglepő módon az adott ideák numerikus megvalósítása tulajdonképpen megtörtént és mindenki számára hozzáférhető.(20) Ismeretesek speciális programok, amelyek például a bemozdulásos és egyéb okok miatt (élesre állítás stb.) előálló életlenségek numerikus korrekcióját veszik célba.
Felvetődik a szoftver háttér ismeretének fontossága is
Az elmondottak alapján talán nyilvánvaló, hogy nem képzelhető el egy olyan numerikus program, amelyik minden szempontból optimálisnak tekinthető.(21) Elkerülve a nyilvánvalóan marketing jellegű elemzés buktatóit, itt csak arra lehet felhívni a figyelmet, hogy a rendelkezésre álló szoftver háttér lényegesen kiterjedtebb, mint két-három nagynevű programrendszer. Egyes, speciális programok adott területeken: képméret változtatás, fotografikus minőség korrekció, képminőség optimalizáció, lényegesen jobb eredményeket mutatnak fel mint a globális, minden feladatot ellátni igyekező rendszerek. Itt a szakszerű, objektív információ forrás és a személyes tapasztalat elengedhetetlen fontosságú.
Összefoglalásként
A fotográfia bináris, numerikus háttere, illetve az ezzel járó cselekvési mintarendszer változások hatásai lényegesen szélesebb körben éreztetik hatásukat, mint a fotográfiai technika rohamos változása. Többek között ez a fejlődés megváltoztatta a fotográfia kulturális, vizuális szerepét is.
Ez a folyamat tulajdonképpen azt eredményezte, hogy a fotográfia egy fontos részévé vált egy széleskörű, numerikus technológiára alapozott látvány generáló és információs tevékenységnek. Másfelől ez azt is eredményezte, hogy a fotografikus tevékenység kifejezési lehetőségei lényegesen kitárultak. A kétségtelenül jelenlevő technológiai, rituális konzervativizmus azonban erőteljesen fékezi ezeknek a lehetőségeknek a széleskörű elterjedését.(22)
További problematikus tényező a technológiai ismeretterjesztésben azonosítható ismerethiány. Mint sok minden más esetben a jóindulat nem elegendő. Széleskörű tudományos mélységű háttér birtoklása az alapfeltétel. A gyakorlati ismeretnek hitt tapasztalat, és a marketing indíttatású prospektusok interpretálása semmiképpen sem kielégítő.
Montvai Attila
Jegyzetek
(1) A vizsgált területen szimbolikusnak tekinthető, hogy a derék tehén-számlálgató sorsát az ismerethiány pecsételte meg. (… nem tudta ezt Mehemed...)
(2) Sokszor nem kerül megemlítésre az a tény, hogy hogyan kell a milliméterenkénti vonalpár értéket értelmezni. Az objektív előtti vonalsűrűségre vagy a leképezett ábrának a detektoron kialakuló vonalsűrűségére kell-e gondolni.
(3) Demosaicing.
(4) Lásd az előző cikkeket.
(5) Nem csoda, hogy a megvalósítás részletei féltve őrzött gyártási, ipari titkok. Felmerül a kérdés, hogy a RAW adatok mennyire tekinthetők primer adatoknak?
(6) Paraméterbecslés – a statisztikai szakzsargon
(7) Interpoláció az adott feladat általánosan elfogadott megjelölése.
(8) A JPEG kompresszió esetén az un. diszkrét koszinusz transzformáció eredményeként kapott együtthatók, míg a JPEG2000 szisztéma esetén az un. wavelet együtthatók kerülnek tárolásra. Következésképpen a számítógép memóriájában található értékek két bonyolult transzformációs lépés után kerülnek meghatározásra! Azaz egy kódolási és egy dekódolási lépés után jönnek létre.
(9) Az adott kérdés vizsgálatára a befejező cikkben kerül sor.
(10) Itt fontos megjegyezni, hogy minden esetben kétdimenziós problémával kell küzdeni a megoldás érdekében.
(11) Tanács az angolul tudók számára: a browserben be kell írni az ‘interpolation artefact’ kereső kifejezést. A kapott eredmény mutatja, hogy az adott problémakör egy igen intenzív kutatási terület.
(12) A képméret változtatás csak akkor hagyja meg (elvileg!) az eredeti értékeket a kiindulási pontokban, ha a nagyítás mértéke az (n+(n-1))/n érteknek felel meg a hosszabb és a rövidebb oldal mentén egyaránt. Itt n a kiindulási érték az adott oldal irányában. Ez a jelenlegi oldalviszonyok esetén elérhetetlen az eredeti oldalarány megtartása mellett.
(13) Ez persze nem azt jelenti, hogy az interpoláció útján a szomszédasszony arcképe átalakul a macskája képévé!
(14) 2...3 millió képernyő képpont mutatja a 10..14 millió felvételi képpont látvány tartalmát. A printer meghajtó programja – az előző cikkekben említett lpi/dpi dilemma miatt – még ennél is bonyolultabb viszonyokat produkál.
(15) Itt egy megjegyzés látszik helyénvalónak. A technológia kialakításának tudományos és technikai háttere rendkívül jelentős eredményeket ért el. (Személyes adalék: az adott ismeretanyag birtokában mást nem lehet mondani csak azt, hogy ez tulajdonképpen egy elképesztően nagy teljesítmény.)
(16) Erről a sorozat következő, befejező cikkében lesz szó.
(17) Hordó- vagy párnaalakú torzítások.
(18) Sajnos, ezek részletes tárgyalására ezen a helyen nincs lehetőség.
(19) Az adott transzformáció egy úgynevezett integrál-transzformáció (konvolúció) .
(20) A freeware Image Analyzer program pontosan ezt a területet veszi célba.
(21) Közismert tesztek valószínűsítik, hogy speciális programok lényegesen jobb eredményeket mutatnak fel a képméret változtatása területén, mint pl. a Photoshop.
(22) Ezt a kérdést teszi vizsgálat tárgyává a sorozat következő, befejező cikke.