AZ „ÉLES LÁTÁS” MATEMATIKAI HÁTTERE
Első rész
Elöljáróban
Az általános technikai ismeretszint a gyorsan fejlődő, a bináris technológiákra épülő látványregisztráló, látványgeneráló területen sajnos eléggé kérdéses. Különösen feltűnő a kialakult hardver hierarchia megújítására, vagy ezzel ellentétben ennek konzerválására irányuló, marketing célzatú gyártói-kereskedelmi szlogenek – megapixel, optikai zoom, kijelzőméret, Live CCD, Super CCD és egyéb hardver paraméterekre utaló – hangsúlyozott szerepe. A numerikus háttér meg, mintha gyakorlatilag semmiféle jelentőséggel nem rendelkezne. Ennek a ténynek egyik oka tulajdonképpen az ismeretterjesztő réteg tevékenységében keresendő – erről részletesebben majd a cikk végén ejtünk szót.
Másfelől, az általánosan uralkodó bizonytalanságok egyik jellegzetes, könnyen azonosítható tendenciája a nem közvetlenül marketing célzatú megnyilvánulásoknak az ezüst alapú, „analóg” fotográfiának nevezett folyamatnak és a „digitális” technológiának az összehasonlítgatása, majdnem évszázados technikai jellemzők alapján. Ennek a cikknek nem célja ezeknek a tendenciáknak az analízise. Itt csak két jellegzetes pont megemlítése látszik célravezetőnek. Az egyik, talán poétikusnak tekinthető dolog az, hogy az ezüstalapú fotográfia esetén az érzékelő rendszer egy definíció szerinti digitális érzékelő rendszer, mert az ezüsthalogenid kristályoknak csak két lehetséges kimeneti állapota van: vagy ezüstkristállyá alakulnak át, vagy kioldódnak az emulzióból. Következésképpen ez a regisztrációs folyamat egy tisztán bináris állapotokra épülő rendszerre alapozott módszer. Ezzel szemben a „digitális” fotográfia a fotonáram intenzitását tisztán analóg módon rögzíti. A mért értékek csak egy későbbi lépésben transzformálódnak bináris formára.
Ennél lényegesebb azonban egy, a megelőző cikkekben definiált „technológiai konzervativizmusra”1 visszavezethető tendencia. Gyakran fordul elő, hogy a két rendszer az érzékenység, színhűség, átfogás, felbontás (részletgazdagság), jel–zaj viszony alapján kerül összehasonlításra „felcserélhető sorrendben”. Nincs értelme a dolgot tovább elemezni, elég egyetlen példát felhozni.
Az előző oldalon látható kép2 alapján – amelyik egy tetőterasz műholdas képét mutatja – a kérdés eldöntöttnek tekinthető. A kb. 680 km magasságból készített felvételen3 a napelem strukturális elemei (még a 15 mm méretűek is) és az alaplapok közötti rések (még keskenyebbek, szélességük kb. 6–8 mm)4 egyértelműen azonosíthatóak. Feltéve, hogy a kép egy ebben a magasságban keringő Linhof Technicával készült 1 méteres gyújtótávolságú objektívvel, a film síkjában a leképezett vonalak szélessége a nanométeres tartományba esik. Ezek látható visszaadása nyilvánvalóan lehetetlen csupán optikai, kémiai úton. Erre az egyetlen lehetőséget a háttérben működő tudományos, numerikus tevékenység teremti meg – ami ennek a cikknek a tárgya, természetesen a gyakorló fotográfus által kijelölt mélységig. Különben is, eltekintve attól a ténytől, hogy egy ilyen magasságban keringő Linhofban a filmcsere időt rabló akció, az előhívás után a negatívot rögtön digitalizálni kell a szükséges korrekciók igényei miatt.
Másfelől viszont látni kell azt is, hogy egy jó nevű riporter valószínűleg nem akar egy műholddal a kezében részletgazdag háborús képeket készíteni.
Azt kell észrevenni, korábbi szakmai gondolkodásunkat ennek megfelelően felülbírálva és megváltoztatva magunkban tudatosítani, hogy itt elveiben és gyakorlatában alapvetően különböző rendszerekről van szó egy egyre szűkülő átfedési területtel. A nyilvános szférában működő vizuális csatornákban a digitális technológia döntő jelentőségű, így az ezüstalapú fotográfia tulajdonképpen (már csak) a kiállítási és szalonfotográfia egy részében, illetve a privát emlékfotográfia egyre szűkülő területén játszik szerepet. Ez persze nem értékítélet vagy sorrendiségbeli kijelentés; egyes egyedül a lényegi eltérésekre utal.
Az alapvető technológiai különbség az, hogy az ezüstalapú fotográfia egy regisztrációs folyamat, ahol a befolyásolási lehetőség lényegében az adott lépésre korlátozódik. Ezzel szemben a digitális fotográfia egy globális jelfeldolgozási folyamat, amelyben például az objektív optikai hibáit a nyomtatás előtti fázisban is lehet korrigálni. Ezek a jellemzők egyben kijelölik a használhatóság területeit is.
A személyes választástól függetlenül nem szabad elfelejteni, hogy mindkét technológia komoly intellektuális értékeket teremtő lehetőség. A klasszikus terület évszázados bizonyítékokkal rendelkezik. A másik oldalon pedig látni kell, hogy például Kerekes Gábor „eklektikus” tevékenységének egyes projektjei5 nem jöhettek volna létre a jelenlegi trendek megléte nélkül.
Demosaicing
Alapjaiban nézve a dolgot a digitális eljárásban (a zajcsökkentés mellett, ami ebben a cikkben nem kerül vizsgálat alá) tulajdonképpen három igen bonyolult felület (két példa látható erre a kiindulásul szolgáló képrészlettel együtt a mellékelt ábrákon) matematikai manipulációjáról van szó.6
Alapvető fontosságú pont az, hogy az út, amelyik a három alapszínt reprezentáló felületekhez vezet, szintén buktatókkal teli. A Bayer-rendszerű szenzorokban például az érzékelők fele7 a zöld színtartományra, negyede a kék és a fennmaradó negyed a vörös tartományra érzékeny.
Ezért az első lépés ezen az úton az egyes alappontokban hiányzó kék és vörös, illetve zöld értékek meghatározása.8 Eközben különös figyelmet érdemel az a tény, hogy az egyes szenzorok által regisztrált értékek két véletlenszerű összetevőt tartalmaznak. Az egyik a regisztrációs fizikai folyamat véletlenszerűségeit képviseli. Ezek valószínűségi tulajdonságai kellőképpen ismertek, így jelentőségük csökkentése egy méréselméleti és kiértékelési probléma. A másik összetevő kontrollálása sokkal bonyolultabb feladat. Az emberi bőr egyenetlenségei, füves területek fényképei lehetnek jellegzetes példái ennek a problémakörnek. A vizuálisan korrekt visszaadás ma is intenzíven kutatott terület.
A problémakör bonyolultságát jelzi az itt közölt képhármas. Az alapképben egy eredetileg RAW formátumú fájlban regisztrált látvány kis része látható. A RAW fájl két különböző eljárással lett átalakítva tiff formátummá, az utólagos feldolgozási lépések letiltásával.9 Ezután egy matematikai programban10 a képpontokhoz tartozó zöld és kék értékeket leválasztva, a két feldolgozó eljárás által adott eredményeket egymásból kivonva jöttek létre az itt bemutatott felületek. Feltűnő, hogy a határvonalak mentén mekkora különbségek lép(het)nek fel!11
Ennek egyik forrása az a tény, hogy az eltérő színtartományokat regisztráló szenzorok egymáshoz képest egy meghatározott távolságban levő rácson helyezkednek el. (Van két egymáshoz képest eltolt zöldre érzékeny rács. Ezen kívül van egy ezekhez képest eltolt kék rács, valamint egy negyedik, mindháromhoz képest eltolt, vörösre érzékeny detektorok rácsa. A 10 mp gépben a demosaicing előtt van négy, egyetlen színre érzékeny rács. A demosaicing feladata az, hogy 10 mp pontban meghatározza a hiányzó másik két szint. [A Bayer-rendszer esetén!]) Az elengedhetetlen utólagos numerikus képfeldolgozás viszont a színértékeket azonos pontokból álló rácson követeli meg. Ennek elérésére kifejlesztett feldolgozási lépések egymástól eltérő matematikai megoldásokat alkalmaznak géptípustól, gyártó cégtől stb. függően.
Egy színes fotográfia ebből a szempontból megítélve tulajdonképpen három, egy négyszögletes rácson elhelyezkedő pontokban meghatározott számtáblázat12 öszszessége. Ezek után a képfeldolgozás numerikus akciói három alapvető osztályra oszthatók szét.
1. Ezek egyike az adott számhalmazon a demosaicing által meghatározott pontokban a színértékeket befolyásoló akciók végrehajtása. Ilyenek például a különböző tónusváltoztató szűrök. A képmanipulációs programok nagy számban tartalmaznak ilyen pluginokat. Kontraszt befolyásoló, elszínező stb. szűrök adhatnak példát erre. Megjegyzendő azonban, hogy az egyszerű élességbefolyásoló eljárások is ebbe az osztályba tartoznak. Sajnos igen sok numerikus torzulásokkal (haló, lokális színváltozások, aliasing és még egyéb problémák). Az alábbiakban tárgyalandó módszerek is ide sorolhatóak. Az új értékek meghatározása a lokális kontraszt értékek egyszerű változtatása helyett bonyolult numerikus akciókon alapul.
2. A számtáblázat méreteit változtató lépések: az újraméretezés (méretcsökkentés, pixelszámnövelés stb.), ami a cikk második felének a témája lesz. Ez általában szomszédos pontok átlagolását, vagy szomszédos pontok közötti értékek meghatározását13 és egy, eddig a pontig a kiindulási számtáblázat új elemében felvett értékek kijelölését jelenti.
3. A táblázat pontjainak geometriai transzformációja. Ilyen akció például a perspektíva korrekció, az optikai leképezés geometriai hibáinak korrekciója, hordó- vagy párnaalakú hibák megszüntetése stb. Ebben az esetben a kiindulási alappontokhoz geometriai koordinátákat rendel a folyamat (megjegyzendő, hogy erre az előző két esetben semmi szükség sincs!). Ezután a transzformáció következtében kialakuló új koordináta értékeket kell a régi koordinátákhoz tartozó alappontokra vetíteni, és ez alapján az adott pontokban szereplő új értékeket meghatározni. Sokszor fordul elő, hogy a transzformált koordináták az eredeti pontok által kijelölt helyek közé esnek. Ebben az esetben az új értékek meghatározása a második pontban említettek fordítottja. Ekkor nem a köztes pontban nem ismert értékeket kell származtatni, hanem a köztes pontokban uralkodó értékek alapján kell az eredeti rácspontokban definiálandó új értékeket meghatározni.
Optikai alapok, a tetőteraszrejtély megoldása
A hatékony élesség és színérték befolyásolási folyamatokban kap rendkívüli jelentőséget a fotográfiai optika mint a leképezési folyamatot leíró tudomány. Így például a népszerűsítő, sok esetben a marketing indíttatású ismeretterjesztés (gyártmánykatalógusok, tesztek) által előszeretettel idézett MTF (moduláció átviteli függvény) és az ezzel transzformációs kapcsolatban álló függvény az OTF (optikai átviteli függvény) szerepe ezen a ponton alapvető jelentőségű.14, 15 Az adott megközelítésnek az alapjait tulajdonképpen egy közvetlenül merhető függvény, az ún. PSF (Point Spread Function, azaz egy pontszerű fényforrásnak a leképezési hibák következtében kiterjedt, sokszor bonyolult fényességeloszlású optikai képe) függvény szolgáltatja. Ennek ismeretében, a megfelelő numerikus operációk után sokszor meglepő eredményeket lehet elérni. Az életlen képek visszaállítási lehetőségeire álljanak itt két eltérő kísérlet eredményei. A tudományos célokra készült programokban végrehajtott numerikus akciók előtti és utáni képek16 jól mutatják, hogy a lehetőségek igen messzire nyúlnak. Ezek az eredmények példát szolgáltatnak arra,, hogy tulajdonképpen az Adobe Photoshop nem az egyetlen lehetséges eszköz az ilyen irányú korrekciók végrehajtására. A tudományos célú programok sokkal messzebbre jutottak ezen a területen. Tulajdonképpen – amint azt az alábbiak is mutatják – semmiféle technikai akadálya nincs annak, hogy ezek a programok alkalmazásra kerüljenek az általános fotográfiai gyakorlatban.
Az észlelhető élesség befolyásolása az általános fotográfiai gyakorlatban
Megjegyzendő, hogy egy tetszőleges fotográfiai kép által keltett benyomás „élessége” nem pusztán matematikai fogalom, hiszen a megítélés eredménye személyes tényezőktől is függ. Következésképpen nincs olyan módszer, amely minden esetben optimális eredményt nyújtana. Ezt mindenképpen figyelembe kell venni az alábbiak alapján kialakítható döntéseknél.
Ennek következtében két határeset vizsgálata lehet iránymutató. Az egyik szélsőség a sok, véletlenszerű részletet tartalmazó struktúra, a másik vizsgálandó terület pedig a vonalas képszerkezet. Mindkét lehetőség analízise sorra kerül, azzal a már megemlített megjegyzéssel, hogy az általánosan ismert és gyakorolt lehetőségek nem kapnak a továbbiakban különleges figyelmet. Az észlelhető élesség befolyásolása egyrészt a határvonalak mentén elhelyezkedő képpontok színösszetevőinek, illetve a részletek gazdagsága esetén a lokális kontraszt változtatását jelenti kismértékű korrekciók esetén. Az Adobe által is tömegesített eljárások (high pass filtering, unsharp mask stb.) tulajdonképpen csak ilyen esetekben vezetnek elfogadható eredményre. Azonban a következőkben tárgyalandó eljárások még ezekben az esetekben is lényegesen célravezetőbbnek tűnnek.
A „konvolúciós”17 eljárások
Amint az már említésre került, az optikai rendszerek által egy meghatározott látványról regisztrált számszerű értékek a kiindulási szín és tónusértékek, valamint az optikai rendszer leképezési tulajdonságai és hibái egymásra hatásával alakulnak ki. Abban a fizikai képben, amelyben a fény nem csak különböző irányba haladó vonalakként kerül leírásra,18 hanem a hullámtulajdonságok is szerepet kapnak,19 ez az együttműködés kellő pontossággal leírható.
Az előzőekben azonosított két alapvető tényező egymásra hatásának matematikai reprezentációját és numerikus feldolgozási folyamatait nevezik konvolúciónak. Miután a regisztráló rendszer elemei egy szabályos elrendezésű rácson helyezkednek el, ez a matematikai leírás egy kétdimenziós táblázatban elhelyezkedő20 számcsoporttal vezérelhető. A módszer jellegzetessége az, hogy a vezérlő számcsoport segítségével a legkülönbözőbb effektusok skálája rendkívül széles: élességvesztés, élességnövelés (amint azt a mellékelt minta is mutatja, egészen a kontúrig leszűkítő változatig ) érhető el néhány számérték változtatásával. Jelentős hátrány viszont az, hogy a megfelelő számcsoport meghatározása nem teljesen egyszerű dolog, gyakorlatot és háttér ismereteket követel meg.
A „dekonvolúciós” módszerek
A mellékelt ábrákon bemutatott, extrém helyzeteken túl, ez az eljárási kör igen előnyösen alkalmazható az általános fotográfiai gyakorlatban is. Amint az itt közölt képekből is kiderülhet, a vizuálisan eltorzult képek visszaállítása ezen az úton igen széles határok között lehetséges. Ehhez egyetlen kiindulási adatra van szükség. Elegendő pontossággal kell ismerni az alkalmazott optikarendszer PSF függvényét. Ez alapján a megfelelő laboratóriumi és numerikus háttérrel az elérhető eredmények sokszor igen meglepőek, lásd a tetőterasz képét. Itt az optikai, atmoszferikus és egyéb képtorzító tények hatásait többek között dekonvolúciós eljárásokkal csökkentették. Persze a szükséges numerikus lépések nem a PC-k teljesítőképességét követelik meg. Az általános fotográfiai gyakorlatban azonban ez ma már nem akadályozó tényező.
Megjegyzendő, hogy az ezen a szinten alkalmazott fotográfiai objektívek PSF függvényei – az adott kismértékű korrekciós igények miatt – néhány, könnyen választható osztályba sorolhatók. Az ilyen szolgáltatásokat nyújtó pluginok ezeket az osztályokat és a megfelelő vezérlő paramétereket21 könnyen meghatározható és befolyásolható módon mutatják az alkalmazó számára.
Az is természetes, hogy a különböző kiindulási helyzetekre különböző matematikai eljárásokat fejlesztettek ki a dekonvolúciós lépés végrehajtására. Például az elmozdulásos életlenség esetén az ún. Wiener algoritmus, míg az élességállítási hibák következtében fellepő minőségromlás javítására a Lucy–Rosenthal algoritmus alkalmazható előnyösen, legalábbis az ebben a cikkben vizsgált körülmények között. Az ilyen szolgáltatásokat nyújtó pluginok többek között ezt a két algoritmust is tartalmazzák. Egy adott helyzetben azonban – az elérni kívánt vizuális eredménytől függően – egyéb, rendelkezésre álló algoritmusok alkalmazandók a személyes választás alapján.
Megjegyzendő, hogy a PSF ismeretének hiánya sem végzetes akadály. Vannak pluginok, amelyek a hosszadalmasabb, de éppen ilyen eredményes eljárást, az ún. blind deconvolutiont („vak dekonvolúció”) alkalmazzák, amelyik magába foglalja az adott helyzetben figyelembe veendő PSF osztály és PSF paraméterek iteratív meghatározását is.
Az élességnek a „wavelet” osztályra alapozott befolyásolása
Remélhetőleg az eddigiekből már kiderült, hogy az optikai leképezés fizikai alapjai igen fontos szerepet játszanak a korrekciós lépések végrehajtásában. Így például a sokszor emlegetett MTF (modulációátviteli függvény) bizonyos definíciós nehézségekkel küszködik,22 ami egyes fizikai alkalmazásokban vezethet problémákhoz.
Ezért került sor egy eltérő tulajdonságokkal rendelkező, hullámszerű függvényosztály kifejlesztésére, amelyet wavelet23 függvényeknek neveztek el. Az alkalmazások folyamán kiderült, hogy ezek a függvények igen előnyösen alkalmazhatók bonyolult, véletlenszerű felületek leírására. Az ilyen típusú felületekre igen meggyőző példákat szolgáltatnak az ebben a cikkben is bemutatott színösszetevő (RGB) felületek. Mi sem természetesebb dolog, mint ezeket a felületeket a wavelet osztályba tartozó matematikai objektumokkal közelíteni. Ez a módszer – amint azt a mellékelt korrekciós példák is mutatják – két igen jelentős előnnyel jár.
A különböző frekvenciákkal azonosítható függvények relatív súlyának változtatásával a látszólagos élességet lehet befolyásolni. Ez a módszer, amint azt az itt közölt ábrák is mutatják, igen előnyösen alkalmazható a sok, véletlenszerű elemet tartalmazó képek által kialakított vizuális benyomás változtatására. A példákból az is következik, hogy a vonalas képeket ezzel szemben a dekonvolúciós eljárásokkal célszerű átalakítani.
Van azonban ennek a reprezentálási módszernek és az ezzel kapcsolatos műveleteknek egy más területekre vezető következménye is. A wavelet függvényosztály ugyanis előnyösen alkalmazható a fotográfiai zaj csökkentésére is.
Az ismeretterjesztés problémái
Nem kétséges, hogy a felvétel pillanatától a látható kép megjelenéséhez vezető akciók háttér ismeretanyaga és logikai struktúrája alapvetően átalakult a digitális fényképezés megjelenésével. A primer tevékenységek helyett – hőmérők figyelése, nagyítóobjektívek alatti lapocskák mozgatása és folyadékok kavargatása – kevésbé direkt, komplex numerikus részfolyamatok célszerű megválasztása alapvető fontosságú. Miután az ebben a kétrészes cikkben tárgyalt, illetve tárgyalandó akciók a teljes numerikus háttér alapjait képezik, néhány általános megjegyzés látszik helyénvalónak.
A megkívánt háttér ismeretanyag meszsze esik a jelenlegi, általánosan uralkodó gyakorlattól. Következésképpen az ismeretterjesztés szerepe ebben a helyzetbe alapvető fontosságú lenne. Például a gyakorló fotográfusok felé egyértelműen és megbízhatóan kellene a nagy intenzitással keletkező új ismereteket és ezek összefüggéseit közvetíteni. Nyilvánvaló, hogy a gyakorló fotográfusnak nem kell részleteiben és alapjaiban értenie a felmerülő statisztikai és numerikus problémákat. Az is nyilvánvaló azonban, hogy a fotográfusoknak abban a helyzetben kell lenniük, amely lehetővé teszi a kívánt vizuális benyomások kialakításához vezető út megbízható és optimális kiválasztását.
Ez a követelmény alapvetően meghatározza a közvetítő réteg feladatait is. A kívánalmak természetes következménye tulajdonképpen a megfelelő mélységű méréstechnikai, matematikai és numerikus ismeretek birtoklása egy szolid fotográfiai gyakorlat mellett. Hiszen a technikai lehetőségek fejlődése egyben a vizuális lehetőségek kiterjedését is jelenti. Elég csak a filmiparnak a numerikus háttér fejlődése következtében bekövetkezett változásaira utalni.
Sajnos az egyik oldalról tehát jelen van egy közvetítő réteg, amelyik kérdéses, hogy rendelkezik-e a megkívánt ismereti háttérrel, másfelől pedig a megváltozott információterjesztési lehetőségek között jelen van egy gyakorló réteg, amelyiknek egyértelműen megbízható információra van szüksége.
Ezért érdemes néhány, sokszor idézett – vagy esetleg referencia nélkül felhasznált – ismeretszerzési forrás szerepét elemezni. Teljesen nyilvánvaló, hogy a gyártó cégek prospektusai alapvetően marketing célokat szolgálnak. Ennek a ténynek az a következménye, hogy az adott területen lényeges szerepet játszó ismeretanyag szelektív módon, az eladni kívánt dolog szempontjából előnyös beállításban kerül bemutatásra. Ez ugyan morális szempontból nem tekinthető elvetendőnek, azonban a felvevő oldalon megköveteli az objektív, megbízható kritikai képesség meglétét.
Egy másik intenzíven alkalmazott forrás maga a web, ahol sokkal lényegesebb problémákba ütközhet az érdeklődő személy.
A kontroll nélküli közlési mód korlátok nélküli lehetőséget nyújt esetenként a megbízhatatlan, egyes esetekben félreinterpretált „tények” közlésére. Jellegzetes példa lehet erre egy, a Zeiss cég egyik honlapján található cikk.24 Ebben például használják a „film MTF” függvényének fogalmát – ez a dolog tudományos szempontból vizsgálva megengedhetetlen egyszerűsítés. A kijelentést alátámasztó érvek – bonyolultságuk miatt – lábjegyzetben találhatók.25 Itt csak az álljon, hogy a film nem leképező, hanem regisztrációs közeg. Az optikai rendszer egy fényeloszlást (a tárgyoldali fényeloszlást) egy másik fényeloszlásra képezi le (a képoldalira). Ez a leképezett fénytér ezután a legkülönbözőbb módon mérhető és interpretálható. Ezzel szemben a regisztrációs közeg – a film – a bemeneti fényeloszlást egy fémkristály eloszlásra képezi le: a mérhető denzitáseloszlásra. Ez pedig rendkívül komplex kapcsolatban van a mérni kívánt bemeneti jellel.
Miután a mérési folyamat az előhívás, az expozíciós szint, a mérési körülmények idején uralkodó fényeloszlás, valamint a regisztrálandó jelet létrehozó berendezések miatt erőteljesen körülmény függőek (például az optikai MTF méréskor alkalmazott szinuszos fényeloszlás imitálása stb.), az „eredmények” ezért szintén igen esetlegesek: azaz a végeredmény gyakorlati jelentősége erőteljesen korlátozott. Erre mutat például az idézett cikkben látható, a bemeneti jel kontrasztját növelő vonalsűrűségi tartomány is. Ha egy ilyen eredmény fellép a mérési körülmények között, a folyamat tulajdonképpen nem jelátviteli, hanem jelmanipulációs folyamat. Ez persze alapvetően ellenkezik az MTF függvény definíciójában foglaltakkal. Nem véletlen, hogy pl. a NASA és más, mértékadó intézmények számára jelenleg inkább az úgynevezett TMC (Threshold Modulation Curve – küszöb moduláció-érzékenységi görbe) az észlelhető részletek (felbontás) vizsgálati alapja.
Nem váratlan ezért a következő két kérdés. Hogyan lehet az, hogy még egy ilyen cég is megengedi magának ezt a vulgarizáló lépést? Lehet, hogy azért, mert tudják, hogy a célcsoport háttérismereti színvonala hiányos?
Montvai Attila
Képaláírások:
1., A szövegben említett, egy tetőteraszról készült műholdas fotó
(Forrás: Google Earth, valószínűleg IKONOS fotó)
2., A lényegében vonalas szerkezetű, kiterjedt felületeket felmutató kép, mint az esetleges másik hátéreset képviselője a vizsgálatok során (Graffiti)
3., A demosaicing eljárások eltéréseinek vizsgálatára szolgáló képrészlet. Szintén egy graffiti fotójának részlete
4., A graffiti kép részletének ,,elmozdulásos életlenséggel” eltorzított formája
5., Az elmozdulásos életlenség korrekciója az ún. Wiener kernellel dolgozó dekonvolúciós eljárással (Mathworks Matlab). Megjegyzendő, hogy a gyakorlati fotográfiában az ehhez hasonló eredmény elérése jelentős előkészületeket kíván meg
6., A graffiti kép 750x750 pixel nagyságú részlete. Az általában követett eljárás az volt, hogy az alapkép egy meghatározott felvételi hibát szimuláló eljárással eltorzítva, az utólagos kép-javítási folyamat kiindulási pontjaként került felhasználásra. Így lehetőség nyílik a korrekció eredményességének megítélésére
7., A szövegben említett demosaicing módszerekkel kapott kép egy 200 x 200 pixeles részletében fellépő, a kék színtartalomban különbséget mutató grafikon. Figyelmet érdemel a határvonalakon észlelhető differenciák mértéke (PTC Mathcad)
8., A demosaicing után a graffiti részletkép kék színtartalmát mutató felület. (8 bit per képpont, PTC Mathcad). A három színfelület alapján valószínűleg nyilvánvalóak az élesítési és képátméretezési akciókban fellépő nehézségek
9., A demosaicing után a graffiti részletkép zöld színtartalmát mutató felület (8 bit per képpont, PTC Mathcad)
10., A demosaicing után a graffiti részletkép vörös színtartalmát mutató felület (8 bit per képpont, PTC Mathcad)
11., A konvolúciós élességnövelési eljárások extrém határokig fokozott változatában elért eredmény a graffiti képrészlet esetén kapott eredmény (PTC Mathcad)
12., A sok véletlenszerű részletet tartalmazó kép a vizsgálat kiindulópontja
13., Az élességbeállítási problémák korrekciója a Tikhonov-Golub-Kahan kernellel. Figyelemre méltó az eredeti élesség majdnem tökéletes visszaállítása (Wolfram Research Mathematica)
14., A Rosenthal-Lucy dekonvolúciós algoritmus bemutatására szolgáló kiindulási képrészlet. Ebben az esetben a pluginok vizsgálatára szolgáló képnél nagyobb mértékű életlenség van jelen
15., Az élességi állítási hibák és optikai aszimmetriák korrekciójára szolgáló Rosenthal-Lucy kernel hatása. Történeti érdekesség, hogy ez az algoritmus a Hubble űrbeli teleszkóp optikai rendszerének hibái miatt fellépő vizuális degradáció korrekciójára lett kifejlesztve és eredményesen alkalmazva. A képszélen fellépő vonalrendszer egyszerűen kiküszöbölhető a képszélek kiterjesztésével (Mathworks Matlab)
16., Az alapkép egy 750x750 pixeles részlete. Az alsó sarokban látható kinagyított apró részkép a kiindulási fotó 4x felnagyított darabja. Ez a kiindulási kép, az adott esetekben használt korrekció eredményessége e kép alapján ítélhető meg
17., Az általánosan használt eljárások, pluginok tesztelésére használt kiindulási kép. Itt kisebb mértékű minőségromlás a kiindulási pont. A Rosenthal-Lucy eljárás hatásának vizsgálatát kivéve ez a kép szolgált a korrekciós akciók kiindulási pontjaként
18., Az Adobe rendszerben – és egyéb kompatibilis programokban – széles körben alkalmazott ,,high pass” élességnövelési módszer teljesítőképességét illusztráló
kép
19., Az Adobe csomagban működő pluginok is lehetővé teszik a dekonvolúciós módszerek egyes változatainak alkalmazását. Ez a korrekció az un. Maximum Entropy algoritmusra épül (Adobe CS4 plugin)
20., Az élességállítási hibák wavelet élesítési módszerrel korrigált képe. Figyelemreméltó a ,,klasszikus” eljárásokhoz képest elérhető élességnövekedés (Adobe CS4, wavelet plugin)
Jegyzetek:
1 Montvai Attila írásai a Fotóművészet 2009-es és 2010-es számaiban.
2 Google Earth
3 Valószínűleg IKONOS fotó.
4 A méretek megbízhatóak, mert a szerző házának tetőteraszáról van szó.
5 Kerekes Gábor: Over Roswell 1,2.
6 Megjegyzendő, hogy a matematikai korrektség nem minden esetben egyezik meg a vizuálisan érzékelhető korrektséggel! Ez egy olyan tényező, amelyik meglehetősen elbonyolítja a helyzetet.
7 A Bayer-rendszer természetesen nem korlátozódik erre a felosztásra. Van CMY rendszer Bayer és még számos változat, pl. a pankromatikus CCD.
8 Ennek a lépésnek az angol neve: demosaicing.
9 Adobe Camera Raw és Bibble RAW.
10 Ebben a cikkben a következő matematikai programok kerültek alkalmazásra: PTC MathCad, Wolfram Mathematica és Mathworks Matlab.
11 A határvonalak problémája a későbbiekben még terítékre kerül.
12 Más néven három, kétdimenziós mátrix, melyek három kétdimenziós felület pontjait képviselik.
13 Interpoláció.
14 Itt kell megjegyezni, hogy a gyártók és „független” tesztelők által előszeretettel prezentált, vonalábrák alapján „mért” és MTF-nek hívott függvény tulajdonképpen félreértelmezés. Majdnem százéves vonalpár felbontási ábráknak a tudomány látszatát keltő átnevezéséról van csak szó. Az MTF ugyanis egy kétdimenziós, a leképező rendszer optikai tulajdonságaitól függő, komplex értékű függvény kontinuum. A képzetes rész csak speciális, trigonometrikus függvényekkel megadott fényesség eloszlású bemeneti jel esetén egyenlő nullával. A vonalábrák meg egyáltalán nem hasonlítanak a szinusz, vagy a koszinusz függvényre.
15 Az MTF mizéria egy tipikus esete a megfelelő kritikával, amelyik a WEB -en is megtalálható: „… except for one detail: MTF isn’t 100% at low spatial frequencies. This is an error – perhaps the work of an overly creative marketing department.”
16 A matematikai nevén a Wiener (az elmozdulásoskép) és a Lucy-Richardson (az életlen kép) deconvolution alkalmazásáról van szó.
17 A felmerülő fogalmakat a következőkben csak egy meghatározott mélységig fejtem ki.
18 Ez az ún. Geometriai optika.
19 Fizikai optika.
20 Ún. mátrixokkal lehetséges.
21 A paraméterek tulajdonképpen a PSF-nek a leképezési síkban mutatott geometriai értékét és a szükséges iterációk számát adják meg.
22 A definíció a végtelen hosszúságú, periodikus függvényekre alapozott transzformációt, az ún. Fourier transzformációt foglalja magába.
23 Wave – a hullám angolul.
24 A cikk egyik ábrája hasonlatosságot mutat egy, a Digi-Trend 10 cikkben közölt ábrával, amelyik az objektív és a film MTF függvény együttes hatásait mutatja.
25 Az MTF transzformációs (Fourier transzformáció) kapcsolatban áll a PSF függvénnyel, azaz a pontszerű fényforrásnak a leképezési hibák következtében kialakuló képével. Egy lehetséges másik egzakt, transzformációs út (diszkrét Fourier transzformáció) az ún. LSF (Line Spread Function) függvényre alapozható. A film esetében a direkt kiterjesztése ezeknek az egzakt matematikai eljárásoknak nehézségekbe ütközik, ezért a definíció bizonyos, csak egy restriktív, bemeneti jeleloszlás eseteit próbálják imitálni ebben az esetben. Az eljárás ezért tulajdonképpen semmivel sem mond többet, mint az USAF 1951 ábra fényképezgetése.