Hibrid képalkotás és vizualizáció

Facebook
Nyomtatás

Gépi tanulás alkalmazása Mathematica-val és Pythonnal 

AwangePalanczVolgyesi
Joseph Awange, Béla Paláncz, Lajos Völgyesi: Hybrid Imaging and Visualization Employing Machine Learning with MathematicaPythonSpringer Nature Switzerland AG 2020

A számítógépes látás alapfeladata, hogy képekből valamilyen szempontok szerint releváns információt nyerjünk ki, például: található-e adott típusú objektum a képen, és ha igen, hol; mely pixelek tartoznak egy adott objektumhoz; a képen szereplő objektumok milyen nagyobb osztályokba, kategóriákba sorolhatók; vagy melyek egy kép fő jellegzetességei. A könyvben a szerzők a számítógépes látást gépi tanulási problémákként fogják fel; mivel pedig a gépi tanulásra statisztikai technikák alkalmazásaként gondolnak, ezért feltételezik a valószínűségszámítás alapvető elemeinek, jelöléseinek ismeretét.  A szerzők szerint a tématerület könyvei általában két csoportra oszthatók: vagy főként elméleteket és tételeket tárgyalnak, vagy konkrét programozási gyakorlatokat. Jelen könyvüket ezért hiánypótló műnek szánják, amely mindkét megközelítést ötvözi.

A könyv öt fejezetből áll: dimenziócsökkentés, osztályozási módszerek, clustering technikák, regressziós technikák, illetve neurális hálózatok alkalmazása a számítógépes látásban. Minden fejezet számos módszert mutat be ugyan­an­nak a problématípusnak a kezelésére. Az 1. fejezet például különféle (adatvesztéses) tömörítésekkel foglalkozik, többek között főkomponens-analízissel, szingulárisérték-felbontással, függetlenkomponens-analízissel, diszkrét Fourier-transzformációval, diszkrét wavelet-transzformációval, vagy fixponttételeken alapuló módszerekkel. Az egyes alfejezetek egy-egy nagyon rövid (általában 1-2 bekezdésnyi) elméleti összefoglalóval indulnak (nincs tehát részletes kifejtés vagy magyarázat), amit konkrét példák és programkódok ismertetése és részenkénti magyarázata követ. A szerzők hibrid programozási környezetet használnak: a programkódokat alapvetően Wolfram-nyelven (Mathematica-ban) írták, amikbe természetes módon ágyazhatók Python-kódrészletek (a Mathematica-ból a Python közvetlenül futtatható). A szerzők feltételezik, hogy az olvasó eleve ismeri ezt a két szoftvert. A bemenetet és kimenetet a \(\Rightarrow\) és \(\Leftarrow\) szimbólumok jelzik (ezeket a jelöléseket a könyv elején esetleg lehetett volna definiálni). A programkódok, bemenő adatok, képek és a programok kimenetei általában teljes terjedelmükben szerepelnek – a 419 oldalból az angol nyelvű szöveg így viszonylag csak kis részt foglal el. Emiatt a hagyományos papíralapú, vagy PDF-alapú könyvformátumot kevésbé érzem hasznosnak: a könyvbeli információ interaktív dokumentumként (például interaktív Mathematica notebook formájában) lenne legkönnyebben használható. A fejezetek végén az aktuálisan tárgyalt módszereket összehasonlítják egymással, és gyakorlati szempontokból is elemzik őket. Az egyes fejezetek tehát összképet, tételes felsorolást adnak a lehetséges módszerekről és egymáshoz való viszonyukról – kedvcsinálóul azok számára, akik a további részletekről a (fejezeteket külön-külön lezáró) irodalomjegyzék alapján tájékozódnának.

Lóczi Lajos
ELTE IK Numerikus Analízis Tanszék és BME TTK Differenciálegyenletek Tanszék

A rovat ajánlott cikkei
Vegyészekhez beépített kiküldött tu­dó­sí­tónk (korábbi, az ajánlott irodalomban feltüntetett írásai nyomdokain) újfent kincset talált, amit szeretne megosztani olvasóinkkal. A jó szívvel ajánlott könyvecske tulajdonképpen egy mese – gyermekeknek, vagy inkább felnőtt, jelenlegi, jövendő és volt kutatóknak a tudományról.
Nemrég jelent meg A rövidítés tudománya – Hatékony gondolkodás a mate­ma­ti­ká­ban és a mindennapi életünkben című könyv. Alapgondolata, hogy a jól megválasztott rövidítés; jelölés, diagram, eljárás vagy definíció egyszerre gyorsítja fel a gondolkodást és teszi lehetővé az összetett problémák átlátható kezelését. A szerző, Marcus du Sautoy neve Magyar­or­szá­gon is ismert: a Park Kiadónál korábban megjelent tőle A prímszámok zenéje (2014) és A kreativitás kódja (2022) – mindkettő közérthető, tudo­mány­nép­sze­rű­sí­tő stílusban.
Fényes Imre (1917–1977) a magyar fizika egyik legendás alakja, ma is hatással van tanítványaira. Ropolyi László és Szegedi Péter most megjelent válogatása bemutatja 50 évvel ezelőtti termo­di­na­mi­kai és kvantummechanikai eredményeit, köztük kapcsolatát Heisenberg vagy éppen Neumann gondolataival.
A lineáris algebra a BME-n összeforrt Wettl Ferenc nevével. Könyvének bevezető gondolata: érthetővé tenni azt, amit sokan örök misztikumként élnek meg. Jóllehet ennek a terjedelmes témának az egyetlen tankönyvbe integrálása szinte lehetetlen vállalkozás volt a szerző részéről, mégis sikeresnek bizonyult, hiszen rövid időn belül már a második kiadására is sor került.
A kecskeméti MATEGYE Alapítvány a 2020-ban megjelent Hibás feladatmegoldások az általános iskolában című könyvének folytatásaként adta ki 2025-ben Orosz Gyula: Hibás feladatmegoldások a középiskolában című munkáját. Mindkét mű rendhagyó módon közelíti meg a matematikai gyakorlást: nem csak az „egyik helyes” útvonalat, azaz a megoldást mutatják be, hanem a tanulók és tanárok számára egyaránt rendkívül értékes hibaanalízist kínálnak...
Hírlevél feliratkozás