Szegedy Balázs a 2000-es évek elején kezdett foglalkozni nagy hálózatok matematikai modellezésével.
Az ELTE-n matematikus szakon végeztem, itt is doktoráltam. Ezután sikerült posztdoktori állást kapnom az Egyesült Államokban a Microsoft Research-nél, ahol az akkoriban ott dolgozó Lovász László lett a mentorom. Egyik témánk, a gráflimeszek elmélete arról szól, hogy nagyon nagy struktúrákban egy lényegi komponenst akarunk megfigyelni, meg akarjuk érteni a „rendet a káoszban”. Egész életünkben nagy hálózatokkal vagyunk körülvéve, ilyenek az emberek közti különféle szociális hálózatok, az emberi agyban az idegsejtek hálója vagy az Internet. Arra voltunk kíváncsiak, hogyan lehet ezeket a nagy hálózatokat matematikai módszerekkel jobban megérteni. Később Princetonban dolgoztam, majd a torontói egyetem professzoraként folytattam a kutatásokat, amiket Lovász Lászlóval elkezdtünk.
Tíz éves észak-amerikai kutatói tapasztalattal a háta mögött 2012-ben tért vissza Magyarországra. Úgy tudom, hogy a Magyar Tudományos Akadémia Lendület pályázata hívta haza.
Valóban, ennek a nagyszerű lehetőségnek köszönhetően alapíthattam meg a nagy hálózatok Lendület-kutatócsoportját. Nem sokkal később elnyertem az Európai Kutatási Tanács 2019-ig tartó ERC Consolidator Grant pályázatát is Diszkrét struktúrák limeszei címmel, ennek keretében hasonló témát tanulmányozunk.
Újabb fejlemény, hogy pár éve kiderült, hogy mindez szorosan kapcsolódik a mesterséges intelligencia területéhez, hiszen ott is az a kihívás, hogy nagy, bonyolult struktúrákból hogyan lehet a lényeget kiemelni. Ez inspirálta azt, hogy egy új kutatócsoportot hozzak létre a Rényi Intézetben, amely túllép a gyakorlati alkalmazások és technológiák kutatásán, és a mesterséges intelligencia elméleti alapjait vizsgálja. A lényeglátás matematikáját próbáljuk megtalálni.
Mit ad a lényeglátás matematikája a mesterséges intelligenciához?
A mesterséges intelligencia egy gyűjtőfogalom, sok részből áll és közülük az egyik az úgynevezett mélytanulás (deep learning), ami a neurális hálózatokon alapul. A mesterséges neurális hálózatok fogalma az 1960-as években jelent meg, és ez az elnevezés a biológiai neuronok, azaz idegsejtek agyi hálózatával való párhuzamra utal. Mi itt az Intézetben nem általában a mesterséges intelligenciával foglalkozunk, hanem a mélytanulással, a neurális hálózatok elméletével, ami nagyon jól kezelhető modell olyan értelemben, hogy matematikailag egyszerű a leírása. A modell szépsége mellett rengeteg érdekes matematikai kérdést vet fel, amelyek elsősorban a neurális hálózatok tanításához kötődnek. A neurális hálózatok egy hosszas tanulási folyamaton keresztül nyerik ki környezetükből azt a tudást, amitől hasznossá válnak, ám ez a tanulás rendkívül nehéz feladat. Bár ma már számtalan, a kísérleti tapasztalatokra épülő, sikeres módszer létezik tanulásra, azonban még rengeteg a nyitott kérdés, és a matematikai alapok kidolgozásával és az eddigi eredmények elméleti keretbe foglalásával további nagy fejlődés várható.
Milyen alkalmazások vannak? Mostanában sokat hallani az arc- és képfelismerésről.
A képfelismerésben a nagy áttörés nagyjából 4-5 éve volt, erre büszke is vagyok, mivel a bátyám, Szegedy Krisztián nevéhez fűződik, ő a Google-nál kutató Kaliforniában. A képfelismerő rendszerek most már lényegében emberi szinten tudnak képeket klasszifikálni, azaz meg tudják mondani, hogy mi a kép témája. Ez használható az orvosi diagnosztikában, az arc, a beszéd vagy a kézírás felismeréséhez, vagy éppen műholdképek elemzésénél. Robotikában bármilyen önmagát irányító gépnek látnia kell, és nagyon fontos, hogy értelmezni is tudja, amit lát. Az önvezető autó is kezd valósággá válni. A neurális hálózatokra épülő alkalmazások ma már körülvesznek bennünket — a valóságban, a mobiltelefonunkban és a videojátékokban egyaránt — bár talán nem is tudunk róla.
Tehát egy nagy technológiaváltás zajlik napjainkban.
Nemrég Amerikában tartottam egy előadást a Google-nál a mostani kutatásainkról. Akkor annyi lelkesedéssel és energiával találkoztam, ami azt az érzést váltotta ki bennem, hogy itt egy „új ipari forradalom” zajlik a világban. Aki ezzel foglalkozik, azt majdnem minden érdekli, akár elmélet, akár gyakorlat, egyszerűen azért, mert a verseny nyílt, nem lehet tudni, hogy mi lesz a befutó. Az az izgalmi helyzet, hogy itt most valami változik, és nem tudjuk, hogy mi fog történni, kinyitja az emberek elméjét. Hihetetlenül jó beszélgetéseket folytattam a dolgok filozófiai távlataitól kezdve egészen az elméleti matematika gyakorlati alkalmazásáig ott a Google csúcskutatóival.
Azt gondolom, hogy a mesterséges intelligencia drasztikus társadalmi változásokat fog hozni már pár éven belül. Ez a folyamat rengeteg etikai, morális problémát is fölvet, amire megoldást kell találni.
A nagy amerikai multicégeknél már mindenki érzi a technológia és a tudomány forradalmi változásait és készülnek rá. Magyarország még nem tart itt, pedig nálunk aztán van szürkeállomány, amivel fel kellene zárkóztatni az országot.
Nálunk azonban nem jellemző, hogy a hazai nagy cégek elméleti kutatásokat is támogassanak.
Igen, de ha itthon sikert érünk el a mesterséges intelligenciában az alapkutatásban, valószínű, hogy az nagyon gyorsan fog átkerülni a gyakorlatba. Bár a cégek ezt nálunk nem tudják finanszírozni, szerencsére az akadémiai intézetekben egyre több lehetőség van a témához kapcsolódó elméleti munkára. Minden remény megvan arra, hogy ne maradjunk le a világ élvonalától.
Miben volt más például a Microsoftnál alapkutatásokat folytatni?
Érdekes volt, talán furcsa is, hogy egy annyira gyakorlati cég, mint a Microsoft, több különböző elméleti kutatást is támogat, de mégsem az volt a hangulata, mint amikor az ember egy egyetemen vagy egy akadémiai intézetben dolgozik. Annak ellenére, hogy folyamatosan elméleti dolgokról gondolkodtunk, éreztük azt a (jó értelemben vett) vállalati hangulatot, hogy mik az igényei az iparnak. Néha megkeresték az elméleti csoportunkat gyakorlati kérdésekkel, és akkor segítettünk konkrét gyakorlati problémákban. Nekem ez inspiráló volt, hogy annak ellenére, hogy elméleti matematikával foglalkoztunk, mégsem egy elefántcsont-toronyban voltunk elzárva az emberektől, hanem folyamatos kommunikációt folytattunk. A microsoftos két év szemléletformáló volt a számomra.
Ez a fiatalos szemlélet itthon is eredményekre vezetett és a jövőbeni munkáját is megalapozza.
Én elméleti ember vagyok továbbra is, de szeretem látni, hogy van egy folytonosság az elmélet és alkalmazása között, illetve érdekel, hogyan kerül át a kutatás eredménye a gyakorlatba. Itt is ezt a hangulatot szeretném behozni a kutatócsoportomba. Bár elméleti kérdésekkel foglalkozunk, de ismerjük a kapcsolatát a gyakorlattal. Célunk, hogy hidat építsünk a kettő között.
Az interjút készítette: Oláh Vera