Hogyan lettem adattudós?

Hogyan lettem adattudós?

 

Első lépések

Doktorjelölt koromban az Illinois-i Egyetemen, miközben gondolataim a közelgő védés körül forogtak, talán életemben először elkezdtem gondolkodni azon, hogy mi szeretnék lenni. Az előtte levő négy évet boldog, információtól elzárt remeteként éltem, a gondolataim a kutatási témám körül forogtak. Ennél hasznosabb lett volna, ha lépést tartok az aktuális karriertrendekkel, hogy milyen készségeket érdemes elsajátítani, vagy hogy milyen gyakornoki állások vannak. Azonban az előrejutás titka az elindulás, ahogy azt mondani szokták, így komolyan nekiláttam ennek a témának.

Némi Google-keresés után, összevetve az aktuális lehetőségeket és elvárt képességeket az én hátteremmel, természetes módon jutottam el az adattudományhoz. A következőkben újra végigjárom azt az utat, ami jelenlegi állásomhoz vezetett, ahol adattudósként dolgozom, és elmondom a különbségeket az egyetemi kutatás és az ipar között, így, ha ti is hasonló karrierútban gondolkodtok, jobb, ha előre tudtok az előnyökről és hátrányokról.

Mi az adattudomány?

Egy híres Venn-diagram szerint (keressetek rá: „data science Venn diagram”) az adattudós rendelkezik azokkal a készségekkel, amelyek őt a programozás, statisztika és az adott terület megértésének metszetében helyezik el. Olyan emberek, akik megfogják az üzleti problémát, felkutatják a rendelkezésre álló és elérhető adatokat, átfogalmazzák a kérdést technikai feladattá, megtervezik és implementálják a statisztikai és gépi tanulásos algoritmusokat, és végül az eredményt az üzleti ügyfél számára interpretálva előállnak egy, az eredeti kérdésre adott válasszal. Ez úgy hangzik, mintha egy adattudósnak egyszerre kellene statisztikusnak és programozónak lennie, sok év iparági tapasztalattal a háta mögött. Ez azért nem teljesen így van.

A valóság az, hogy az adattudomány egyaránt kiterjed az új, gyorsan fejlődő részterületekre és a specializálódási lehetőségekre. Azok az adattudósok a legkeresettebbek, akik az adattudomány minden aspektusával tisztában vannak, valamint egy-két részterületen specialistának számítanak. Némi felkészüléssel az adattudomány szépen elérhető karriert jelenthet matematika szakos hallgatók számára.

Hogyan lettem adattudós?

Rengeteg online elérhető forrás van, amelyek az adattudóssá váláshoz vezető lehetséges utakról szólnak. Én most egyszerűen a saját tapasztalataimat írom le.

Attól a pillanattól kezdve, hogy rájöttem, el tudnám képzelni magam adattudósként, addig, amíg az első gyakornoki állásomat megtaláltam, 9 hónapot töltöttem neten elérhető ingyenes Python és gépi tanulás kurzusokkal, több tucat jelentkezést küldtem szét, voltam két állásinterjún, csúnyán leszerepeltem az egyiken, de szerencsém volt a másikon, mert az a cég hajlandó volt nekem megadni az esélyt. Ez egy kis San Francisco-i start-up volt, amely nagyvállalati környezetre fejlesztett egy NLP-szoftvert (NLP - Natural Language Processing, azaz természetesnyelv-feldolgozás). Mindössze a saját honlapjukon szerepelt a gyakornoki álláskiírás, én meg nagy merészen közvetlenül a cégalapítónak küldtem el a jelentkezésemet, amelyben legjobb alakításomat adtam elő, hogy miért én lennék a tökéletes jelölt. Ez a jelentkezési mód általában azért nem így működik egy nagyobb cégnél. Start-upoknál azonban minden elképzelhető, és az én esetemben ment minden, mint a karikacsapás.

A három hónapos gyakornoki idő alatt intenzíven tanultam. A technikai hiányosságaim néha elképesztő méreteket öltöttek. Itt azonban jól jött a kutatói múltam. Stresszes helyzetet kezelni anélkül, hogy megbénítana, nos a doktori fokozatért való kitartó küzdelem is erről szól. Nehezebb volt a munkahelyi szociális alkalmazkodás. Mint minden szakmának, ennek is vannak zsargonjai, népszerű és népszerűtlen vélemények, a legújabb és legvitriolosabb blogposztok, mindezeket elektronikusan megosztva egy nyílt terű, ám teljesen csendes irodában. De találtam mentorokat és szövetségeseket, akik segítettek abban, hogy otthon érezzem magam.

Ez a gyakornoki munka csak a kezdete volt az adattudóssá válásomhoz vezető útnak. Még további két évbe és egy sikertelen álláskeresési periódusba telt, mire a jelenlegi helyemre érkeztem.

Miben különbözik az adattudósi lét az egyetemi kutatói világtól?

- Nem vagy többé egyedül

Az egyetemi kutatói lét egyik legnehezebb része a szellemi izoláció. A saját matematikai területemen szervezett konferenciáktól, illetve a témavezetőmmel való konzultációktól eltekintve nem voltak társaim, akikkel gyakori szakmai beszélgetéseket folytathattam volna a saját munkám részleteiről. Ez az iparban nincs így. A kollégáim nemcsak készen állnak arra, hogy bekapcsolódjanak a projektembe, de hasonló jellegű projektekkel rengeteg tapasztalatuk van,  és ezeket örömmel megosztják velem. Ilyen környezetben tanulni exponenciálisan hatékonyabb, mint egyedül.

- A projektek időkerete kisebb

A projektekre fordítható időkeret nagysága cégről cégre változik. Nagyobb cégek általában hosszabb kifutási idejű projekteken dolgoznak. A fejlesztőcsapatoknak tipikusan kisebb időkeretük van a munkájuk természetéből adódóan. A napi tevékenység hatásköre és stratégiai fontossága attól függ, hogy hol dolgozol. Az én esetemben a nagyobb projektek negyedéves időtávúak, a kisebbeknek pedig heti határidejük van. A rövid határidő gyakran segít, mert téged és a menedzseredet is rákényszeríti, hogy pontosan definiáljátok az elérendő célokat és a siker kritériumait is. Másrészt a rövidtávú célok gyakran rövidlátóknak tűnhetnek, ha a csapat prioritásai drasztikusan megváltoznak.

- Nem mindig te döntöd el, hogy min dolgozz

Itt is széles a spektrum. Olyan cégek, mint például az Apple, stratégiai célokat és hosszú távú víziót tűznek ki, majd ezeket a célokat felülről haladva lebontják részfeladatokra. Az alulról felfelé építkező cégeknél, mint például a Facebooknál, inkább a vállalkozói szemléletet részesítik előnyben. A legtöbb cég a kettő között van, azaz valamilyen mértékben te vagy felelős azért, amin dolgozni kell. Az én csapatom negyedéves célokat és projektterveket állított össze, amiket együtt átbeszéltünk, hogy biztosak legyünk abban, hogy ezek a javaslatok a cég céljaival azonos irányba mutatnak.

- Több erőforrásod van

Doktoranduszként a legfőbb erőforrás, amivel gazdálkodhattam, a saját időm volt, így hozzászoktam, hogy a feladataimat magam oldom meg. Azonban egy csapat tagjaként a cél egy feladat jó megoldása a lehető leghatékonyabb módon. Mindent egyedül csinálni nem hatékony. Segítséget kérni nemcsak ajánlott, de el is várják tőled.

- Jobb valamit lezárni, mint a tökéletességig csiszolni

A legtöbb kutatói háttérrel rendelkező embernek ez egy teljesen új dolog: mérlegelni az ár-érték arányt azzal kapcsolatban, hogy egy munkát gyorsan vagy tökéletesen csinálunk meg. Az iparban napi szinten kell ilyen döntéseket hozni.

Záró gondolatok

Egy adattudós képesítései és a projektek, amiken dolgozik, eléggé különböznek egy kutató matematikusétól, ugyanakkor a tényleges munka elég hasonló természetű. Egy adattudós idejének jelentős részét azzal tölti, hogy egy homályosan definiált problémát újra és újra átdefiniál, amíg az egyértelművé válik, és amit aztán meg lehet oldani.

Amikor valamilyen érdekes összefüggésre bukkanunk, nagyon fontos ennek kommunikálása a végfelhasználó felé.

Egy történet felépítése egy összetett probléma köré, adatokkal való alátámasztása, majd az eredmények tálalása egy konkrét ajánlással az ügyfél felé, ezek mind-mind központi elemei ennek a munkakörnek. Ebből a szempontból az egyetemi matematika, statisztika és operációkutatás kurzusok erős alapokat jelentenek, ha az adattudomány felé szeretnétek mozdulni. Sok szerencsét a karrierváltáshoz és az álláskereséshez!

E cikk megírásakor Bolor Turmunkh addattudósként dolgozott Chicagóban. Azóta Cupertinóba költözött, ahol az Apple-nél a gépi tanulás mérnök menedzsere. Ez az írás eredetileg a BIG Math Network honlapján jelent meg, a Notices of AMS 2022. áprilisi számában engedéllyel újraközölték. Az Érintőben megjelenő magyar fordítást az AMS engedélyezte.

Fordította: Kurics Tamás

Bolor Turkmunkh: How I Became a Data Scientist, Notices of AMS Vol. 69. No.4. (April 2022) p. 570-571. ©2022 American Mathematical Society 

https://www.ams.org/journals/notices/202204/rnoti-p570.pdf

Illusztráció: 2216928 © Juan Fuertes | Dreamstime.com