Bevezetés
Ebben a cikkben egy érdekes sejtést fogunk bemutatni, ami a matematika számos területéről tartalmaz elemeket. A sejtés szerteágazó, ezt jól mutatja, hogy gráftulajdonságok vizsgálata során fogalmazták meg, Boole-függvényeket használ, és a Fourier-analízis eszközeivel vizsgálják. Ezek mind a matematika egy-egy igen széles területét képezik, azonban a sejtés megértéséhez nem kell szakértőnek lenni egyik területen sem.
A számítógép-tudomány megjelenésével a matematikában előtérbe került az irányzat számára fontos területek vizsgálata. Ide tartoznak a bitsorozatokon értelmezett 0-1 értékű függvények (Boole-függvények) is, amelyek például áramkörök tervezésénél játszanak fontos szerepet. Az elméleti matematika segítségével, esetünkben a Fourier-analízis eszközeit használva, igen általános kontextusban is vizsgálhatóak ezek a függvények. Az így elért eredményeket aztán eredményesen tudják alkalmazni a kutatók és a fejlesztők a gyakorlati projektek megvalósításában.
Az entrópia-hatásfüggvény-sejtés ennek a területnek egy máig bizonyítatlan elméleti állítása. A jelentősége többek között abban is rejlik, hogy alsó becslést ad a címben szereplő hatásfüggvénynek nevezett mennyiségre. Ez ugyanis szorosan kapcsolódik az ún. küszöbjelenséghez (threshold phenomena, [4]): Tegyük fel, hogy egy rendszer rendelkezik egy valós paraméterrel és valamilyen esemény valószínűsége ezen paraméter változtatásától monoton módon függ. Gyakran a paraméterskála azon része az érdekes, ahol ez a valószínűség gyorsan változik a paraméter apró módosításától is. Ezeket az intervallumokat hívjuk küszöbintervallumnak. Ilyesfajta vizsgálódások nemcsak a fent említett számítógép-tudomány területén érdekesek, hanem alkalmazzák gazdasági folyamatok elemzésében és a politikatudományban is (lásd: [6]).
Az alábbiakban bemutatunk néhány fogalmat és állítást, amelyek segítségével aztán formába önthetjük az 1995-ben Ehud Friedgut és Gil Kalai által megfogalmazott sejtést. További érdekességként bemutatunk egy eredményt a kérdéskörben arról, hogy véletlen függvényekre a sejtés állítása „nagy valószínűséggel” teljesül.
Jelölések, alapfogalmak
Előzetesen néhány szó a jelölésekről, szóhasználatról. Az alábbiakban Boole-függvényekkel fogunk dolgozni. Ezek az irodalomban több különböző formában szerepelnek, előfordulnak , , és alakban is. Mi a második alakkal foglalkozunk, így ha Boole-függvényről beszélünk, akkor a képhalmaz mindig a halmaz lesz, az alaphalmaz pedig .
Néhány jelölés: Az várható értékén az , míg az és függvények skaláris szorzatán az mennyiséget értjük. Egy halmaz karakterisztikus vektora az az vektor, amelynek az -edik koordinátája akkor és csak akkor , ha , egyébként 0.
A cikkben igyekszünk csak a sejtés megfogalmazásához szükséges definíciók és állítások kimondására szorítkozni. Néhány állítás bizonyítása azonban kellően rövid és megértésükkel jobb betekintés nyerhető a terület gondolatvilágára. Ezeket a bizonyításokat a cikk végén gyűjtöttük össze.
Ahogy már a bevezetőben is említettük, a sejtéshez vezető úton a Fourier-analízis eszközeit fogjuk használni. Ehhez először definiáljuk a területen nagyon fontos szerepet játszó ún. karaktereket a mi speciális alaphalmazunk esetén:
1. definíció. Legyen és legyen ennek a halmaznak a karakterisztikus vektora. Ekkor az -hez tartozó karakter az a függvény lesz, amelyre:
.
A kitevőben -beli vektorok szokásos skaláris szorzását használjuk.
A továbbiakban az alsó indexekben egyaránt használjuk a halmazos és a karakterisztikus vektoros jelölést is, amikor egy halmazhoz tartozó karakterről beszélünk.
Mielőtt rátérnénk a Boole-függvényekre, először általánosabb, valós számokba képező függvényeket fogunk tekinteni. Belátható, hogy a karakterek, ahol befutja az halmazt, ortonormált bázisát adják az függvények alkotta vektortérnek. Azaz minden halmaz esetén , ha , és 0 különben, valamint minden függvény felírható az alábbi módon:
Az értékeket az függvény -hez tartozó Fourier-együtthatóinak nevezik. Az értékek seregét (ahogy végigfut elemein) értelmezhetjük úgy, mint egy függvényt. Ezt a függvényt az Fourier-transzformáltjának nevezik. Hasonlóan a karakterekhez, argumentumába időnként nem a karakterisztikus vektort, hanem a hozzá tartozó halmazt írjuk: , ha az halmaz karakterisztikus vektora.
A következő néhány összefüggés rámutat a Fourier-együtthatók és az függvény kapcsolatára. Az olvasó mind a négy állítást könnyen ellenőrizheti a definíciók alapján.
1. állítás. Igazak a következő egyenlőségek:
(i) ;
(ii) (Plancherel-tétel)
(iii) (Parseval-egyenlőség)
(iv) Boole-függvényekre .
Hatásfüggvény, entrópia
Térjünk rá most kifejezetten a Boole-függvényekre, azon belül is a hatásfüggvény definíciójára. Legyen tehát adva egy leképezés. Kérdés: mennyire függ a függvény értéke az -edik argumentumtól? Azaz, ha megváltoztatjuk az argumentum -edik koordinátáját, változik-e a függvény értéke? esetén jelölje ezt a változást, ahol a felülvonás jelenti azt, hogy az -edik koordinátáját az ellenkezőjére változtatjuk.
2. definíció. Az -edik változó hatásfüggvényének az
valószínűséget, míg teljes hatásfüggvényének az
értéket nevezzük.
E definíció egy ügyes átfogalmazásával és némi számolással meg lehet mutatni, hogy az így definiált hatásfüggvény felírható pusztán a Fourier-együtthatók segítségével:
2. állítás.
Ebből az összefüggésből, az összegzések némi átrendezésével, a teljes hatásfüggvényre nézve a következő adódik:
3. állítás.
Most térjünk át a címben is megjelenő másik fogalom, a Shannon-entrópia tárgyalására. Ez a fogalom számos más kontextusban is felbukkan a matematikában, de mindenhol hasonló jelentéssel (és definícióval) rendelkezik. A mi Boole-függvényekkel kapcsolatos vizsgálódásainkban a következőképpen vezethető be:
3. definíció. Legyen Boole-függvény. Az függvény (Shannon-féle) entrópiáján a
kifejezést értjük.
Mivel Boole-függvényeknél létezik nullától különböző Fourier-együttható, így ez az összeg nem lesz üres. Könnyen látható, hogy nemnegatív értékeket vesz fel, valamint a Jensen-egyenlőtlenség alkalmazásával (a függvény konvexitását felhasználva) igazolható, hogy nem nagyobb mint .
Az entrópia és a hatásfüggvény is valamilyen formában azt fejezik ki, hogy a Fourier-együtthatók kis helyre koncentrálódnak. A két mennyiség viszonyát illetően máig nem bizonyított az a sejtés, hogy az entrópia nem lehet nagyobb, mint a hatásfüggvény:
Entrópia-hatásfüggvény-sejtés. Létezik olyan konstans, hogy minden Boole-függvényre
Néhány egyszerű függvény, amelyekre a sejtés igaz: például az AND (értéke pontosan akkor 1, ha a bemeneti vektor összes koordinátája 1), OR (értéke pontosan akkor 1, ha a bemeneti vektor legalább egy koordinátája 1), és egyéb alapvető logikai függvények. Ezek direkt kiszámolásánál az is kiderül, hogy a konstans legalább 4 kell legyen. A [5] cikkben olvasható, hogy az eddig belátott legjobb alsó korlát már .
A sejtést először Kalai és Friedgut vetette fel monoton gráftulajdonságok vizsgálata közben [2]. A vizsgálataik során a sejtés állítását a hatásfüggvényre adott alsó becslésként használták volna fel. A problémával és annak különböző következményeivel sokan foglalkoztak. Gil Kalai 2007-es Terrence Tao blogjára írt bejegyzésében kitűnő áttekintést nyújt a kérdés jelentősségéről az addig ismert eredmények alapján [3]. Itt olvasható például, hogy Mansour sejtése is következne Kalai és Friedgut eredeti sejtéséből. Ez nagy vonalakban arról szól, hogy, amennyiben egy Boole-függvény „tömören reprezentálható”, akkor a Fourier-együtthatók „kis helyre koncentrálódnak”.
A sejtés véletlen függvényekre
Sok eredmény született Kalai 2007-es írása óta is a témában, például a sejtés bizonyítása különböző speciális függvényosztályokra ([5]). Mi egy eredményre szeretnénk még kitérni, miszerint véltelenül választott Boole-függvény esetén a sejtés „nagy valószínűséggel igaz”. Mit jelent ez pontosan?
Válasszunk egy véletlen Boole-függvényt úgy, hogy minden -beli ponthoz valószínűséggel rendelünk -et vagy -et. Ekkor minden függvényt valószínűséggel kapunk. Legyenek és valószínűségi változók, amelyek az így választott függvény teljes hatásfüggvényét és entrópiáját jelölik. Az állítás gyakorlatilag azt mondja ki, hogy amennyiben a sejtésben -at választunk konstansnak, akkor az előbbi módon véletlenül választott Boole-függvény nagyon kis valószínűséggel lehet egyáltalán ellenpélda. Vagyis, ha léteznek is függvények, amelyek cáfolják a sejtést -ra, akkor azok csak nagyon (-ben exponenciálisan) kis hányadát teszik ki az össze Boole-függvénynek. Formálisan az állítás:
Tehát egyenletesen véletlenül választott függvényre konstanssal legalább valószínűséggel teljesül az entrópia-hatásfüggvény-sejtés.
Ennek az állításnak a bizonyítása már bőven meghaladja ennek az írásnak a terjedelmi korlátait. Azonban részben azért is emeltük ki ezt az eredményt, mert bár a bizonyításban néhol megjelennek hosszabb számítások, az eddig bevezetett fogalmakon kívül nem igazán igényel magasabb szintű matematikai tudást, csupán elemi valószínűségszámítási ismereteken alapul. Akit érdekel a gondolatmenet, és nem riad vissza néhány hosszabb, de helyenként kifejezetten ötletes számolás végigolvasásától, az a levezetését teljes egészében elolvashatja [1]-ben.
Bizonyítások
Az 1. állítás bizonyítása.
(i) .
(ii) .
(iii) az (ii) speciális esete, amikor .
(iv) A Boole-függvények értékei ezért (iii)-at felhasználva kapjuk az állítást.
A 2. állítás bizonyítása. Vegyük észre, hogy a definíció egyszerű következménye, hogy .
Valóban, értéke vagy 0, nincs változás, vagy . Tehát értéke pontosan akkor 1, ha értéke változik az -edik koordináta előjelváltásával, és akkor 0, ha nem. Vagyis ez a mennyiség pont a nekünk szükséges esemény indikátorfüggvénye, melynek várható értéke épp a valószínűség.
Most igazoljuk, hogy .
Tekintsük az különbséget; jelentése, amikor az -edik koordinátát az ellenkezőjére változtatjuk. Ha vesszük és Fourier-előállítását, azon -ekhez tartozó tagok, amelyekben az nem szerepel mind a két függvényben azonosak, tehát a különbségben kiesnek. Ha az akkor , tehát a különbségben ennek a tagnak a kétszerese szerepel. (Nem nehéz, de érdemes ellenőrizni, hogy ez a karakter mindkét formájára valóban igaz a megfelelően adott Boole-függvény esetén.) Röviden azt kaptuk, hogy
Végül
Az utolsó egyenlőségnél a Parseval-egyenlőséget és a karakterek ortonormáltságát használtuk.
A 3. állítás bizonyítása.
.
Irodalomjegyzék
- [1] Bireswar Das, Manjish Pal, and Vijay Visavaliya. The entropy influence conjecture revisited. arXiv preprint arXiv:1110.4301, 2011.
[2] Ehud Friedgut and Gil Kalai. Every monotone graph property has a sharp threshold. Proceedings of the American Mathematical Society, 124(10):2993–3002, 1996.
[3] Gil Kalai. (Gil Kalai) The entropy/influence conjecture, 2007 (accessed February 15, 2020). https://terrytao.wordpress.com/2007/08/16/gil-kalai-the-entropyinfluence-conjecture/.
[4] Gil Kalai and Shmuel Safra. Perspectives from mathematics, computer science, and economics. Computational complexity and statistical physics, page 25, 2006.
[5] Ryan O’Donnell, John Wright, and Yuan Zhou. The Fourier entropy-influence conjecture for certain classes of Boolean functions. In International Colloquium on Automata, Languages, and Programming, pages 330–341. Springer, 2011.
[6] Wikipedia. Condorcet's jury theorem -- Wikipedia, the free encyclopedia. http://en.wikipedia.org/w/index.php?title=Condorcet's%20jury%20theorem&oldid=1026667834, 2021. [Online; accessed 04-August-2021].
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg (EFOP-3.6.3-VEKOP-16-2017-00002).
Bakos Bence MSc hallgató, ELTE Matematikai Intézet
Pálfy Máté doktorandusz, ELTE Matematikai Intézet