Egyszerű kérdések, bonyolult válaszok

A cikksorozat első részében vázlatosan ismertettük a (csak ohmos ellenállásokat tartalmazó) $n$ -port hálózat fogalmát, és megmutattuk, hogy hogyan modellezhető lineáris algebrai módszerekkel a hálózat rövidre zárása. Bevezettük a négyzetes mátrixok lineáris alterekre vonatkozó $Z_{/\mathcal{S}}$ zárlatát, mint az

$\displaystyle M(Z,\mathcal{S}):=\big\{A\in\mathbf{B}_+(H)\mid A\leq Z~~$ és $\displaystyle ~~\operatorname{ran}(A)\subseteq\mathcal{S}\big\}$

halmaznak a $\leq$ részbenrendezésre nézve legnagyobb elemét. Emlékeztetünk arra, hogy a $Z_{/\mathcal{S}}$ mátrix kvadratikus alakjára formulánk is volt

$\displaystyle \forall x\in H\colon\qquad(Z_{/\mathcal{S}}x,x)=\inf\limits_{y\in\mathcal{S}^{\perp}}(Z(x-y),x-y),$

és hogy $\leq$ alatt a kvadratikus alakok pontonkénti rendezését értjük, azaz $A\leq B$ , ha minden $x\in H$ -ra $(Ax,x)\leq(Bx,x)$ . Ebben a részben azt az egyszerűnek hangzó, de igen bonyolult kérdést vesszük górcső alá, hogy a $\leq$ részbenrendezésre nézve mikor van két pozitív szemidefinit mátrixnak (vagy általánosabban: két pozitív operátornak) legnagyobb közös alsó korlátja. Ebben újfent egy olyan fogalom lesz segítségünkre, amelyet elektromos hálózatok modellezésére vezettek be. Megismerkedünk a párhuzamos összeadás nevű művelettel, és az előző részben megismert fogalmak végtelen dimenziós általánosításaival.

1. Portok párhuzamos kapcsolása

Az előző részben megismerkedtünk a kizárólag ohmos ellenást tartalmazó 2-port fogalmával, és láttuk, hogy annak impedanciája egy $2\times 2$ -es mátrixszal írható le. Tekintsünk most két ilyen 2-portot ( $A$ és $B$ ), és kössük őket párhuzamosan.

$2$ -port hálózatok párhuzamos kapcsolása

Mint az ábrán is látható, ez alatt azt értjük, hogy a két hálózat mindegyik port párján a kimenetet a kimenettel, a bemenetet a bemenettel összekötjük. Az így kapott új hálózat szintén egy $2$ -port hálózat, így természetes módon adódik a kérdés, hogy mi a kapcsolt hálózat $Z\in\mathbb{R}^{2\times 2}$ impedancia mátrixa, és hogy hogyan számolható az ki a $Z_A$ és $Z_B$ impedanciák segítségével. Megjegyezzük, hogy $1$ -port hálózatok esetén épp a replusz nevű műveletet kapjuk. Azaz ha az 1-portokon az eredő ellenállás $\alpha$ és $\beta$ volt, akkor a csatolt hálózat eredő ellenállása $(\alpha^{-1}+\beta^{-1})^{-1}$ . Ez a mennyiség egyébként nem más, mint az $\alpha$ és $\beta$ valós számok harmonikus közepének a fele.

Elsőként nézzünk egy konkrét példát. Válasszuk $A$ -nak az előző részben szereplő 2-portot:

A Kirchhoff-egyenleteket felírva megkaptuk, hogy ennek impedanciája

$\displaystyle Z_A =\begin{bmatrix}6 & 4\\ 4 & 10\end{bmatrix}.$

Az egyszerűség kedvéért a $B$ hálózat legyen azonos szerkezetű $A$ -val:

A Kirchoff egyenletek segítségével itt azt kapjuk hogy $B$ impedanciája

$\displaystyle Z_B = \begin{bmatrix}4 & 3\\ 3 & 8\end{bmatrix}.$

Az ezekből adódó párhuzamosan kapcsolt $2$ -port hálózat a következő:

Klasszikus fizikai érveléseket felhasználva a kapott hálózat impedanciája így határozható meg: mindkét hálózatban egy-egy csillag kapcsolás található. Alkalmazzuk ezekre a csillag-delta átalakítást, ekkor két párhuzamosan kapcsolt delta kapcsolásunk lesz. Ez azonos azzal a delta kapcsolással, amelynek minden eleme a két delta megfelelő elemeinek párhuzamos kapcsoltja. Ezekre rendre alkalmazva a két ellenállás párhuzamos kapcsolására ismert képletet, majd az eredő ellenállásokból álló delta kapcsolásra használva a delta-csillag átalakítást, a következő, az eredetivel ekvivalens $2$ -port hálózathoz jutunk:

Az ekvivalens hálózat

Innen pedig már az ismert módon kapjuk a Kirchhoff-egyenletekből, hogy

$\large Z = \begin{bmatrix} \frac{314}{131} & \frac{224}{131}\\[6pt] \frac{224}{131} & \frac{582}{131}\end{bmatrix}.$

Látjuk tehát (pontosabban el lehet képzelni), hogy a kapcsolt hálózat impedanciájának kiszámításához elég sok számolásra van szükség. Ráadásul olyan számolásra, amely feltételezi, hogy ismerjük a hálózatok konkrét felépítését. Tehát ugyanazzal a nehézséggel találkozunk, mint a cikksorozat első részében. Nem csak a nehézség ugyanaz, annak feloldása is: adjunk olyan képletet, amiben csak a csatolatlan hálózatok impedanciái, és mátrix operációk szerepelnek. Be lehet bizonyítani (a részletektől itt eltekintünk), hogy a párhuzamos kapcsolással nyert hálózat impedanciája

$\displaystyle Z=(Z_A^{-1}+Z_B^{-1})^{-1}.$

(1)

Következésképp, az impedancia meghatározása mindössze három invertálásból és egy összeadásból áll, ezek pedig algoritmikusan elvégezhető feladatok. Ellenőrzésként, a kapott képletbe behelyettesítve valóban azt kapjuk, hogy

$\large \left(\begin{bmatrix} 6 & 4\\ 4 & 10 \end{bmatrix}^{-1}+\begin{bmatrix} 4 & 3\\ 3 & 8\end{bmatrix}^{-1}\right)^{-1}= \begin{bmatrix}\frac{314}{131} & \frac{224}{131}\\[6pt] \frac{224}{131} & \frac{582}{131}\end{bmatrix}.$

Az így nyert műveletet, amely tehát két $Z_A$ -hoz és $Z_B$ -hez $Z$ -t rendeli, párhuzamos összeadásnak nevezzük, és $Z=Z_A:Z_B$ szimbólummal jelöljük. A képletben invertálás is szerepel, így elsőre nem nyilvánvaló, hogy ez a művelet definiálható pozitív szemidefinit mátrixokra is. Az invertálhatóság problémáján egy egyszerű (határátmenetet alkalmazó) okoskodással felül lehet emelkedni, azonban az (1) formulát biztosan elveszítjük. De mint látni fogjuk, ez nem okoz problémát, mert nem azzal akarunk dolgozni. Sokkal fontosabb, hogy két pozitív operátor $A,B\in\mathbf{B}_+(H)$ párhuzamos összegét definiálhatjuk a kvadratikus alakján keresztül. Azaz legyen $A:B$ az az operátor, amelynek kvadratikus alakja

$\displaystyle \forall x\in H:\qquad\big((A:B)x,x\big)=\inf\limits_{y\in H}\big\{\big(A(x-y),x-y\big)+\big(By,y\big)\big\}.$

(2)

Az olvasó egész eddig joggal kérdezhette, hogy mi köze van a párhuzamos kapcsolásnak a cikk témájához, nevezetesen a pozitiv operátorok kúpjának részbenrendezéséhez. Arról nem is beszélve, hogy mi köze az egésznek az operátorok altérre vonatkozó zárlatához, ami pedig a cikksorozat témája.

Helyettesítsünk $y$ helyére 0-t a (2) formulában: $\big((A:B)x,x\big)\leq\big(Ax,x\big)$ . Hasonlóan, $y=x$ helyettesítéssel azt kapjuk, hogy $\big((A:B)x,x\big)\leq\big(Bx,x\big),$ azaz $A:B$ az $A$ és $B$ operátoroknak egy közös alsó korlátja. Arról, hogy a legnagyobb közös alsó korlát lenne, nincs és nem is lehet szó. Már a legegyszerűbb invertálható mátrix esetben is azt kapjuk, hogy $A:A=\frac{1}{2}A$ , márpedig $A$ -nak és $A$ -nak a legnagyobb közös alsó korlátja nyilvánvalóan $A$ . Ennek ellenére ne becsüljük le a műveletnek ezt a közös alsó korlátot kijelölő tulajdonságát. A cikk végére épp azt fogjuk látni, hogy $\mathbf{B}_+(H)$ -ban nem feltétlenül van két elemnek legnagyobb közös alsó korlátja, de a párhuzamos összeadás lehetővé teszi, hogy „úgy csináljunk, mintha lenne”. Így például a következő fejezet témáját képező fogalom a vektorhálók elméletéből ismert sáv projekciónak [4] egy imitációja.

Mivel a későbbiekben szükségünk lesz rájuk, megemlítjük a párhuzamos összeadás két egyszerűen bizonyítható tulajdonságát:

(a) monoton, azaz $0\leq A_1\leq A_2$ és $0\leq B_1\leq B_2$ esetén $A_1:B_1\leq A_2:B_2$ ,

(b) minden $\alpha,\beta\geq0$ és $0\leq A$ esetén $(\alpha A):(\beta A)=\frac{\alpha\beta}{\alpha+\beta}A$ .

Mielőtt rátérnénk a pozitív operátorok részbenrendezésére, teszünk egy rövid kitérőt.

2. Az operátorképterekre vonatkozó általánosított zárlat

Emlékeztetünk arra, hogy az előző részben az egyszerűség kedvéért végig feltettük, hogy $H$ egy véges dimenziós Hilbert tér. Ha ettől a feltevéstől meg akarunk szabadulni, akkor többet kell megkövetelnünk az $\mathcal{S}$ altértől, nevezetesen azt, hogy legyen zárt. (Véges dimenziós Hilbert terekben minden lineáris alér zárt, így erről eddig nyugodtan hallgathattunk.)

Mivel a vizsgálatok során az $\mathcal{S}$ altér szerepét gyakran egy olyan operátorképtér játssza, ami nem zárt, ezért szükségünk van egy olyan általánosításra, ahol az altér zártsága már nincs megkövetelve. Ebben van segítségünkre az imént bevezetett párhuzamos összeadás.

Legyenek $A$ és $B$ tetszőleges pozitív operátorok a $H$ Hilbert téren. Az $A$ operátor $B$ -re (vagy $B$ képterére) vonatkozó általánosított zárlatán az alábbi

$\displaystyle [B]A:=\lim\limits_{n\to\infty} A:(nB)$

(3)

operátort értjük, ahol a limesz pontonkénti konvergenciában értendő. Az $A\mapsto[B]A$ leképezés tulajdonságaiból itt csak egyet említünk meg, mert azt használni is fogjuk. Ha $A\leq cB$ valamilyen $c\geq0$ -ra, akkor $[B]A=A$ . Valóban, az (a) és (b) tulajdonságokat kihasználva látszik, hogy

$\displaystyle A\geq A:nB\geq A:\frac{n}{c}A=\frac{n}{n+c}A\to A.$

Megjegyezzük, hogy ha $\mathcal{S}$ egy zárt lineáris altér, $P$ -pedig az $\mathcal{S}$ -re való merőleges vetítés, akkor $A_{/\mathcal{S}}=[P]A$ . Tehát a fenti párhuzamos összeadást használó eljárás egy új módszert szolgáltat az $\mathcal{S}$ altérre vonatkozó zárlat kiszámítására.

3. Operátorok legnagyobb közös alsó korlátja

Az előző részben homályosan utaltunk arra, hogy a pozitív szemidefinit mátrixok

$\displaystyle A\leq B\qquad\Longleftrightarrow\qquad\forall x\in H:~(Ax,x)\leq(Bx,x)$

részbenrendezése meglehetősen komplikált rendezésstruktúrát eredményez. Nevezetesen: még az olyan egyszerű szerkezetű mátrixoknak sem létezik legnagyobb közös alsó korlátja, mint a

$\displaystyle T_1:=\begin{bmatrix}1 & 0 \\ 0 & 2 \end{bmatrix}$ és $\displaystyle \quad T_2:=\begin{bmatrix}2 & 0 \\ 0 & 1\end{bmatrix}.$

Másképp megfogalmazva, a

$\displaystyle [0,T_1]\cap[0,T_2]:=\big\{A\in\mathbf{B}_+(H)\mid 0\leq A\leq T_1~~$ és $\displaystyle ~~0\leq A\leq T_2\big\}$

halmaznak nincs legnagyobb eleme, noha az egységmátrix egy nagyon szimpatikus jelölt. A fejezet végén látni fogjuk, hogy valóban nincs legnagyobb elem, elsőként azonban megelégszünk azzal, hogy megmutatjuk, hogy az egységmátrix nem az. Tekintsük az

$\displaystyle I:=\begin{bmatrix}1 & 0 \\ 0 & 1 \end{bmatrix}$ és $\displaystyle \quad T:=\begin{bmatrix}0{,}8 & 0{,}3 \\ 0{,}3 & 0{,}8\end{bmatrix}$

mátrixokat. A sajátértékeket kiszámolva láthatjuk, hogy mindkettő pozitív szemidefinit. Hasonlóan, a $T_1-I$ , $T_2-I$ , $T_1-T$ , és $T_2-T$ sajátértékei mind nemnegatívak, így $I$ és $T$ benne van a $[0,T_1]\cap[0,T_2]$ halmazban. Ugyanakkor $I-T$ -nek van negatív sajátértéke, következésképp az $I\leq T$ egyenlőtlenség nem teljesül, tehát $I$ nem legnagyobb eleme $[0,T_1]\cap[0,T_2]$ -nek. Pontosan az ilyen össze nem hasonlított elemek okozzák a nehézségeket.

Térjünk vissza az általános problémára. Legyen $H$ egy Hilbert tér, tekintsük a pozitív operátorok $\mathbf{B}_+(H)$ -val jelölt kúpját. (Ha $H$ véges dimenziós, akkor $\mathbf{B}_+(H)$ a pozitív szemidefinit mátrixok kúpjának felel meg.) A kérdés, amely hosszú éveken át megválaszolatlanul maradt, a következő: van-e olyan szükséges és elégséges feltétel, amely alapján el tudjuk dönteni, hogy két operátornak létezik-e legnagyobb közös alsó korlátja. (Az érdeklődő olvasó a probléma kvantummechanikai vonatkozásai mellett önmagukban is érdekes eredményeket találhat az [1,5,6] cikkekben.)

A kérdésre a teljes választ Tsuyoshi Ando japán matematikus adta meg az 1999-ben megjelent Problem of Infimum in the Positive Cone című cikkében [3].

Tsuyoshi Ando

Megjegyezzük, hogy a $[B]A$ -val jelölt általánosított zárlat fogalma is tőle származik, vagy legalábbis elsők között használta, mint egyfajta kitüntetett operátor (az $A$ operátor $B$ -szerinti abszolút folytonos része [2]). Ando tétele a következőt mondja:

$A$ -nak és $B$ -nek pontosan akkor létezik legnagyobb közös alsó korlátja, ha

$\displaystyle [A]B\leq[B]A$ vagy $\displaystyle \qquad [B]A\leq[A]B.$

Ekkor a legnagyobb közös alsó korlát $[A]B$ és $[B]A$ közül a kisebb.

Kiderült tehát, hogy a legnagyobb közös alsó korlát meghatározásához, és általában, a létezésének garantálásához épp az általánosított zárlatra van szükség.

Térjünk vissza a $T_1$ és $T_2$ mátrixokokkal kapcsolatos problémánkra. Világos, hogy $T_1\leq 2T_2$ és $T_2\leq 2T_1$ . A korábbi észrevételünk alapján ebből az következik, hogy $[T_1]T_2=T_2$ és $[T_2]T_1=T_1$ . Mivel azonban $T_1$ és $T_2$ nem összehasonlítható, a legnagyobb közös alsó korlát nem létezhet.

A cikk mondandóját egy mondatba tömörítve: azt láttuk hogy egy egyszerű mérnöki feladat modellezésének melléktermékeként olyan műveletet nyertünk, amely aztán hasznos fegyverünk volt egy teljesen absztrakt, az eredeti problémához lazán sem kapcsolódó kérdés megválaszolásánál.

A cikksorozat az Emberi Erőforrások Minisztériumának ÚNKP-18-4-BGE-3 kódszámú „Új Nemzeti Kiválóság Program”, és a Nemzeti Fejlesztési, Kutatási és Innovációs Hivatal (NKFIH PD128374 és K115383) támogatásával készül.

Hivatkozások

[1] W. N. Anderson, Jr. and M. Schreiber, The infima of two projections, Acta Sci. Math. (Szeged) 33(1972), 165–168.

[2] T. Ando, Lebesgue-type decomposition of positive operators, Acta Sci. Math. (Szeged), 38(1976), 253–260.

[3] T. Ando, Problem of Infimum in the Positive Cone, In: Rassias T. M., Srivastava H. M. (eds) Analytic and Geometric Inequalities and Applications. Mathematics and Its Applications, vol 478. Springer, Dordrecht (1999).

[4] S. Bochner and R. S. Phillips, Additive Set Functions and Vector Lattices, Annals of Mathematics, Second Series, Vol. 42, No. 1, (1941), 316–324

[5] S. Gudder, Lattice properties of quantum effects, J. Math. Phys., 37(1996), 2637–2642.

[6] T. Moreland and S. Gudder, Infima of Hilbert space effects, Linear Algebra and its Applications, 286 (1–3), 1999, 1–17

Ujszászi Zoltán

mesterszakos egyetemi hallgató

ELTE TTK Matematikai Intézet

Alkalmazott Analízis és Számításmatematikai Tanszék

Titkos Tamás

MTA Rényi Alfréd Matematikai Kutatóintézet
és Budapesti Gazdasági Egyetem

Információk

Főmenü

Egyszerű kérdések, bonyolult válaszok – II. Az infimum-probléma