A Chi-négyzet eloszlás és a szórás kapcsolata

A FES és KLJN kutatások során gyakran felmerül annak igénye, hogy egy mennyiség szórását határozzuk meg. Mivel a minták száma véges, a kapott szórás ingadozik annak várható értéke körül.

A kapott szórások szemléltetése KLJN kommunikáció esetén

A kapott szórások szemléltetése KLJN kommunikáció esetén

Első ránézésre azt is gondolhatnánk, hogy a kapott eloszlások normál eloszlásúak. Ugyanakkor, hogy ha jobban megvizsgáljuk a helyzetet, hamar egyértelművé válik, hogy nem azok. Az általunk vizsgált feszültség (vagy áramjelek) általában normál eloszlásúak, középértékük pedig nulla. A jel varianciáját a következő képlettel kaphatjuk meg:

V = {1 \over k} \sum_{i=1}^{k} x_i^2

, ahol x_i-k az aktuális mérési értékek. A képlet alapján látszik, hogy az általunk keresett eloszlásnak a Chi-négyzet eloszláshoz lesz köze. Ha z_i-k egymástól független standard normál eloszlású változók (0 középértékkel és egységnyi szórással), akkor a következő egyenlettel definiált Q, Chi-négyzet eloszlást követ  k szabadsági fokkal.

Q = \sum_{i=1}^{k} z_i^2

Q legfontosabb tulajdonságai:

mean(Q) = k

var(Q) = 2k

A korábban felhasznált x_i változók nem standard eloszlásúak, szórásuk nem egységnyi, hanem \sigma. Így:

z_i={x_i \over \sigma}

x_i=\sigma z_i

V = {\sigma^2 \over k} Q

Ezekből az egyenletekből meghatározhatjuk a mért variancia várható értékét és szórását:

mean(V) = \sigma^2

var(V) = {\sigma^4 \over k^2} 2k = 2 {\sigma^4 \over k}

Az első egyenlet nem különösen meglepő, hiszen ezt várjuk. A második viszont azért érdekes, mert látszik, hogy a mérések során kapott szórás vagy RMS értékek szórása csak és kizárólag a szórás várható értékétől, valamint az egymástól statisztikailag független pontok számától függ.

A számolás ellenőrzésére egy egyszerű LabVIEW szimulációt készítettem (lásd következő ábra). A programban meg lehet figyelni, hogy a Chi-négyzet eloszlás sűrűségfüggvényének megfelelő skálázásához mind a x értékeket, mind pedig a függvény kimenetét meg kell szorozni \sigma^2/k-val.

Az elkészített szimuláció blokk diagramja

Az elkészített szimuláció blokk diagramja

A szimuláció eredménye

A szimuláció eredménye

A szimuláció eredményeként jól látható, hogy a kapott eloszlás, bár közel áll a normál eloszláshoz, nem illeszkedik rá pontosan, a jósolt Chi-négyzet eloszlás viszont jól követi a mért adatpontokat. A különbség bár nem tűnik lényegesnek (sok helyen a Chi-négyzet eloszlást normál eloszlással szokták közelíteni), de a tartomány szélein, az eltérés akár több nagyságrend is lehet. A KLJN kommunikáció során pedig pont ez a tartomány lesz érdekes a hibaráta becslésénél.

Egy érdekesség van még: a beépített LabVIEW-s Chi-négyzet sűrűségfüggvényt számoló rutin sajnos nem lett igazán jól implementálva, néhány száz mérési pont felett már nem ad használható eredményt. Ezért egy új verziót implementáltam a beépített alapján, mely nagy számokra is tökéletesen működik. Ennek a blokk diagramja a következő ábrán látható:

Chi-négyzet sűrűségfüggvényét nagy számok esetén is helyesen meghatározó rutin

Chi-négyzet sűrűségfüggvényét nagy számok esetén is helyesen meghatározó rutin

Hozzászóllások