Sávszélesség hatása a független mérési pontok számára

Szimulációk esetén könnyű úgy generálni a jeleket, hogy az egymás utáni adatpontok statisztikailag függetlenek legyenek, a valós mérések esetén viszont a sávszélesség óhatatlanul korrelációt vezet be az adatpontok között. E miatt merül fel a kérdés, hogy egy adott pontosság eléréséhez vajon hány mérési pontra lesz szükségünk. Vagy másképp megfogalmazva: ha van N mérési pontunk, ez hány, egymástól statisztikailag független mérési pontnak felel meg (k)?

A Shannon-féle mintavételi tételt egy egyszerű megoldást javasol arra, hogy mérésünk során milyen gyakran kapunk majd független adatpontokat: adott sávszélesség esetén, ha a sávszélesség (kicsit több mint) kétszeresével mintavételezünk, akkor nincs információveszteségünk, a valódi jelalakot bármelyik pontban rekonstruálni tudjuk. Ez viszont azt is jelenti, hogy ha gyakrabban mérünk, nem jutunk további információhoz.

Lefordítva a korábbi kérdésre a tételt, ha f_s a mintavételi frekvenciánk, f_{bw} pedig a sávszélességünk, a statisztikailag független mérési pontok száma a sávszélesség és a mintavételi frekvencia arányában fog csökkenni a következő képlet szerint:

k=N \cdot {2 f_{bw} \over f_s}

Ha a sávszélesség pont a mintavételi frekvencia fele, akkor minden egyes mért adatpontot statisztikailag függetlennek tekinthetjük. Természetesen ez csak akkor igaz, hogy a vizsgált jelünk korrelálatlan volt, vagyis fehér zaj.

A valóságban olyan fehér zajt nem találunk, ami f_{bw} alatt tökéletesen egyenletes frekvenciamenetű, felette viszont 0 teljesítménnyel rendelkezik. Analóg és digitális szűrőkkel megközelíthetjük ezt a frekvenciamenetet, de nem tökéletesen. Vajon a szűrők milyen hatással lesznek a mérésekre?

A KLJN-hez és a FES-hez kapcsolódó méréseknél két gyakran mért paraméter a jel középértéke és szórása. Megvizsgálhatjuk, hogy N mérést elvégezve, az így kapott mennyiségek milyen eloszlást követnek. A következőkben egy olyan szimuláció eredményét mutatom be, ahol a mintavételi frekvencia 1 kHz, a zaj sávszélességét egy 10-edfokú Butterworth szűrő határozza meg 100 Hz-es levágási frekvenciával, a mintavételezett pontok száma (N) pedig 500. A mérések száma 100 000. Ahogy a következő ábrán látszik, a kapott átlagok igen pontosan normál eloszlást követnek.

A mért középértékek eloszlása sávkorlátozott jel esetén

A mért középértékek eloszlása sávkorlátozott jel esetén

A statisztikában középérték szórását az adatpontok szórásából a következő képlettel tudjuk meghatározni (lásd konfidenciaintervallum):

sd(\bar{x_k})={sd(x) \over \sqrt{k} }

A zaj mért szórása 0,8937, a középértékek szórása pedig 0,0891. Ez alapján k, a független adatpontok száma 100,681, ami lényegében megfelel a mintavételi tételből kapott képletnek.

Hasonlóan megvizsgálhatjuk a kapott szórások eloszlását is. Az a következő ábrán jól látszik, hogy a kapott eloszlás megfelel a várt Chi-négyzet eloszlásnak. A korábbi bejegyzés alapján a mérési adatok alapján meghatározhatjuk k értékét, erre a konkrét esetre k-nak 105,69-et kapunk. Ha görbét illesztünk, a kapott k érték 107 lesz. Ez ugyan kis mértékben eltér a várttól, de mutatja, hogy ha elegendően meredek a sávszűrőnk, a mintavételi tételből kapott összefüggés jól használható.

A mért szórások eloszlása sávkorlátozott jel esetén

A mért szórások eloszlása sávkorlátozott jel esetén

Ha a szűrő meredeksége nem elég meredek, azt várjuk, hogy több nagyfrekvenciás tag marad a jelben, növelve a statisztikailag független pontok számát. A tizedfokú szűrőt elsőfokúra cserélve ezt könnyen megfigyelhetjük, a középérték eloszlása alapján azt kapjuk, hogy a független mérési pontok száma 123. Ezzel ugyanakkor nincs összhangban a variancia eloszlása alapján kapott érték, ami 198. Ha a sávszélességet elsőfokú szűrő mellett lecsökkentjük 10 Hz-re, akkor a két eredmény különbsége még nagyobb lesz, a középérték alapján számolt 15,5 pont, a variancia alapján számolt pedig 30,2 pont. Az alábbi ábrán látható, hogy míg a középérték továbbra is normál eloszlást követ, a variancia eloszlása már nem tökéletesen Chi-négyzet. (Az eltérést biztosan nem a pontok kis száma okozza, 10-ed fokú szűrőt alkalmazva, a „helyes” eredmény jön ki. A pontok számát növelve (pl. N=5000) az eloszlás jobban közelít a Chi-négyzet eloszláshoz, a középérték és a variancia alapján számolt k közötti különbség viszont megmarad).

Alacsonyabb fokú szűrő használata esetén a variancia eloszlása már eltér az illesztett Chi-négyzet görbétől

Alacsonyabb fokú szűrő használata esetén a variancia eloszlása már eltér az illesztett Chi-négyzet görbétől

A szimuláció eredményei alapján látszik, hogy elegendően meredek levágású szűrőket alkalmazva, a mintavételi tétel alapján kapott összefüggés teljesül. Ha a szűrő nem elég meredek, akkor a független mérési pontok száma emelkedik, de még ugyanabban a nagyságrendben lesz. Ugyanakkor a kapott k értékek eltérőek lesznek a középérték és a variancia esetén, jelezve, hogy ilyen esetben a mintavételi tételből kapott eredményeket már nem használhatjuk automatikusan.

Hozzászóllások