STATISZTIKAI MELLÉKLET
Mérés: dolgokhoz valamely szabály alapján számokat rendelünk.
Adat: a dolgokhoz valamely szabály
alapján rendelt számok.
Adatfajták - mérési skálák:
mérhető adatok - intervallum (metrikus) skála
tulajdonsága:
- egy-egy szám mint adat mindig ugyanazt a „teljesítményt"
jelenti,
- sorba állítható,
- összeadható (additív: 2 pont + 5 pont = 7 pont)
pl.:
- pontszámok
- metrikus adatok (testmagasság, időtartam, stb.)
rangsorolt adat - rangskála
tulajdonsága:
- sorba rendez,
- nem összeadhatók ( nem additív: 2. hely + 7. hely ¹ 9. hely)
pl.:
- fontossági sor értékek között
- verseny sorrendje
megállapítható adat - nominális skála
tulajdonsága:
- valamely kategóriába tartozást fejez ki
- nem jellemzi sorrendiség
- nem additív ( két férfi ¹ egy nő)
pl.:
- az emberek neme
- iskolai végzettség
Statisztikai alapkérdések:
1. általános tendenciának, a középértéknek a mérése, a megoszlások kimutatása
2. annak megállapítása, hogy az egyes adatok mennyire térnek el a középértéktől, azaz a szóródás mérése
3. összefüggések vizsgálata, azaz korreláció vizsgálat
Fogalmak:
Alapsokaság (populáció):
Azon személyek, dolgok összessége, amelyre következtetést kívánunk levonni.
Minta:
A populáció azon része, amelyet ténylegesen bevonunk a vizsgálatba.
Reprezentatív minta: A populáció sajátosságaival rendelkező minta.
Leíró statisztika:
A vizsgált minta jellemzőit tárja fel. (pl.: egy osztály, iskola, stb.).
Matematikai statisztika:
A reprezentatív mintából a populációra levonható következtetések valószínűségét adja meg, azaz a mintában tapasztalt különbségek ill. összefüggések a populáció egészére milyen valószínűséggel érvényesek.
Statisztikai számítások:
Mért adatok (intervallum skála):
Gyakorisági eloszlás: a csoportok és a csoporthoz tartozó gyakoriságok együttese
Értéktartomány: adatmax-adatmin
Csoportok száma: 10 -20 db. (kisminta esetén 8 - 9 db.) javasolt.
Csoportintervallum: intervallumhossz = 1; 2; 3; 5; 10 javasolt
Csoporthatárok: - alsó határ legyen az intevallumhossz többszöröse
- a csoporthatárok nem fedhetik egymást
(pl. hibás: 1-10 ; 10 - 20; ... jó: 1-10; 11 - 20; ...)
Valódi csoporthatár: a csoporthatárok kiterjesztése 0,5-del (hogy a határok „érintkezzenek")
Csoportközép: az alsó és felső csoporthatár számtani közepe
Abszolút gyakoriság: jele: fi
a minta adatai közül a csoportba tartozók száma
Relatív gyakoriság: jele: f(%)i
a csoportba tartozó adatok számának és az összes adatnak az
aránya (%-os alakban)
Kumulatív gyakoriság: azon adatok száma a mintában, amelyek egy adott értéket elértek
Kumulatív relatív gyakoriság: azon adatok számának %-os aránya a mintában, amelyek egy adott értéket elértek
Gyakorisági eloszlások ábrázolása:
Medián: az az érték, amelyiknél a minta egyik fele nagyobb, a másik fele kisebb
(A rendezett minta közepe, középső eleme.)
Páratlan darab elem (adat) esetén a középső.
Páros darab elem (adat) esetén a két középső számtani közepe.
Módusz: a minta elemei között leggyakrabban előforduló érték (vagy a legnagyobb gyakorisággal rendelkező csoport csoportközépértéke).
Előfordulhat, hogy több mintában is megegyezhet az átlag, a módusz és még a medián is. Ezért a középértékek mellett a szóródás mutatóira is szükség van.
Szóródás: a minta azon tulajdonsága, hogy annak egyes elemei eltérnek a minta középértékeitől.
A szóródási terjedelem: Ri=xmax-xmin
Pl.: Ri=68max-28min=40
Kvartilis:
1. kvartilis Q1: az az érték, amelynél a rendezett minta elemeinek negyede kisebb, háromnegyede nagyobb.
2. kvartilis Q2: egyenlő a mediánnal.
3. kvartilis Q3: az az érték, amelynél a rendezett minta elemeinek negyede nagyobb, háromnegyede kisebb.
Interkvartilis félterjedelem:
A rendezett minta elemeinek középső 50%-át tartalmazó értéktartomány fele.
Megmutatja, hogy az adatok 50%-a milyen sávban öleli körül a mediánt.
A minta medián körüli értékeinek szóródása.
Átlagos eltérés: az egyes elemek átlagtól való eltérésének átlaga.
Variancia: szórásnégyzet.
Szórás: a minta elemeinek szóródását fejezi ki.
A variancia négyzetgyökével egyezik meg.
Több minta esetén csak az azonos értéktartományú minták szóródásának összehasonlítását teszi lehetővé.
Variációs együttható (= relatív szórás):
Több minta esetén a különböző értéktartományú minták szóródásának összehasonlítását (is) lehetővé teszi.
Hipotézisvizsgálat statisztikai mutatók segítségével
t-próbák: két minta tulajdonságai közötti különbség szignifikanciájának számszerűsítése, megállapítása (pl.: önkontrollos vizsgálat).
egymintás t-próba: ugyanazoktól a személyektől származó két különböző mérési eredmény (két változó) számtani középértéke közötti szignifikáns különbség valószínűségének meghatározása.
(Pl.: Egy osztályban egy új számolási készségfejlesztő módszer alkalmazása előtt, majd a módszer alkalmazása után is megmérik a tanulók számolási készségét.
A vizsgálat arra keresi a választ, hogy a módszer alkalmazása eredményez-e lényeges változást a tanulók számolási készségében.)
Az egymintás t' értékének szignifikancia-vizsgálata:
A t' próba táblázatában n-1 (=minta elemszáma-1) szabadságfoknál kell keresni a megfelelő értéket:
- ha t'>ttáblázat, akkor az átlagok különbsége nem a véletlen hatása, vagyis a különbség szignifikáns,
- ha t'<ttáblázat, akkor az átlagok különbsége a véletlen hatása, vagyis a különbség nem szignifikáns.
Kétmintás t-próba: különböző személyektől (két különböző csoportból) származó két mérési eredmény (két változó) számtani középértéke közötti
különbség meghatározása (pl.: kontrollcsoportos vizsgálat).
(Pl.: két párhuzamos osztályban ugyanazt a tananyagot más-más módszerrel tanítják, majd a tanítási folyamat végén ugyanazon teszten mérik a két osztályt. A vizsgálat arra keresi a választ, hogy a két módszer eredményessége között van-e lényeges különbség.)
Jele: t"
Csak akkor végezhető el, ha a két mérés eredményének varianciája (szórásnégyzete) között nincs jelentős (szignifikáns) eltérés.
Ezt az F-próba adja meg.
F-próba:
F értékének szignifikancia-vizsgálata:
Az F próba táblázatában két szabadságfok (=minta elemszáma-1) van:
1. az 1. minta elemszáma-1
2. a 2. minta elemszáma-1
- ha F>Ftáblázat, akkor a varianciák különbsége nem a véletlen hatása, vagyis a különbség szignifikáns, tehát a kétmintás t-próba nem végezhető el!! Ekkor a t-próba helyett pl. a Welch-próbát szokták alkalmazni.
- ha F<Ftáblázat, akkor az átlagok különbsége a véletlen hatása, vagyis a különbség nem szignifikáns, tehát a kétmintás t-próba elvégezhető!!
A kétmintás t" értékének szignifikancia-vizsgálata:
A t" próba táblázatában n+m-2 (=a két minta elemszámának összege-2) szabadságfoknál kell keresni a megfelelő értéket:
- ha t">ttáblázat, akkor az átlagok különbsége nem a véletlen hatása, vagyis a különbség szignifikáns,
- ha t"<ttáblázat, akkor az átlagok különbsége a véletlen hatása, vagyis a különbség nem szignifikáns.
Variancia analízis: az a statisztikai eljárás, melynek segítségével több egydimenziós minta ugyanazon változója közötti különbség szignifikaszintjét határozza meg.
(Pl.: három párhuzamos osztályban ugyanazt a tananyagot más-más módszerrel tanítják, majd a tanítási folyamat végén ugyanazon teszten mérik a három osztályt. A vizsgálat arra keresi a választ, hogy a három módszer eredményessége között van-e lényeges különbség.)
A variancia-analízis a következő eljárások sorozatát jelenti:
- belső variancia vizsgálat (egy-egy mintán /pl. osztály/ belüli variancia vizsgálat).
Jele: S2belső
- külső variancia vizsgálat (minták /pl. osztályok/ közötti variancia vizsgálat)
Jele: S2külső
- hipotézisvizsgálat F-próbával:
F értékének szignifikancia-vizsgálata:
Az F próba táblázatában két szabadságfok (=minta elemszáma-1) van:
3. az 1. minta elemszáma-1
4. a 2. minta elemszáma-1
- ha F>Ftáblázat, akkor a varianciák különbsége nem a véletlen hatása, vagyis a különbség szignifikáns.
Másképpen: az egyes módszerek lényeges teljesítményváltozást eredményeznek.
- ha F<Ftáblázat, akkor különbségek a véletlen hatásának tulajdoníthatóak, vagyis a különbségek nem szignifikánsak. Másképpen: az egyes módszerek nem eredményeznek lényeges teljesítményváltozást.
Korreláció-számítás
- Többdimenziós mintáról beszélünk akkor, ha a minta egyes elemeiről egyszerre legalább két adat áll rendelkezésünkre. (Pl. : ismerjük a tanulók szüleinek iskolai végzettségét és egy teszten az egyes tanulók által elért eredményt, vagy ugyanazon tanulók kémia és matematika teszteredményét, stb.)
- A korreláció-számítás az egyes adatcsoportok eloszlása közötti összefüggést tárja fel.
- A változók közötti összefüggés esetei:
- két változó pozitív korrelációja (r>0): ha az egyik változó magas értékeihez a másik változó magas értékei, ill. az egyik változó alacsony értékeihez a másik változó alacsony értékei tartoznak. (Pl.: A jó kémia tesztet írók jó matematika tesztet, míg a gyenge kémia tesztet írók gyenge matematika tesztet írnak.)
- két változó negatív korrelációja (r<0): ha az egyik változó magas értékeihez a másik változó alacsony értékei, ill. az egyik változó alacsony értékeihez a másik változó magas értékei tartoznak. (Pl.: A jó kémia tesztet írók gyenge nyelvtan tesztet, míg a gyenge kémia tesztet írók jó nyelvtan tesztet írnak.)
- két változó korrelálatlan: ha az egyik változó magas értékeihez egyes esetekben a másik változó magas, egyes esetekben alacsony értékei tartoznak. Ez sem jelenti feltétlenül a két adatsor függetlenségét, esetenként csak arról van szó, hogy a kapcsolat nem lineáris.
- A minta két változója szimmetrikus: egyiknek sincs kitüntetett szerepe a másikkal szemben. Vagyis a korreláció-analízis nem tárja fel azt, hogy a két adat közül melyik van hatássál a másikra.
- Korrelációs együttható:
Jele: rxy
- A korrelációs együttható szignifikancia-vizsgálata:
A korrelációs együttható táblázatában n-1 (=a minta elemszáma-1) szabadságfoknál kell keresni a megfelelő értéket:
- ha |rxy|>rtáblázat, akkor a minta két változója közötti összefüggés nem a véletlen hatása, vagyis az összefüggés általánosítható.
- ha |rxy|<rtáblázat, akkor a minta két változója közötti összefüggés a véletlen hatása, vagyis az összefüggés nem általánosítható.