STATISZTIKAI MELLÉKLET

 

 

Mérés: dolgokhoz valamely szabály alapján számokat rendelünk.

Adat: a dolgokhoz valamely szabály alapján rendelt számok.

Adatfajták - mérési skálák:

mérhető adatok - intervallum (metrikus) skála

tulajdonsága:

- egy-egy szám mint adat mindig ugyanazt a „teljesítményt"

jelenti,

- sorba állítható,

- összeadható (additív: 2 pont + 5 pont = 7 pont)

pl.:
- pontszámok

- metrikus adatok (testmagasság, időtartam, stb.)

rangsorolt adat - rangskála
tulajdonsága:

- sorba rendez,

- nem összeadhatók ( nem additív: 2. hely + 7. hely ¹ 9. hely)

pl.:
- fontossági sor értékek között

- verseny sorrendje

megállapítható adat - nominális skála
tulajdonsága:

- valamely kategóriába tartozást fejez ki

- nem jellemzi sorrendiség

- nem additív ( két férfi ¹ egy nő)

pl.:

- az emberek neme

- iskolai végzettség

 

Statisztikai alapkérdések:

1. általános tendenciának, a középértéknek a mérése, a megoszlások kimutatása

2. annak megállapítása, hogy az egyes adatok mennyire térnek el a középértéktől, azaz a szóródás mérése

3. összefüggések vizsgálata, azaz korreláció vizsgálat

 

Fogalmak:

Alapsokaság (populáció):

Azon személyek, dolgok összessége, amelyre következtetést kívánunk levonni.

Minta:

A populáció azon része, amelyet ténylegesen bevonunk a vizsgálatba.

Reprezentatív minta: A populáció sajátosságaival rendelkező minta.

Leíró statisztika:

A vizsgált minta jellemzőit tárja fel. (pl.: egy osztály, iskola, stb.).

Matematikai statisztika:

A reprezentatív mintából a populációra levonható következtetések valószínűségét adja meg, azaz a mintában tapasztalt különbségek ill. összefüggések a populáció egészére milyen valószínűséggel érvényesek.

 

Statisztikai számítások:

 

 

 

 

Mért adatok (intervallum skála):

 

Gyakorisági eloszlás: a csoportok és a csoporthoz tartozó gyakoriságok együttese

 

Értéktartomány: adatmax-adatmin

Csoportok száma: 10 -20 db. (kisminta esetén 8 - 9 db.) javasolt.

Csoportintervallum: intervallumhossz = 1; 2; 3; 5; 10 javasolt

Csoporthatárok: - alsó határ legyen az intevallumhossz többszöröse

- a csoporthatárok nem fedhetik egymást

(pl. hibás: 1-10 ; 10 - 20; ... jó: 1-10; 11 - 20; ...)

Valódi csoporthatár: a csoporthatárok kiterjesztése 0,5-del (hogy a határok „érintkezzenek")

Csoportközép: az alsó és felső csoporthatár számtani közepe

Abszolút gyakoriság: jele: fi

a minta adatai közül a csoportba tartozók száma

Relatív gyakoriság: jele: f(%)i

a csoportba tartozó adatok számának és az összes adatnak az

aránya (%-os alakban)

Kumulatív gyakoriság: azon adatok száma a mintában, amelyek egy adott értéket elértek

Kumulatív relatív gyakoriság: azon adatok számának %-os aránya a mintában, amelyek egy adott értéket elértek

 

Gyakorisági eloszlások ábrázolása:

 

 

 

 

 

Medián: az az érték, amelyiknél a minta egyik fele nagyobb, a másik fele kisebb

(A rendezett minta közepe, középső eleme.)

Páratlan darab elem (adat) esetén a középső.

Páros darab elem (adat) esetén a két középső számtani közepe.

 

Módusz: a minta elemei között leggyakrabban előforduló érték (vagy a legnagyobb gyakorisággal rendelkező csoport csoportközépértéke).

 

Előfordulhat, hogy több mintában is megegyezhet az átlag, a módusz és még a medián is. Ezért a középértékek mellett a szóródás mutatóira is szükség van.

 

Szóródás: a minta azon tulajdonsága, hogy annak egyes elemei eltérnek a minta középértékeitől.

 

A szóródási terjedelem: Ri=xmax-xmin

Pl.: Ri=68max-28min=40

 

Kvartilis:

1. kvartilis Q1: az az érték, amelynél a rendezett minta elemeinek negyede kisebb, háromnegyede nagyobb.

2. kvartilis Q2: egyenlő a mediánnal.

3. kvartilis Q3: az az érték, amelynél a rendezett minta elemeinek negyede nagyobb, háromnegyede kisebb.

 

Interkvartilis félterjedelem:

A rendezett minta elemeinek középső 50%-át tartalmazó értéktartomány fele.

Megmutatja, hogy az adatok 50%-a milyen sávban öleli körül a mediánt.

A minta medián körüli értékeinek szóródása.

 

Átlagos eltérés: az egyes elemek átlagtól való eltérésének átlaga.

 

Variancia: szórásnégyzet.

 

Szórás: a minta elemeinek szóródását fejezi ki.

A variancia négyzetgyökével egyezik meg.

Több minta esetén csak az azonos értéktartományú minták szóródásának összehasonlítását teszi lehetővé.

 

Variációs együttható (= relatív szórás):

Több minta esetén a különböző értéktartományú minták szóródásának összehasonlítását (is) lehetővé teszi.

 

 

Hipotézisvizsgálat statisztikai mutatók segítségével

t-próbák: két minta tulajdonságai közötti különbség szignifikanciájának számszerűsítése, megállapítása (pl.: önkontrollos vizsgálat).

egymintás t-próba: ugyanazoktól a személyektől származó két különböző mérési eredmény (két változó) számtani középértéke közötti szignifikáns különbség valószínűségének meghatározása.

(Pl.: Egy osztályban egy új számolási készségfejlesztő módszer alkalmazása előtt, majd a módszer alkalmazása után is megmérik a tanulók számolási készségét.

A vizsgálat arra keresi a választ, hogy a módszer alkalmazása eredményez-e lényeges változást a tanulók számolási készségében.)

 

Az egymintás t' értékének szignifikancia-vizsgálata:

A t' próba táblázatában n-1 (=minta elemszáma-1) szabadságfoknál kell keresni a megfelelő értéket:

- ha t'>ttáblázat, akkor az átlagok különbsége nem a véletlen hatása, vagyis a különbség szignifikáns,

- ha t'<ttáblázat, akkor az átlagok különbsége a véletlen hatása, vagyis a különbség nem szignifikáns.

 

Kétmintás t-próba: különböző személyektől (két különböző csoportból) származó két mérési eredmény (két változó) számtani középértéke közötti

különbség meghatározása (pl.: kontrollcsoportos vizsgálat).

(Pl.: két párhuzamos osztályban ugyanazt a tananyagot más-más módszerrel tanítják, majd a tanítási folyamat végén ugyanazon teszten mérik a két osztályt. A vizsgálat arra keresi a választ, hogy a két módszer eredményessége között van-e lényeges különbség.)

Jele: t"

Csak akkor végezhető el, ha a két mérés eredményének varianciája (szórásnégyzete) között nincs jelentős (szignifikáns) eltérés.

Ezt az F-próba adja meg.

 

F-próba:

F értékének szignifikancia-vizsgálata:

Az F próba táblázatában két szabadságfok (=minta elemszáma-1) van:

1. az 1. minta elemszáma-1

2. a 2. minta elemszáma-1

- ha F>Ftáblázat, akkor a varianciák különbsége nem a véletlen hatása, vagyis a különbség szignifikáns, tehát a kétmintás t-próba nem végezhető el!! Ekkor a t-próba helyett pl. a Welch-próbát szokták alkalmazni.

- ha F<Ftáblázat, akkor az átlagok különbsége a véletlen hatása, vagyis a különbség nem szignifikáns, tehát a kétmintás t-próba elvégezhető!!

 

A kétmintás t" értékének szignifikancia-vizsgálata:

A t" próba táblázatában n+m-2 (=a két minta elemszámának összege-2) szabadságfoknál kell keresni a megfelelő értéket:

- ha t">ttáblázat, akkor az átlagok különbsége nem a véletlen hatása, vagyis a különbség szignifikáns,

- ha t"<ttáblázat, akkor az átlagok különbsége a véletlen hatása, vagyis a különbség nem szignifikáns.

 

Variancia analízis: az a statisztikai eljárás, melynek segítségével több egydimenziós minta ugyanazon változója közötti különbség szignifikaszintjét határozza meg.

(Pl.: három párhuzamos osztályban ugyanazt a tananyagot más-más módszerrel tanítják, majd a tanítási folyamat végén ugyanazon teszten mérik a három osztályt. A vizsgálat arra keresi a választ, hogy a három módszer eredményessége között van-e lényeges különbség.)

 

A variancia-analízis a következő eljárások sorozatát jelenti:

- belső variancia vizsgálat (egy-egy mintán /pl. osztály/ belüli variancia vizsgálat).

Jele: S2belső

- külső variancia vizsgálat (minták /pl. osztályok/ közötti variancia vizsgálat)

Jele: S2külső

- hipotézisvizsgálat F-próbával:

 

F értékének szignifikancia-vizsgálata:

Az F próba táblázatában két szabadságfok (=minta elemszáma-1) van:

3. az 1. minta elemszáma-1

4. a 2. minta elemszáma-1

- ha F>Ftáblázat, akkor a varianciák különbsége nem a véletlen hatása, vagyis a különbség szignifikáns.

Másképpen: az egyes módszerek lényeges teljesítményváltozást eredményeznek.

- ha F<Ftáblázat, akkor különbségek a véletlen hatásának tulajdoníthatóak, vagyis a különbségek nem szignifikánsak. Másképpen: az egyes módszerek nem eredményeznek lényeges teljesítményváltozást.

 

Korreláció-számítás

- Többdimenziós mintáról beszélünk akkor, ha a minta egyes elemeiről egyszerre legalább két adat áll rendelkezésünkre. (Pl. : ismerjük a tanulók szüleinek iskolai végzettségét és egy teszten az egyes tanulók által elért eredményt, vagy ugyanazon tanulók kémia és matematika teszteredményét, stb.)

- A korreláció-számítás az egyes adatcsoportok eloszlása közötti összefüggést tárja fel.

- A változók közötti összefüggés esetei:

- két változó pozitív korrelációja (r>0): ha az egyik változó magas értékeihez a másik változó magas értékei, ill. az egyik változó alacsony értékeihez a másik változó alacsony értékei tartoznak. (Pl.: A jó kémia tesztet írók jó matematika tesztet, míg a gyenge kémia tesztet írók gyenge matematika tesztet írnak.)

- két változó negatív korrelációja (r<0): ha az egyik változó magas értékeihez a másik változó alacsony értékei, ill. az egyik változó alacsony értékeihez a másik változó magas értékei tartoznak. (Pl.: A jó kémia tesztet írók gyenge nyelvtan tesztet, míg a gyenge kémia tesztet írók jó nyelvtan tesztet írnak.)

- két változó korrelálatlan: ha az egyik változó magas értékeihez egyes esetekben a másik változó magas, egyes esetekben alacsony értékei tartoznak. Ez sem jelenti feltétlenül a két adatsor függetlenségét, esetenként csak arról van szó, hogy a kapcsolat nem lineáris.

- A minta két változója szimmetrikus: egyiknek sincs kitüntetett szerepe a másikkal szemben. Vagyis a korreláció-analízis nem tárja fel azt, hogy a két adat közül melyik van hatássál a másikra.

- Korrelációs együttható:

Jele: rxy

- A korrelációs együttható szignifikancia-vizsgálata:

A korrelációs együttható táblázatában n-1 (=a minta elemszáma-1) szabadságfoknál kell keresni a megfelelő értéket:

- ha |rxy|>rtáblázat, akkor a minta két változója közötti összefüggés nem a véletlen hatása, vagyis az összefüggés általánosítható.

- ha |rxy|<rtáblázat, akkor a minta két változója közötti összefüggés a véletlen hatása, vagyis az összefüggés nem általánosítható.