Klassikaline testiteooria

Klassikaline testiteooria / Eksperimentaalne psühholoogia

Test on a teaduslik vahend niivõrd, kuivõrd see mõõdab, mida ta kavatseb, see tähendab, et see on kehtiv, ja see mõõdab hästi, see tähendab, et see on täpne või usaldusväärne. Kui leiame vahendi, mida me ei saa usaldada nende poolt pakutavate meetmetega, sest need erinevad aeg-ajalt, kui me mõõdame sama objekti, siis ütleme, et see ei ole usaldusväärne. Mõõta vahend korralikult midagi, see peab olema täpne, sest vastasel juhul mõõtke, mida mõõdate, mõõtke valesti. Seega on täpne täpsus vajalik, kuid mitte piisav tingimus. Lisaks peab see olema kehtiv, st see, mida see täpselt mõõdab, on see, mida kavatsetakse mõõta, ja mitte midagi muud.

Samuti võite olla huvitatud: üksuse vastusteooria - rakendused ja test

Usaldusväärsus:

Absoluutne ja suhteline usaldusväärsus: katse usaldusväärsuse probleemi võime lahendada kahel erineval viisil, kuigi taustal nad kattuvad.

Usaldusväärsus kui mõõtmiste ebatäpsus: kui subjekt reageerib testile, saab ta empiirilise skoori, mida mõjutab viga. Kui viga polnud, saab teema tõelise tulemuse. Test on ebatäpne, sest empiiriline skoor ei vasta tegelikule tõele. See erinevus mõlema skoori vahel on prooviviga, mõõteviga. The tüüpiline mõõtmisviga on mõõtevigade standardhälve. The tüüpiline mõõtmisviga näitab testi absoluutset täpsust, kuna see võimaldab hinnata saadud mõõtmise ja selle vahel, mida viga ei oleks saavutatud.

Usaldusväärsus kui mõõtmiste stabiilsus: Test on usaldusväärsem, seda püsivam või stabiilsem tulemused, mida see kordub. Mida stabiilsem on tulemused kahel korral, seda suurem on nende omavaheline korrelatsioon. Seda korrelatsiooni nimetatakse usaldusväärsuse koefitsient. See väljendab meid, mitte vea suurust, vaid testi ühtsust iseenesest ja pakutava teabe püsivust. The usaldusväärsuse koefitsient väljendab testi suhtelist usaldusväärsust.

Usaldustegur ja usaldusväärsuse indeks: - Usaldusvõime koefitsient katse on katse korrelatsioon iseendaga, mis on saadud näiteks kahes paralleelses vormis: rxx. - Täpsusindeks on korrelatsioon katse empiiriliste skooride ja tegelike tulemuste vahel: rxv Täpsusindeks on alati suurem kui usaldusväärsuse koefitsient, usaldusväärsuse koefitsiendi väljaselgitamiseks on need kolm klassikalist meetodit väärt:

  • Leidke korrelatsioon katse ja selle kordamise vahel: kordamise või testimise kordamise meetod: see hõlmab sama testi rakendamist samale rühmale kahel korral ja arvutatakse kahe seeriate vahelise seose korrelatsioon. See korrelatsioon on usaldusväärsuse koefitsient. See meetod annab tavaliselt suurema töökindluse koefitsiendi kui teistel protseduuridel saadud ja võib olla häirivate teguritega saastunud.
  • Leidke korrelatsioon testi kahe paralleelse vormi vahel: paralleelsete vormide meetod: valmistage ette kaks sama paralleelset vormi, st kaks samaväärset vormi, mis annavad sama informatsiooni ja kehtivad samale subjektirühmale. Kahe vormi korrelatsioon on usaldusväärsuse koefitsient. Selle meetodi abil välditakse sama katse kordamist, vältides häirivaid uuesti testimise usaldusväärsuse allikaid.
  • Leidke katse kahe paralleelse poole vaheline korrelatsioon: kahe poole meetod: Test jagatakse kaheks võrdseks pooleks ja nende vahelise korrelatsiooni vahel. See on eelistatud meetod, kuna see on lihtne ja eirab eelmiste protseduuride piiranguid. Te saate valida katse paaritu elemendid, et moodustada pool, ja paarielemendid, mis moodustavad teise.

Usaldusvõime koefitsient ja korrelatsioon paralleelsete testide vahel

The usaldusväärsuse koefitsient katse näitab, et tegelik dispersioon on empiirilisest dispersioonist: graphic33 Katse usaldusväärsuse koefitsient varieerub 0 ja 1 vahel. Näiteks: kui kahe paralleelse testi korrelatsioon on rxx´ = 0,80, tähendab, et 80% katse variatsioonist on tingitud tegelikust mõõtmisest ja ülejäänu, st 20% katse variatsioonist on tingitud veast. The usaldusväärsuse indeks katse on korrelatsioon selle empiiriliste skooride ja tegelike tulemuste usaldusväärsuse indeksi vahel. Usalduse indeks on võrdne usaldusväärsuse koefitsiendi ruutjuurega

Kui kaks paralleelset testi vormi on välja töötatud, rakendatakse dispersioonianalüüsi protseduuri, et kontrollida erinevuste homogeensust ja meetmete erinevust. Kui variatsioonid on homogeensed, ei ole vahendite vaheline erinevus märkimisväärne ja need kaks vormi on konstrueeritud sama palju sama tüüpi ja psühholoogilise sisuga elemente, võib öelda, et need on paralleelsed. Kui ei, siis peate neid reformima, kuni nad on. Usaldusväärsuse puudumine tuvastatakse rxx väärtusega´= 0 4.- Tüüpiline mõõtmisviga: Erinevus empiirilise ja reaalse skoori vahel on juhuslik viga, mida nimetatakse mõõtmisveaks. Mõõtmisvigade standardhälvet nimetatakse tüüpiliseks mõõtevigaks. The tüüpiline mõõtmisviga võimaldab teha hinnanguid testi absoluutse usaldusväärsuse kohta, st hinnata, kui palju mõõtmisviga skoori mõjutab.

Usaldusväärsus ja pikkus: katse pikkus viitab selle elementide arvule. Usaldusväärsus sõltub sellest pikkusest. Kui katse koosneb kolmest elemendist, võib subjekt saada ühe skoori 1 ja teises või paralleelselt skooriga

Ühest juhust teise on skoor muutunud ühe punkti võrra; üle kolme punkti on 33% variatsioon, suur variatsioon. Kui subjektid saavad sellist tüüpi juhuslikke variatsioone, väheneb oluliselt katse korrelatsioon ise või katse kahe paralleelse vormiga ja ei saa olla kõrge. Kui test on palju pikem, kui teil on näiteks 100 objekti, saab teema ühel korral 70 punkti ja paralleelselt 67 punkti. Ühelt poolt on see muutunud 3 punkti; see on suhteliselt väike variatsioon kogu katse suhtes, eriti 3%. Sellised suured juhuslikud muudatused, mis esinevad subjektide punktides, kui nad liiguvad ühelt vormilt paralleelsele, on suhteliselt ebaolulised ja ei vähene nii palju kui enne mõlema.

Usaldusväärsuse koefitsient on palju suurem kui eelmisel juhul. Spearman-Brown'i võrrand väljendab seost usaldusväärsuse ja pikkuse vahel. Katse täpsus on null, kui pikkus on 0 ja see suureneb, kui pikkus suureneb. Kuigi kasv on suhteliselt väiksem, mille pikkus on suurem. See tähendab, et täpsus kasvab alguses ja suhteliselt vähem hiljem. Kui pikkus kipub lõpmatuseni, kaldub usaldusväärsuse koefitsient

Katse pikkuse suurendamisega suureneb selle täpsus, sest see suurendab tõelist variatsiooni kiirusega, mis on kõrgem kui veavariatsioon. See tähendab, et katse täpsus suureneb, sest vea tõttu tekkinud dispersiooni osakaal väheneb. Ruloni valem, samuti Flanagani ja Guttmani valem on eriti kasutatavad usaldusväärsuse koefitsiendi arvutamisel kahe poole meetodil. Need on valemid, mida kasutatakse usaldusväärsuse koefitsiendi arvutamiseks.

Usaldusväärsus ja järjepidevus: usaldusväärsuse koefitsienti võib leida ka muul viisil, see on nn alfa koefitsient o üldistatavuse koefitsient või representatiivsus (Cronbach). See alfa koefitsient näitab täpsust, millega mõned elemendid mõõdavad isiksuse või käitumise aspekti. Seda võib tõlgendada järgmiselt: kõigi võimalike objektide keskmise korrelatsiooni hinnang teatud aspektis. Katse täpsuse mõõt vastavalt selle sidususele või sisemisele järjepidevusele (selle elementide omavaheline seos, mil määral katseelemendid on kõik sama) ja selle pikkus. Katse representatiivsuse näitamine, see on summa, mille ulatuses moodustab ta moodustavate esemete valimi sama tüüpi ja psühholoogilise sisu võimalike üksuste populatsiooni. The alfa koefitsient peegeldab peamiselt kahte täpsemat analüüsi: 1. nende elementide omavaheline seos: millises ulatuses nad kõik mõõdavad sama asja.

Katse pikkus: proovi juhtumite arvu suurendamisel ja kui süstemaatilised vead kõrvaldatakse, esindab valim elanikkonda paremini kui see eraldatakse ja on ebatõenäoline, et juhuslik viga on seotud. Kui katse elemendid on dikotoomsed (jah või ei, 1 või 0, kokkulepe või lahkarvamused jne), on alfa-koefitsiendi võrrand lihtsustatud, mille tulemuseks on võrrandid Kuder-Richardson (KR20 ja KR21). Arvestades teatud arvu punkte, on test usaldusväärsem, kui see on homogeensem. Alfa koefitsient annab meile usaldusväärsuse, kuna see esindab katse elementide homogeensust ja järjepidevust või sisemist järjepidevust.

Standardid ja usaldusväärsuse kriteeriumid

Objektide näidisruumi mudeli kohaselt on katse eesmärk hinnata mõõdet, mis saadakse, kui kasutataks kõiki proovi ruumi elemente. See meede oleks tõeline tulemus, millele tegelikud mõõtmised lähevad rohkem või vähem. Sõltuvalt sellest, mil määral ühikute valim korreleerib tegelike tulemustega, on test enam-vähem usaldusväärne. Selles mudelis on keskse tähtsusega kõigi prooviruumi elementide vaheliste korrelatsioonide maatriks, mis näitab otsesemalt sisemist järjepidevust ja tagab selle kaudselt stabiilsuse..

Paralleelsete testide lineaarne mudel nõuab rohkem tulemuste stabiilsust ja sel määral, kui see saavutab stabiilsuse, soodustab see kaudselt sisemist järjepidevust. Kui rakendame testi individuaalsete diagnooside ja prognooside koostamiseks, peaks usaldusväärsuse koefitsient olema 0.90. Prognoosides ja kollektiivsetes klassifikatsioonides ei ole mitte niivõrd nõue, kuigi 0'90-st kuni 0'80-ni on palju ära pääseda.

Mõnikord on teatud tüüpi testides, näiteks isiksuse testides, raske saavutada koefitsiente üle 0,70. Kui paralleelsed vormid või paralleelsed pooled rakendatakse pärast enam-vähem suurt intervalli, võivad juhuslikud vead olla arvukamad kui need, mis mõjutavad alfa koefitsienti. Seda seetõttu, et see, mis vähendab korrelatsiooni, ei ole mitte ainult testile omased juhuslikud vead ja ühel korral, mis võtavad arvesse alfa koefitsienti, vaid mõjutavad ka kõiki vigu, mis võivad tuleneda kahest erinevast olukorrast. , mis võib erineda. Seetõttu on alfa koefitsient tavaliselt suurem kui teised koefitsiendid.

Välja arvatud sama koefitsiendi kordamisel leitud koefitsient, kuna on suurem tõenäosus, et esimese rakenduse juhuslikud vead korratakse teises ja selle asemel, et vähendada nende kahe korrelatsiooni, suurendage seda. Tuleb tagada, et teine ​​rakendus oleks esimesest täielikult sõltumatu. Selle saavutamisel on see kõige lihtsam ja odavaim meetod ning soovitatav, kui hindate skooride stabiilsust, eriti pika aja jooksul ja keeruliste testidega. > Järgmine: Testide kehtivus

See artikkel on puhtalt informatiivne, Online-psühholoogias ei ole meil oskust diagnoosida ega soovitada ravi. Kutsume teid üles pöörduma psühholoogi poole, et ravida teie juhtumit.

Kui soovite lugeda rohkem sarnaseid artikleid Klassikaline testiteooria, Soovitame sisestada meie eksperimentaalse psühholoogia kategooria.