Slovníček pojmů
Alternativy
představují všechny nabízené odpovědi (správné i nesprávné) v úlohách s výběrem odpovědi. Nesprávné odpovědi jsou označovány pojmem distraktory.
Distraktory
představují nesprávné nabízené odpovědi v úlohách s výběrem odpovědi. Všechny odpovědi (správné i nesprávné) se označují pojmem alternativy.
Úspěšnost žáků v testové úloze
vyjadřuje v procentech podíl žáků, kteří úlohu úspěšně vyřešili, a všech testovaných žáků. Pokud je například úspěšnost žáků v testové úloze 80 %, znamená to, že úlohu vyřešilo správně 80 % žáků z celkového počtu testovaných žáků.
V případě, že úloha připouští částečně správné řešení, upravuje se počet žáků podle četnosti jednotlivých bodových ohodnocení úlohy. Pokud je například testová úloha hodnocena 2 body za zcela správné řešení a 1 bodem za částečně správné řešení a pokud 40 % žáků dalo zcela správnou odpověď a 40 % žáků částečně správnou odpověď, celková úspěšnost žáků v dané testové úloze je 60 % (z žáků, kteří dali částečně správnou odpověď za 1 bod, do výpočtu vstoupí pouze polovina).
Pojem úspěšnost se používá ve vztahu k populaci, která řešila danou úlohu, zatímco pojem obtížnost se používá ve vztahu k dané testové úloze. Pro úplnost se mohou rozlišovat tři druhy úspěšností žáků v testové úloze:
- čistá úspěšnost – podíl žáků, kteří úlohu vyřešili správně (respektive částečně správně), a všech testovaných žáků
- korigovaná úspěšnost – podíl žáků, kteří úlohy dosáhli a vyřešili ji úspěšně, a všech testovaných žáků (z výpočtu jsou vyloučeni žáci, kteří se k řešení úlohy nedostali za předpokladu, že řešili úlohy v tom pořadí, v jakém byly uvedeny v testovém sešitu)
- hrubá úspěšnost – podíl žáků, kteří úlohu vyřešili zcela správně, a všech testovaných žáků (v případě, že úloha umožňuje částečně správné řešení, jsou do výpočtu zařazeni pouze ti žáci, kteří odpověděli zcela správně a získali plný počet bodů)
Obtížnost testové úlohy
je odvozena od počtu žáků, kteří dali správnou odpověď na danou úlohu, je vyjádřena desetinným číslem. Pokud je například obtížnost úlohy 0,65, znamená to, že ze všech získaných odpovědí na danou úlohu bylo 65 % správných. Pojem obtížnost úlohy se používá jako jedna z charakteristik testové úlohy. Využívá se k celkovému posouzení vhodnosti zařazení úlohy do testu.
Diskriminační schopnost testové úlohy (citlivost testové úlohy)
vypovídá o schopnosti úlohy rozlišovat mezi žáky s většími znalostmi a dovednostmi a žáky s menšími znalostmi a dovednostmi. K rozlišení žáků na „lepší“ a „slabší“ se většinou používá jejich celkový výsledek v testu. Vysokou citlivost má taková úloha, kterou řeší „lepší“ žáci podstatně úspěšněji než žáci „slabší“. V případě, že jsou v řešení úlohy úspěšnější „slabší“ žáci, obsahuje úloha pravděpodobně nějakou konstrukční chybu.
Diskriminační schopnost souvisí s ostatními charakteristikami testové úlohy, například s obtížností. Při interpretaci je proto nutné vzít v úvahu všechny psychometrické charakteristiky úlohy.
Diskriminační schopnost úlohy se nejčastěji vyjadřuje následujícími třemi způsoby:
- Diskriminace RIR
- Diskriminace
- Grafické vyjádření diskriminace
Diskriminace RIR
se vypočítá jako Pearsonův lineární korelační koeficient mezi skóre dosaženém v dané testové úloze a celkovým skóre (při vyloučení dané úlohy). Nabývá hodnot od -1 do 1. Čím blíže je hodnota krajním pólům intervalu <-1;1>, tím silnější je vzájemný vztah mezi úspěšností v dané úloze a úspěšností ve zbytku testu. Záporné hodnoty znamenají, že žáci, kteří správně řešili danou testovou úlohu, dosáhli spíše nízkého celkového skóre ve zbytku testu, a naopak. Kladné hodnoty svědčí o tom, že žáci úspěšní v řešení dané úlohy byli rovněž úspěšní při řešení ostatních úloh, tj. celého testu. Aby bylo možné označit úlohu za přiměřeně citlivou, měla by diskriminace RIR dosahovat nejméně hodnoty 0,25-0,3.
Diskriminace
je rozdíl úspěšnosti skupiny nejlepších žáků a nejhorších žáků v úloze. Při výpočtu se postupuje následujícím způsobem: žáci se uspořádají podle celkového skóre do pořadí od nejlepších po nejhorší, rozdělí se na pět stejně početných skupin, pro každou skupinu se vypočítá úspěšnost žáků v řešení dané testové úlohy a následně se odečte úspěšnost nejhorší skupiny od úspěšnosti nejlepší skupiny.
Grafické znázornění diskriminace
znázorňuje úspěšnost žáků v testové úloze v závislosti na jejich celkovém skóre. Při vytváření grafu se postupuje následujícím způsobem: žáci se uspořádají podle celkového skóre do pořadí od nejlepších po nejhorší, rozdělí se na pět stejně početných skupin, pro každou skupinu se vypočítá úspěšnost žáků v řešení dané testové úlohy a úspěšnosti se nanesou do grafu. Propojením bodů vyjadřujících úspěšnosti žáků jednotlivých skupin v řešení úlohy vznikne diskriminační křivka.
Průměrné skóre
vyjadřuje průměrný počet dosažených bodů v testu / souboru testových úloh. Za každou správně vyřešenou úlohu v testu získává žák určité bodové ohodnocení. Součet všech bodů, které je možné v testu získat, označujeme jako maximální (nejvyšší možné) dosažitelné skóre. Pro každého žáka je vypočteno individuální skóre (součet dosažených bodů). Průměrné skóre se pak vypočítá jako součet skóre jednotlivých žáků dělený jejich počtem (tedy jako aritmetický průměr).
Průměrná úspěšnost
vyjadřuje v procentech poměr průměrného skóre a maximálního (nejvyššího možného) dosažitelného skóre. Pokud je například průměrné skóre 25 a nejvyšší možné skóre 50, pak je průměrná úspěšnost žáků v testu / souboru testových úloh rovna 50 %.
Reliabilita testu / souboru testových úloh
představuje míru přesnosti a spolehlivosti testu. Pouze test, který měří přesně a spolehlivě, poskytuje směrodatné informace o úrovni znalostí a dovedností žáků. Přesné měření znamená, že výsledek v testu vypovídá o skutečných znalostech a dovednostech žáků. Spolehlivé měření znamená, že test poskytuje stabilní, opakovatelné výsledky. K výpočtu reliability se nejčastěji používají vzorce KR-20, L2 nebo Cronbachovo alfa.