185 Kreativní řešení problémů: schopnosti žáků řešit problémy z reálného života – V. díl ovlivněny souvislostí mezi formáty s výběrem odpovědi nebo tvořenou odpovědí a konkrétními skupinami otázek. Standardní chyby odhadů a testy statistické významnosti Statistika v této zprávě představuje odhady národního výkonu založené na výběrech žáků, ne na hodnotách, kterých bychom se dopočítali, kdyby každý žák v každé zemi odpověděl na každou otázku. Proto je důležité měřit stupeň nejistoty odhadů. V šetření PISA má každý odhad přiřazený stupeň nejistoty, který je vyjádřen jeho standardní chybou. Pro závěry o průměrech a proporcích populace způsobem, který odráží neurčitost spojenou s odhady z výběru se využívají intervaly spolehlivosti. Z hodnoty vypočítané z výběru a při předpokladu normálního rozdělení můžeme vyvodit, že odpovídající výsledek dané populace bude ležet v intervalu spolehlivosti v 95 ze 100 replikací měření na různých výběrech stejné populace. V mnoha případech čtenáře primárně zajímá, jestli se daná hodnota v konkrétní zemi liší od druhé hodnoty ve stejné nebo jiné zemi, např. jestli si dívky v jedné zemi vedou lépe než chlapci ve stejné zemi. V tabulkách a grafech použitých v této zprávě jsou rozdíly označeny jako statisticky významné, pokud by menší či větší rozdíl té velikosti byl pozorován v méně než 5 % případů, kdyby skutečně nebyly žádné rozdíly v odpovídajících hodnotách populace. Podobně se riziko, že bude korelace uváděna jako významná, když ve skutečnosti žádná korelace mezi dvěma mírami není, drží na úrovni do 5 %. V celé zprávě jsou prováděny testy významnosti, které hodnotí statistickou významnost prováděných porovnávání. Rozdíly mezi pohlavími a rozdíly mezi průměry podskupin Byla testována statistická významnost rozdílů výsledků žáků a jiných indexů podle pohlaví. Kladné rozdíly ukazují na vyšší skóry pro chlapce, zatímco záporné rozdíly indikují vyšší skóry pro dívky. V tomto dílu jsou rozdíly vyznačené v tabulkách tučným písmem statisticky významné s 95% spolehlivostí. Podobně byla testována statistická významnost rozdílů mezi ostatními skupinami žáků (např. rodilí žáci a žáci s přistěhovaleckým původem). Definice podskupin najdete v doprovodných tabulkách a textech. V příloze B této zprávy jsou všechny rozdíly vyznačené v tabulkách tučným písmem statisticky významné na úrovni 95 %. Rozdíly mezi průměry podskupin po započtení ostatních proměnných U mnoha tabulek bylo porovnání podskupin provedeno jak na pozorovaném rozdílu („před započtením ostatních proměnných“), a tak po započtení ostatních proměnných, jako je Index PISA uvádějící ekonomický, sociální a kulturní status žáků (ESCS). Uzpůsobené rozdíly byly odhadnuty za použití lineární regrese a testovány na významnost s 95% spolehlivostí. Statisticky významné rozdíly jsou vyznačeny tučným písmem. Výkonností rozdíly mezi horním a spodním kvartilem indexů a škál PISA Byla testována i statistická významnost rozdílů v průměrném výkonu mezi horní a spodní čtvrtinou indexů a škál PISA. Čísla vyznačená tučně ukazují, že průměrný výkon horní a spodní čtvrtiny žáků na příslušném indexu je statisticky významně odlišný s 95% spolehlivostí.