Artiklen tager udgangspunkt i et notat fra 2016 (pdf), som Undervisningsministeriet har sendt til Folketingets Børne- og Undervisningsudvalg, som også kan findes på Folketingets hjemmeside. Man kan ikke på baggrund af notatet konkludere, at der er fejl i halvdelen af testene, som Politiken skriver.
*artiklen er opdateret med nyt notat om de nationale test fra 10. april 2019.
Notat om de nationale test 10. april 2019 (pdf)
Undervisningsministeriets faglige vurdering
Et centralt kritikpunkt er en tabel i notatet, som viser sammenhængen mellem to resultater i to nationale test, som en elev har taget med relativt kort mellemrum.
Hovedresultaterne i tabellen er nævnt i rapportens sammenfatning, men ikke i alle detaljer. Notatet viser samlet set, at korrelationen totalt set er ”acceptabel” mellem elevens samlede vurdering i forsøg 1 og forsøg 2. Der er samtidig en række faglige forklaringer på, hvorfor resultatet er, som det er, og hvorfor den omtalte tabel ikke er uddybet i sammenfatningen.
Tabellen viser ganske rigtigt, at der på 19 ud af 30 profilområder er en relativt lav sammenhæng (korrelationskoefficient) mellem 1. og 2. testresultat. Alle sammenhængene er dog statistisk signifikante. Det betyder, at de elever, der får de bedste resultater i 1. test, også er blandt de bedste i 2. test.
Den relativt lave sammenhæng er ikke en central pointe, og ministeriets faglige vurdering var, at pointen ikke kan generaliseres. Det var ministeriets faglige vurdering i 2016, og det er det stadig.
Det skyldes, at elevernes adfærd og lærernes instruktion har meget stor betydning for sammenhængen mellem 1. og 2. test. Elevens motivation og koncentration samt det antal dage, der går mellem de to gentagelser, har stor betydning. Faktisk større betydning end selve testsystemets udformning.
De svageste statistiske sammenhænge gør sig især gældende i de test, hvor det er mest forventeligt. Sammenhængen er svagest i de test med færrest deltagere, og hvor spredningen i resultaterne er mindst. Mindre spredning betyder i sig selv, at korrelationskoefficienten bliver lavere. Det fremgår også af side 10 i samme rapport.
Som opfølgning på notatet fra februar 2016 har Undervisningsministeriet dels genberegnet korrelationerne i notatet, hvor kun elever, der har gentaget testen inden for syv dage, er medtaget. Der er også lavet tilsvarende beregninger på baggrund af simuleringer. Simuleringer har den fordel, at de ikke er påvirket af elevernes aktuelle testadfærd. Disse afspejler således bedre de reelle forhold ved teknikken (algoritmen) i de nationale test. Disse beregninger findes i notatet: De nationale tests måleegenskaber (pdf) og er også sendt til Folketinget.
Samtidig er det ministeriets faglige vurdering, at det er mere relevant at se på sammenhængen mellem testresultater og andre resultater for eleverne. På vores hjemmeside er der flere andre rapporter om måleegenskaberne ved de nationale test. For eksempel har vi set på sammenhængen mellem nationale test og elevernes resultater i PISA-undersøgelserne og ved folkeskolens afgangsprøver. I begge tilfælde er der en udmærket sammenhæng mellem resultater fra de nationale test og andre test og prøver. Læs mere i vores undersøgelser om nationale test.
Intet har været holdt skjult
Der har ikke været holdt noget skjult. Rapporten ligger på Folketingets egen hjemmeside, fordi den er sendt til Børne- og Undervisningsudvalget. De efterfølgende notater og beregninger er også offentligt tilgængelige.
I efteråret 2016 afholdt Folketingets Børne- og Undervisningsudvalg en offentlig høring om testene. Her deltog blandt andre professor Jeppe Bundsgaard, som eksplicit gennemgik den ovenfor nævnte tabel fra side 10 i Undervisningsministeriets rapport fra februar 2016 (se side 4 i Jeppe Bundsgaards præsentation (pdf).
Alt materiale og video ligger på Folketingets hjemmeside.
Grundig evaluering
Undervisningsministeren har i januar 2018 sat en grundig evaluering af de nationale test i gang. Evalueringen skal skabe et solidt og kvalificeret grundlag for at tage stilling til den fremadrettede udvikling og brug af de nationale test. Både i forberedelsen af evalueringen, under og efter bliver relevante eksperter, interessenter og praktikere inviteret til at bidrage. Inddragelsen skal sikre, at evalueringen tager højde for både kritik, udfordringer, ønsker og behov i forhold til de nationale test.