Toetsen en beoordelen – Wat komt er allemaal bij kijken?

Voor de Beroepscomponent leerkracht ben ik bezig om het onderwerp toetsen te herzien door deze beter aan te laten sluiten bij nieuwe ontwikkelingen rondom competentiegericht onderwijs.

Bron: Bies, Flickr.com

Naast de formele documenten vanuit ons college, kwam ik in mijn zoektocht naar achtergrondinformatie een mooi document tegen van de Hogeschool van Amsterdam over toetsen en beoordelen.

Een aantal quotes wil ik graag delen die ik in ieder geval meeneem in mijn denkproces over toetsen en beoordelen:

Wat is toetsen?
Onder toetsen verstaan we: het systematisch verzamelen van informatie over iemands kennis, vaardigheden, inzicht en/of attitude, competentieniveau en het geven van een oordeel daarover.

Een mooie definitie waarin zowel kennis als vaardigheid, maar ook het competentieniveau meegenomen wordt.

Constructive alignment
Toetsen bepalen de manier waarop studenten leren. Als een toets gericht is op het kunnen reproduceren van kennis, leren zij de lesstof uit het hoofd. Als een toets vraagt om dieper inzicht, zet die hen aan tot diepgaand leren. Dit fenomeen heet het ‘washback-effect’. Docenten en ontwikkelaars van toetsen kunnen dit gedrag van studenten betreuren, maar er ook handig gebruik van maken. Immers: door vooraf goed na te denken over het wat, hoe, wanneer en door wie getoetst en beoordeeldwordt en hierin slimme keuzes te maken, kunnen zij het leerproces van studenten sterk beïnvloeden.

Kleine veranderingen in de onderlinge afstemming van onderwijs en toetsing leiden soms tot grote veranderingen in de leerprestaties van studenten. Voor de ontwikkeling van onderwijs betekent dit dat het verstandig is om al in een vroeg stadium – dus zodra de leerdoelen van een studieonderdeel zijn vastgesteld – na te denken over de wijze van toetsen. Daarna volgt pas de selectie van de meest geschikte werkvormen. Het op een lijn plaatsen van de leerdoelen, de wijze van toetsing en de inhoud en werkvormen van een studieonderdeel noemen we constructive alignment.

Interessant in bovenstaande stuk is het wash-back-effect, oftewel: de manier van toetsing beïnvloedt de manier waarop en de mate waarin diepte leren plaatsvindt. Bovenstaand effect is natuurlijk niet nieuw, maar blijkbaar is er een mooie term voor: het wash-back effect!

Verderop in het document gaat men in op leerdoelen en de keuze voor toets(vormen):

De volgende indeling in soorten leerdoelen is – met het oog op toetsing – een zeer bruikbare:

  1. discrete leerdoelen: deze zijn gericht op kennis, vaardigheden en attitudesen gekoppeld aan afzonderlijke studieonderdelen. Hierbij gaat het om de vakspecifieke kennis of vaardigheden waarover studenten na een bepaalde periode moeten beschikken;
  2. generieke leerdoelen: deze zijn gericht op generieke vaardigheden, die in de loop van de studie tijdens meerdere studieonderdelen worden ontwikkeld, zoals ‘zelfstandig leren’, ‘samenwerken’ of ‘onderzoeken’. Deze leerdoelen zijn niet gebonden aan een bepaald programmaonderdeel of bepaalde periode;
  3. gesitueerde leerdoelen: deze zijn gericht op het beroepsmatig handelen in (al dan niet gesimuleerde) beroepssituaties;
  4. integrale leerdoelen: deze zijn gericht op competentieontwikkeling; op de wijze waarop de student competent handelt in de voor het beroep kenmerkende en kritische situaties en contexten.

Bij de toetsing van discrete en generieke leerdoelen wordt gelet op de bouwstenen van (een) competentie(s), terwijl bij gesitueerde en integrale leerdoelen meer gekeken wordt naar het niveau van handelen. Dan zijn vooral de competenties als geheel in beeld en bestaat het leerdoel uit een te bereiken ‘eindniveau’. Aan dit eindniveau wordt het werkelijke niveau van de student afgemeten: bevindt hij zich nog op een beginnersniveau of al op het niveau van een startbekwame professional?

Bovenstaande indeling is nieuw voor mij en geeft een duidelijke link tussen het toetsen van kennis en/of vaardigheid en competenties.

Ook over het wel of niet geven van cijfers geeft het document een mooie onderbouwing van waarom men wel cijfers geeft:

De waardering: cijfers of anderszins?
Hoewel er ook andere vormen van waardering zijn, zoals ‘onvoldoende, voldoende, goed en excellent, blijft het toekennen van cijfers nog steeds de meest belangrijke wijze van waarderen. De voornaamste redenen daarvoor zijn:

  1. selectie; het onderscheid tussen excellente, goede, betere en voldoende presterende studenten heeft onder meer gevolgen voor de aanname bij vervolgstudies en voor hun entree op de arbeidsmarkt. Ook is de hoogte van een cijfer vaak van invloed bij de toekenning van (internationale) beurzen of andere vormen van financiële ondersteuning.
  2. motivatie; het onderscheid stimuleert studenten zich te verbeteren of het hoge niveau te behouden.

Zeer bruikbaar is ook het onderdeel over de kwaliteit van toetsen in hoofdstuk 4: validiteit, betrouwbaarheid en authenticiteit. Hierbij splitst met authenticiteit op in twee onderdelen:

Bij authenticiteit gaat het in de eerste plaats om representativiteit. Dit betekent dat de toets een zo goed mogelijke afspiegeling is van de praktijk, wat blijkt uit het type opdracht, de toetssituatie en de betrokken partijen. In de tweede plaats gaat het erom dat de prestatie daadwerkelijk is geleverd door de student (zelf). Is het daadwerkelijk zijn aanpak, zijn handschrift, zijn werkstijl die hier wordt gedemonstreerd.

Een mooi document waarvan ik de inzichten zeker kan gebruiken in de voorbereidingen van de les over toetsen voor de Beroepscomponent leerkracht.