Zephyrnet-logo

Is het tijd om het traditionele beoordelingssysteem te heroverwegen?

Datum:

Robert Talbert is een wiskundeprofessor, dus cijfers zijn zijn ding. En de manier waarop het beoordelingssysteem in het onderwijs werkt, zit hem al lang dwars.

Dat werd een paar jaar geleden duidelijk, toen een bijzonder slimme student in een calculusklas die Talbert lesgaf, het eerste examen bombardeerde. De student kende de stof, maar ze was gewoon geen goede testpersoon. Haar score op dat examen was zelfs zo laag dat ze besefte dat ze geen kans had om een ​​tien te halen voor de cursus, hoe goed ze het ook zou doen bij toekomstige toetsen en opdrachten. Hetzelfde gebeurde bij het tweede examen, en nu kon de student het in de klas op geen enkele manier beter doen dan een C.

"Gaandeweg putten deze quizzen en tests en getimede beoordelingen en de manier waarop het allemaal in elkaar past met punten en gemiddelden haar gewoon uit", zegt Talbert. "Al snel deed ze raar in de klas en zei ze hardop: 'Ik zie niet in waarom dit er toe doet.'"

Ze viel uiteindelijk uit de klas en Talbert heeft haar nooit meer gezien.

Daarna beloofde deze professor nooit meer traditionele cijfers voor toetsen te gebruiken. Maar hij wist niet precies waarmee hij ze moest vervangen.

Zoals Talbert al snel ontdekte, is er een hele wereld van zogenaamde alternatieve beoordelingssystemen. Zo veel zelfs dat hij samen met een collega aan zijn universiteit, David Clark, een heel boek over hen schreef. Het boek, dat deze zomer uitkomt, heet "Grading for Growth: een gids voor alternatieve beoordelingspraktijken die authentiek leren en studentenbetrokkenheid in het hoger onderwijs bevorderen. '

EdSurge nam contact op met Talbert om te horen wat hij nu in zijn lessen gebruikt, en waarom hij beweert dat een hervorming van de manier waarop cijfers werken essentieel is om de betrokkenheid van leerlingen te vergroten.

Beluister de aflevering op Apple Podcasts, bewolking, Spotify, stikster of waar je je podcasts ook vandaan haalt, of gebruik de speler op deze pagina. Of lees een gedeeltelijk transcript hieronder, licht bewerkt voor de duidelijkheid.

EdSurge: Ons beoordelingssysteem lijkt vrij fundamenteel voor de manier waarop scholen en hogescholen werken, maar je merkt in het boek op dat lettercijfers niet altijd op hun plaats zijn geweest. Wat deden docenten vóór het huidige systeem?

Robert Talbert: Gedurende de eerste 600 of 700 jaar hoger onderwijs - ongeveer de eerste 70 procent van de levensduur van het hoger onderwijs - bestond er niet zoiets als een cijfer. Je zou naar een universiteit gaan en je zou vier jaar studeren, en je zou naar lezingen gaan en naar je discussiegroepen gaan. En aan het einde van de vier jaar zou je gewoon een gigantisch mondeling examen over alles hebben - heel erg zoals de Ph.D. proefschriftverdedigingen die we nu hebben. Dat zijn eigenlijk overblijfselen uit die tijd.

Het hele idee van examens per vak ontstond pas in de 18e eeuw. Het eerste bekende voorbeeld daarvan was aan de Yale University, ik geloof dat het in de jaren 1780 was. En het cijfer was geen letter, het waren gewoon beschrijvende bijvoeglijke naamwoorden, zoals 'zeer goed', 'niet zo geweldig, maar nog steeds oké' en 'niet oké'. En het waren nog steeds geen punten. En het was nog steeds geen middeling omdat je bijvoeglijke naamwoorden niet samen kunt middelen. En het is gewoon in de loop van de tijd geëvolueerd.

Pas aan het begin van de 20e eeuw kwamen we echt tot ons huidige concept van op punten gebaseerde sortering in A, B, C, D, F-stijl. Het is echt pas ongeveer 100 jaar oud.

Waarom denk je dat dat vastzit in vergelijking met andere systemen die mogelijk zijn geëvolueerd?

Het heeft te maken met het standaardiseren van de rapportage van de studievoortgang van studenten. En dit begon echt ingang te vinden in het midden van de 19e eeuw in Amerika, omdat je in die tijd veel immigratie en veel mobiliteit had vanwege expansie naar het westen. … Naarmate gezinnen in de 19e eeuw mobieler werden, zou je een kind kunnen krijgen dat opgroeit en naar New York emigreert en vervolgens naar Missouri verhuist en vervolgens naar Californië verhuist.

En in dat geval heb je dus echt een gestandaardiseerde manier nodig om te zeggen: 'Deze student heeft uitstekend werk geleverd of gewoon goed werk of gemiddeld werk.' En dat is een soort waar cijfers waar het gestandaardiseerde idee van een cijfer vandaan kwam.

En een andere factor die dit stimuleerde, was de obsessie van de industriële revolutie in het begin van de 20e eeuw met wetenschappelijke metingen van alles. Dit is toen we voor het eerst IQ-scores begonnen te zien, bijvoorbeeld beginnen te ontstaan. Het heeft de uitstraling van een wetenschappelijke meting. En dat was voor die tijd goed genoeg.

Er is tegenwoordig veel discussie over gelijkheid en onderwijs. En dus was ik geïnteresseerd om op te merken dat u in het boek betoogt dat "traditionele indeling in strijd is met elke redelijke standaard van billijkheid". Waarom zeg je dat?

We verwijzen daar naar een boek van Joe Feldman genaamd "Beoordeling voor eigen vermogen.” In dat boek zet Feldman een aantal criteria uiteen voor wat billijkheid zou kunnen zijn. Ik zou het neerkomen op het beoordelen van beloningen voor het afleggen van beoordelingen en beloningen voor het afleggen van tests. Cijfers zijn geen maatstaf voor intelligentie. Ze zijn een maatstaf voor uw vermogen om ergens een oordeel over te vellen. En wie profiteert hiervan? Ik bedoel, wie is het best geplaatst om hogedruktesten af ​​te leggen? Nou, het zijn vaak kinderen uit onderwijssystemen met veel middelen. Het zijn kinderen die de hulp kunnen betalen die ze nodig hebben om deze tests af te leggen. Het is typisch een bepaalde groep studenten die in een betere positie verkeert dan wie dan ook om deze beoordelingen af ​​te leggen en deze cijfers te halen.

Wij zijn ervan overtuigd dat elke leerling kan en moet groeien. Maar de manier waarop we onze beoordeling opzetten, gaat niet over groei. Het is een momentopname van uw vermogen om bij verschillende gelegenheden een enkele eenmalige beoordeling te maken en ze vervolgens allemaal bij elkaar te middelen.

Dus wat doe je nu als je geen lettercijfers geeft voor opdrachten?

Voordat ik details uitspreek, wil ik zeggen dat je alleen maar buiten de school hoeft te kijken en je zult het overal zien. Toen mijn zoon, die nu 14 is, 6 of 7 jaar oud was, volgde hij de zwemles van mijn universiteit en kreeg hij een rapport. En het had geen punten. Er stonden geen cijfers op. Er stonden gewoon niveaus op - de instructeur omcirkelde het niveau dat hij had voltooid en gebruikte wat markeerstiften om te laten zien in welke vaardigheden hij goed is, aan welke vaardigheden hij moet blijven werken. En ik zag dat en ik dacht, dat is gewoon briljant.

Ik bedoel, overal in het leven, behalve op school, als er een beoordeling moet worden gedaan - of je nu een baan hebt en je krijgt een jaarlijkse prestatiebeoordeling, of als je een professor bent en je bent klaar voor een vaste aanstelling en je krijgt een portfoliobeoordeling, of je bent een muzikant en je probeert een liedje te leren - je krijgt geen punt voor je optreden. Je doet iets, je probeert het, je krijgt feedback van een vertrouwde derde partij met betrekking tot de juiste schaal van professionele standaarden, en dan probeer je die feedback te begrijpen en neem je dat allemaal op in een volgende iteratie. En dan blijft die lus maar herhalen totdat wat je hebt geproduceerd goed genoeg is.

Al het menselijk leren dat belangrijk is, is gebaseerd op feedbackloops, behalve op school.

Ik denk dat mijn favoriete alternatieve vorm van beoordeling wordt genoemd specificaties sortering. Dit is bedacht door Linda Nilson, een legendarische faculteitsontwikkelaar en opinieleider op het gebied van lesgeven en leren. Je stelt een lijst op met leerdoelen, dingen die studenten moeten kunnen doen tegen de tijd dat ze de cursus afronden, en je koppelt het cijfer in de cursus aan het aantal dingen dat ze hebben bereikt.

Dus misschien geef je een schrijfcursus en heb je misschien andere, wat Linda zou noemen, bundels werk opgezet. Je moet bijvoorbeeld een onderzoekspaper doen en je moet een verklarend paper maken, en je moet in staat zijn om een ​​opdracht voor creatief schrijven uit te voeren, of iets dergelijks. En elk van die drie bundels zou bestaan ​​uit verschillende specifieke werkstukken, misschien een paper en een overzicht van die paper, of een mondelinge presentatie van die paper. En als je alle dingen in de bundel op een bevredigend niveau voltooit ten opzichte van een aantal standaarden die je hebt ingesteld, die we specificaties noemen, dan heb je alle punten voor die bundel verdiend. En om een ​​A in de klas te krijgen, zou je alle drie de bundels moeten voltooien. Om een ​​B in de klas te krijgen, moet je twee van de drie voltooien. Om een ​​C te krijgen, moet je één van de drie voltooien.

Maar de truc is dat alles wat je doet opnieuw kan worden gedaan als je niet tevreden bent met het resultaat.

En wat je hiermee kunt doen, is dat een student in wezen het cijfer selecteert dat je wilt behalen. Dus je kunt binnenkomen en zeggen: ik denk echt dat ik een A in de klas kan halen. Als ik er gewoon moeite voor doe, dan weet je precies wat je te doen staat. Je krijgt de hele weg feedback over je voortgang en je wordt ondersteund door de professor. Aan de andere kant, misschien ben je helemaal blij met een B in de klas. We proberen mensen aan te moedigen hoog te schieten, maar misschien is dat alles wat je wilt. En als dat het geval is, kun je een van die twee bundels kiezen om te doen en de andere gewoon negeren. En dus geeft het de student stevig de controle over zijn eigen lot in die cursus. En de professor is er als gids om feedback te geven aan de studenten en om de omgeving en de mogelijkheden te creëren om gewoon te blijven proberen totdat ze tevreden zijn.

Hierdoor kunnen sommige professoren het gevoel krijgen dat de cursus minder streng is.

Als dat alleen de algehele academische legitimiteit van een cursus betekent, heb ik het gevoel dat het een cursus strenger maakt omdat je alleen maar betere gegevens krijgt. Je krijgt directe observaties van het werk van studenten. En dat is de hele reden waarom ik ben overgestapt. Ik was het beu om waardeloze gegevens over het leren van studenten te krijgen.

Wat staat hier in grote lijnen op het spel? Waarom is het beoordelingssysteem dat u gebruikt van belang?

Dit is belangrijk omdat we willen dat onderwijs iets betekent. Onderwijs hangt op dit moment een beetje af van certificering. Hoe weet je of iemand echt is opgeleid als hij een hbo-opleiding heeft?

Als we nadenken over traditionele sortering, moeten we zeggen dat we geen idee hebben wat deze informatie overbrengt. Dit is een serieus probleem.

Laten we zeggen dat je in een klas zit en de klas is hypertraditioneel. Het volledige cursuscijfer is dus gebaseerd op drie tests van 100 punten die allemaal samen worden gemiddeld. En je hebt een student die een nul krijgt op de eerste, een 80 op de tweede en een 100 op de derde.

Aan de andere kant heb je een andere student die 60, 60 en 60 scoort. Beide studenten hebben 180 punten van de 300. Dat is 60 procent. Dat is een D-minus. Maar welk verhaal wordt er over deze studenten verteld? Ze zien er allebei precies hetzelfde uit.

En de eerste student heeft een heel andere reis dan de tweede student. De eerste student, wie weet waarom ze de nul kreeg. Misschien was het omdat ze het materiaal helemaal niet kende. Maar misschien was het omdat ze COVID had of misschien moest ze de les missen omdat ze voor een familielid zorgde of een baan had of zoiets. Die nul vertelt je letterlijk niets over haar vaardigheid, alleen al kijkend naar het nummer.

En toch moet het worden gemiddeld met deze twee andere cijfers die eigenlijk heel goed zijn. Maar ze krijgt een D-minus voor de klas, terwijl de andere man - de man van 60, 60, 60 - nooit echt iets bereikt. Maar ze krijgen allebei hetzelfde vakcijfer.

Wat er op het spel staat, is of dat cursuscijfer, dat we zo veel moeite doen om te maken en op te slaan en samen te stellen, daadwerkelijk enige informatie over de student overbrengt. Of is het net een willekeurig getalgemiddelde, zoals het nemen van een aantal postcodes en het gemiddelde daarvan? Ik bedoel, dat zijn cijfers, maar als je ze bij elkaar optelt, betekent dat niets.

Wat er dus op het spel staat, is de epistemologische basis van een cursustranscriptie, de valuta van de moderne werkplek.

Om het hele gesprek te horen, luister naar de aflevering.

spot_img

Laatste intelligentie

spot_img