Deze blogpost is gebaseerd op de inzichten uit het artikel “On AI glasses and wearable AI in assessment” van Thomas Corbin, Sue Sharpe en Phillip Dawson, gepubliceerd in Assessment & Evaluation in Higher Education. De auteurs onderzoeken wat AI-brillen en andere vormen van draagbare AI betekenen voor toetsing, validiteit, academische integriteit en inclusie in het hoger onderwijs.
Een nieuwe fase in het AI-vraagstuk
Sinds de doorbraak van generatieve AI zoeken hogescholen en universiteiten naar manieren om betrouwbaar te blijven beoordelen. Veel instellingen hebben daarbij teruggegrepen naar toetsvormen die technologie fysiek proberen uit te sluiten: examens onder toezicht (al dan niet met proctoring software), mondelinge examens, presentaties of bijvoorbeeld interactieve orals, een vorm van toetsing waarbij een student een niet-gescript, tweerichtingsgesprek voert met een docent of expert over een levensecht werksituatiescenario.
De onderliggende redenering is begrijpelijk: als studenten tijdens de beoordeling geen toegang hebben tot AI, dan kunnen we met meer vertrouwen zeggen dat de prestatie echt van de student zelf komt.
Maar precies die aanname komt onder druk te staan door de opkomst van AI-brillen en andere wearables. Denk aan slimme brillen, oortjes, horloges, hoorapparaten of andere devices die AI-functionaliteiten kunnen bevatten. De auteurs van het artikel stellen dat deze technologie het steeds moeilijker maakt om AI fysiek uit de toetscontext te weren, omdat AI letterlijk dichter op het lichaam komt te zitten en soms nauwelijks nog zichtbaar of controleerbaar is.
Het artikel is daarom geen sciencefictionoefening. Het is een waarschuwing: een toetsbeleid dat vooral steunt op het fysiek uitsluiten van technologie kan snel minder robuust worden dan we denken.
Van ChatGPT op het scherm naar AI in het gezichtsveld
Bij de eerste golf van generatieve AI ging het vooral over studenten die ChatGPT of vergelijkbare tools gebruikten via een laptop, tablet of smartphone. Dat gebruik was vaak nog relatief herkenbaar: iemand opent een tool, typt een vraag, leest een antwoord en verwerkt dat eventueel in een opdracht.
Bij AI-brillen verandert die interactie fundamenteel. Een AI-bril kan tekst tonen in het gezichtsveld van de drager. Ingebouwde microfoons kunnen gesproken vragen opvangen. Camera’s kunnen tekst, examenvragen of omgevingsinformatie registreren. De output kan verschijnen zonder dat een docent of surveillant duidelijk ziet wat er gebeurt. De technologie wordt dus niet langer alleen “geraadpleegd” via een zichtbaar scherm, maar kan meedraaien in de gewone activiteit van kijken, luisteren, spreken en antwoorden.
Dat maakt het assessmentvraagstuk complexer. Want hoe stel je vast of een student tijdens een mondeling examen zelf antwoordt, of subtiele ondersteuning krijgt via een bril? Hoe weet je of een student een examenvraag zelfstandig leest, of tegelijk een AI-analyse ontvangt? En hoe controleer je dat zonder in problematische vormen van toezicht terecht te komen?
Het centrale concept: dual transparency
Een belangrijk begrip uit het artikel is dual transparency. Daarmee bedoelen de auteurs dat draagbare AI op twee manieren “transparant” wordt.
1. Transparant voor de gebruiker
De technologie kan voor de gebruiker zo vanzelfsprekend worden dat ze opgaat in het handelen. Wie een bril draagt die realtime informatie toont, ervaart misschien niet meer dat hij of zij “een tool raadpleegt”. De AI wordt onderdeel van de manier waarop iemand kijkt, luistert, spreekt of reageert.
Dat is vergelijkbaar met andere hulpmiddelen die na verloop van tijd bijna aanvoelen als een verlengstuk van het lichaam. Een bril, een pen, een fiets, een hoorapparaat of een navigatiesysteem kan na veelvuldig gebruik minder als apart object worden ervaren en meer als geïntegreerd deel van het handelen.
Bij wearable AI kan dat betekenen dat ondersteuning niet langer aanvoelt als een afzonderlijke handeling, maar als iets dat verweven zit in de taakuitvoering zelf.
2. Transparant voor de observator
Tegelijk kan diezelfde technologie voor buitenstaanders bijna onzichtbaar zijn. Een docent ziet misschien wel dat een student een bril draagt, maar niet of die bril op dat moment AI-output toont. Een examinator hoort niet welke input via een oortje binnenkomt. Een surveillant kan moeilijk inschatten of een apparaat een gewoon hulpmiddel is, een toestel dat medische assistentie verleent, of een AI-systeem.
Precies die combinatie maakt AI-wearables zo uitdagend. Ze zijn niet alleen geïntegreerd in de ervaring van de gebruiker, maar ook moeilijk observeerbaar voor wie toezicht houdt.
Waarom dit fysieke uitsluiting ondergraaft
Volgens de auteurs steunt het idee van fysieke uitsluiting op twee voorwaarden: separability en observability.
Separability betekent dat AI-gebruik te onderscheiden is van het handelen van de student. Bij ChatGPT op een laptop is dat nog enigszins voorstelbaar: de student opent een tool, voert een prompt in en gebruikt de output. Er is een min of meer apart moment waarop de student AI raadpleegt.
Bij wearable AI wordt dat onderscheid veel minder helder. Als AI-ondersteuning in het gezichtsveld verschijnt tijdens het spreken, lezen of redeneren, waar begint dan het AI-gebruik? En waar eindigt de eigen prestatie?
Observability betekent dat AI-gebruik in principe zichtbaar of controleerbaar is. Bij een smartphone of laptop kun je apparaten laten inleveren, schermen monitoren of internettoegang beperken. Dat is niet perfect, maar er is tenminste een zichtbaar object of gedrag dat je kunt proberen te reguleren.
Bij AI-brillen, oortjes of andere wearables wordt dat veel moeilijker. Niet elk apparaat is herkenbaar als AI-device. Niet elk gebruik laat zichtbare sporen na. En niet elk body-worn device kan zomaar verboden worden, omdat sommige studenten het nodig hebben omwille van een beperking, gezondheidssituatie of religieuze praktijk.
Dat is de kern van het probleem: de toetsvormen die instellingen net opnieuw zekerheid moesten geven, worden zelf kwetsbaar voor AI-ondersteuning die moeilijk te detecteren is.
Mondelinge examens zijn niet automatisch AI-proof
Een belangrijke implicatie van het artikel is dat mondelinge examens, interactieve orals en bewaakte performances niet zomaar “AI-proof” zijn.
De voorbije jaren werden deze toetsvormen vaak naar voren geschoven als antwoord op generatieve AI. Dat is logisch: als studenten live moeten antwoorden, doorvragen krijgen en hun redenering moeten toelichten, lijkt het moeilijker om AI ongezien te gebruiken. Bovendien kunnen mondelinge en interactieve toetsvormen didactisch sterk zijn, zeker wanneer ze peilen naar begrip, redenering, transfer en professionele oordeelsvorming.
Maar wearable AI maakt de situatie minder vanzelfsprekend. Een student kan in theorie tijdens een mondelinge toets realtime suggesties krijgen, kernwoorden zien verschijnen, argumentatielijnen ontvangen of vertaalondersteuning gebruiken. Dat betekent niet dat elk mondeling examen waardeloos wordt. Het betekent wel dat we voorzichtiger moeten zijn met stellige uitspraken zoals: “Dit type toets is immuun voor AI.”
De betere vraag is niet: Welke toetsvorm is AI-proof?
De betere vraag is: Welke vorm van bewijs hebben we nodig om te kunnen zeggen dat deze student de beoogde competentie beheerst, in een wereld waarin AI steeds meer aanwezig is?
Het risico van schijnzekerheid
Een mogelijke reactie van instellingen is eenvoudig: AI-brillen en AI-wearables verbieden tijdens toetsen.
Dat zal in veel gevallen ook nodig zijn. Regels zijn belangrijk. Studenten moeten weten wat mag en niet mag. Docenten hebben duidelijke kaders nodig. Examencommissies kunnen niet zonder afspraken over hulpmiddelen, toegestane ondersteuning en academische integriteit.
Maar de auteurs waarschuwen dat een verbod alleen niet voldoende is. Een verbod werkt maar als naleving redelijkerwijs controleerbaar is. Wanneer technologie nauwelijks zichtbaar is of niet betrouwbaar te onderscheiden valt van gewone hulpmiddelen, ontstaat het risico op schijnzekerheid.
Dan staat er in het reglement dat AI-wearables verboden zijn, maar kan de instelling in de praktijk niet goed nagaan of die regel wordt nageleefd. Het toetsbeleid voelt dan stevig aan op papier, terwijl de feitelijke toetscondities minder controleerbaar zijn dan verondersteld.
Voor beleidsmedewerkers is dat een belangrijk aandachtspunt. Een AI-beleid mag niet alleen een juridisch of procedureel document zijn. Het moet ook realistisch zijn over wat observeerbaar, uitvoerbaar en verdedigbaar is in concrete toetspraktijken.
De ethische prijs van strenger toezicht
Als een verbod onvoldoende zekerheid biedt, ligt een tweede reactie voor de hand: strenger controleren.
Maar daar ontstaat volgens de auteurs een bijzonder gevoelig probleem. Want zodra AI op het lichaam gedragen wordt, verschuift toezicht van het werk van de student naar het lichaam van de student.
Bij klassieke plagiaatcontrole of AI-detectie lag de focus vooral op het ingediende product: een tekst, een codebestand, een verslag, een antwoord. Dat was al niet zonder problemen, maar het object van controle was het werk.
Bij AI-wearables kan de controle verschuiven naar brillen, hoorapparaten, hoofddeksels, oortjes, ringen, horloges, lichaamstaal of blikrichting. Studenten kunnen gevraagd worden om aan te tonen dat hun hulpmiddel legitiem is. Is deze bril alleen corrigerend? Is dit hoorapparaat medisch noodzakelijk? Biedt het toestel cognitieve ondersteuning of meer? Mag dit hoofddeksel gecontroleerd worden? Wie beslist dat? En op basis waarvan?
De auteurs noemen dit bodily adjudication: een regime waarin instellingen gaan oordelen over wat studenten op of aan hun lichaam dragen en of dat al dan niet verdacht is.
Dat is niet alleen praktisch moeilijk. Het kan ook ongelijk uitpakken. De zwaarste bewijslast komt mogelijk terecht bij studenten die hulpmiddelen het minst optioneel kunnen achterlaten: studenten met een beperking, chronische aandoening of sensorische ondersteuningsnoden.
Voor hoger onderwijsinstellingen is dit een cruciale nuance. Wie assessment security wil versterken, mag niet blind worden voor inclusie, waardigheid en gelijke behandeling.
Niet alleen een integriteitsprobleem, maar ook een validiteitsprobleem
In discussies over AI en toetsing gaat het vaak over fraude. Heeft de student vals gespeeld? Heeft de student AI gebruikt terwijl dat niet mocht? Is het antwoord nog authentiek?
Dat zijn belangrijke vragen, maar ze zijn niet voldoende. Het artikel nodigt uit om het probleem breder te bekijken als een validiteitsvraagstuk.
Validiteit gaat over de vraag of een toets meet wat hij moet meten. Als een toets bedoeld is om kritisch denken te beoordelen, meet hij dan echt kritisch denken? Als een toets professionele communicatie beoordeelt, meet hij dan die vaardigheid op een relevante manier? Als een examen inzicht wil meten, meet het dan inzicht of vooral snelheid, stressbestendigheid en geheugen?
Door AI-wearables wordt die vraag nog complexer. Als studenten met ondersteuning presteren, wat zegt de prestatie dan over hun eigen bekwaamheid? Maar omgekeerd: als AI in de beroepspraktijk normaal aanwezig zal zijn, moeten we studenten dan altijd zonder AI beoordelen? Of moeten we soms juist beoordelen hoe goed ze met AI kunnen samenwerken?
Daar zit de echte spanning.
Sommige competenties moeten studenten waarschijnlijk zonder AI kunnen aantonen. Denk aan basiskennis, kernbegrippen, professionele oordeelsvorming, ethische afwegingen of vaardigheden waarbij onmiddellijke zelfstandigheid essentieel is.
Andere competenties zullen net gaan over het verstandig inzetten van AI: kritisch prompten, output evalueren, bronnen controleren, beperkingen herkennen, verantwoordelijkheid nemen en professioneel handelen in AI-rijke contexten.
Een sterk assessmentbeleid zal dus niet alleen vragen: Hoe houden we AI buiten?
Het zal ook vragen:
- Wanneer is AI-gebruik irrelevant, ondersteunend of problematisch?
- Welke leeruitkomsten vereisen zelfstandige beheersing zonder AI?
- Welke leeruitkomsten vereisen juist professioneel handelen mét AI?
- Welk bewijs hebben we nodig om dat onderscheid geloofwaardig te maken?
- Welke toetsvormen leveren rijk bewijs op zonder disproportioneel toezicht?
- Hoe vermijden we dat controlemaatregelen vooral kwetsbare studenten treffen?
Wat betekent dit voor docenten?
Voor docenten betekent dit niet dat alle toetsvormen meteen op de schop moeten. Het betekent wel dat elke toetsvorm opnieuw kritisch bekeken moet worden.
Een bewaakt examen kan nog steeds zinvol zijn. Een mondeling examen kan nog steeds krachtig zijn. Een interactieve oral kan nog steeds veel rijker bewijs opleveren dan een klassieke schriftelijke taak. Maar we moeten ophouden met deze toetsvormen te beschouwen als eenvoudige ontsnappingsroutes uit het AI-probleem.
Docenten kunnen zichzelf enkele vragen stellen:
Wat wil ik hier echt beoordelen?
Gaat het om kennisreproductie, inzicht, toepassing, redenering, professionele communicatie, creativiteit, probleemoplossend vermogen of oordeelsvorming?
Waarom kies ik deze toetsvorm?
Kies ik ze omdat ze didactisch past bij de leeruitkomst, of vooral omdat ze controleerbaar lijkt?
Welke hulpmiddelen zijn inhoudelijk relevant?
Moet de student dit zonder ondersteuning kunnen, of hoort verantwoord hulpmiddelengebruik bij de competentie?
Welke vormen van bewijs verzamel ik?
Beoordeel ik alleen het eindproduct, of ook proces, redenering, verantwoording, keuzes en reflectie?
Welke studenten worden mogelijk benadeeld door mijn toetscondities?
Denk aan studenten met taalbarrières, functiebeperkingen, toetsangst, gezondheidsnoden of andere omstandigheden.
Kan ik mijn toets robuuster maken zonder ze louter strenger te maken?
Bijvoorbeeld door meer nadruk te leggen op toelichting, iteratie, authentieke casussen, contextspecifieke toepassingen, feedbackgesprekken, portfolio’s, mondelinge verdediging of procesdocumentatie.
Wat betekent dit voor beleidsmedewerkers?
Voor beleidsmedewerkers ligt de uitdaging op een ander niveau. AI-wearables tonen dat instellingen niet kunnen volstaan met algemene formuleringen zoals “AI is verboden tenzij anders vermeld” of “studenten mogen geen slimme apparaten gebruiken tijdens examens”.
Zulke regels zijn nuttig, maar onvoldoende als ze niet gekoppeld zijn aan uitvoerbare procedures, inclusieve uitzonderingskaders en een bredere visie op toetsvaliditeit.
Beleidsmatig zijn minstens vijf lijnen belangrijk.
1. Maak onderscheid tussen toetsbeveiliging en toetsvaliditeit
Een toets kan goed beveiligd lijken en toch weinig valide zijn. Omgekeerd kan een toets met open hulpmiddelen net veel beter meten wat studenten in de praktijk moeten kunnen. Beleid moet dus niet alleen gaan over wat verboden is, maar ook over wat een opleiding precies wil bewijzen met haar toetsing.
2. Ontwikkel categorieën van AI-gebruik
Niet elk AI-gebruik is hetzelfde. Er is een verschil tussen spellingcontrole, vertaling, brainstorming, feedback, inhoudelijke generatie, redeneringsondersteuning en volledige taakdelegatie. Een bruikbaar beleid helpt opleidingen om dat onderscheid te maken in relatie tot leeruitkomsten.
3. Ondersteun opleidingen bij toetsontwerp
Docenten kunnen dit niet alleen oplossen via individuele beslissingen. Opleidingen hebben tijd, voorbeelden en begeleiding nodig om toetsprogramma’s te herdenken. De vraag is niet alleen of één opdracht AI-bestendig is, maar of het geheel van toetsen voldoende valide bewijs oplevert over de competenties van studenten.
4. Werk inclusieve procedures uit voor hulpmiddelen
AI-wearables raken aan ondersteuningsnoden, functiebeperkingen en redelijke aanpassingen. Beleid moet vermijden dat studenten met legitieme hulpmiddelen voortdurend onder verdenking komen te staan. Dat vraagt samenwerking tussen examencommissies, studentenvoorzieningen, inclusiemedewerkers, juridische diensten en opleidingen.
5. Vermijd technologische tunnelvisie
Nieuwe detectietools, scanprocedures of controleprotocollen kunnen aantrekkelijk lijken, maar lossen het kernprobleem niet noodzakelijk op. Technologie kan helpen, maar mag niet de enige beleidsreactie zijn. De diepere vraag blijft pedagogisch: wat willen we dat studenten leren, tonen en verantwoorden?
Naar een rijker gesprek over toetsing
De waarde van het artikel ligt vooral in het verschuiven van de discussie. AI-brillen en wearables dwingen ons om verder te kijken dan de klassieke tegenstelling tussen toestaan en verbieden.
Ze maken duidelijk dat assessment in een AI-rijke wereld een complex samenspel wordt van:
- leeruitkomsten;
- toetsvaliditeit;
- academische integriteit;
- inclusie;
- privacy;
- toezicht;
- uitvoerbaarheid;
- professionele relevantie;
- en vertrouwen.
Dat maakt het vraagstuk moeilijker, maar ook interessanter. Want misschien ligt de oplossing niet in steeds meer controle, maar in betere toetsvragen. Niet in de zoektocht naar de perfecte AI-vrije ruimte, maar in helderder nadenken over welke menselijke bekwaamheden we willen zien, welke ondersteuning daarbij legitiem is en welk bewijs ons daarvan kan overtuigen.
AI-wearables tonen dat de vraag “Hoe verhinderen we AI-gebruik?” te smal is.
De bredere vraag wordt: Hoe ontwerpen we toetsing die betekenisvol, eerlijk en valide blijft in een wereld waarin mens en technologie steeds nauwer samenwerken?
Tot slot: tijd om dit gesprek nu te voeren
AI-brillen zijn misschien nog niet massaal aanwezig in elke aula of examenruimte. Maar wie wacht tot ze dat wel zijn, loopt achter de feiten aan. Het hoger onderwijs heeft de voorbije jaren geleerd dat technologische verschuivingen sneller gaan dan beleidsprocessen, toetscommissies en curriculumhervormingen.
Daarom is dit het moment om het gesprek te voeren.
Niet vanuit paniek.
Niet vanuit naïef technologie-optimisme.
Maar vanuit de kernvraag van goed onderwijs: welk leren willen we zichtbaar maken, en hoe beoordelen we dat op een faire en betekenisvolle manier?
Denk mee
Hoe gaat jouw opleiding, faculteit of onderwijsinstelling om met AI-wearables, AI-brillen en andere vormen van onzichtbare digitale ondersteuning?
Zijn er al afspraken? Wordt dit besproken in examencommissies of toetsbeleid? Of staat het thema nog niet echt op de radar?
Ik ben benieuwd naar jullie ervaringen, vragen en bedenkingen. Laat gerust weten hoe jullie hiermee omgaan, welke dilemma’s jullie zien of welke keuzes jullie instelling al maakt. Precies dit soort gesprekken hebben we nodig om toetsing in het hoger onderwijs niet alleen controleerbaar, maar vooral ook valide, inclusief en toekomstgericht te houden.
