Hiërarchische analyse van de - PDF Gratis download (2024)

Transcriptie

1 uitgebreide downloadversie Hiërarchische analyse van de WISC-III nader toegelicht: vragen en antwoorden Yaron Kaldenbach In dit artikel wordt ingegaan op vragen, discussiepunten en overwegingen ten aanzien van de hiërarchische analysemethode voor de WISC-III (Kaldenbach, 2006). Met behulp van deze informatie kan de lezer onderbouwde keuzes maken met betrekking tot de manier van analyseren, interpreteren en rapporteren in relatie tot de WISC-III. INLEIDING September vorig jaar verscheen in Kind en Adolescent Praktijk het artikel De WISC-III anno 2006: een voorstel tot eenduidige en hiërarchische analyse, interpretatie en rapportage (Kaldenbach, 2006). In deze publicatie werd stap voor stap een theoretisch onderbouwde analysemethode beschreven. Deze hiërarchische analysemethode draagt ertoe bij dat individuele verschillen tussen psychodiagnosten afnemen, wat de betrouwbaarheid en validiteit van de analyse en interpretatie vergroot. Het onderwerp bleek erg te leven in het land en zette aan tot discussie binnen instellingen over gemeenschappelijk gehanteerde analysemethoden of juist het ontbreken daarvan. De auteur van het artikel ontving enkele honderden reacties per , die grofweg kunnen worden onderverdeeld in reacties met betrekking tot de analysemethode als zodanig en reacties op de Scorehulp 1. De beschreven handvatten werden positief ontvangen en een groot aantal instellingen hanteert nu (elementen van) deze methode. De toepassing van de analysemethode en de Scorehulp riep echter ook verschillende vragen op. Een aantal vragen en discussiepunten kwam vaak terug. Het vorige artikel was uitgebreid, maar zeker niet volledig. Uit de reacties van lezers bleek dat sommige aspecten onderbelicht waren gebleven en sommige diagnostische keuzes met onvoldoende inhoudelijke argumentatie waren beschreven. Om enkele misverstanden weg te nemen en zaken nader toe te lichten, wordt hieronder een aantal FAQs ( frequently asked questions ) besproken. Het is belangrijk te benadrukken dat de psychodiagnost altijd zelf verantwoordelijk blijft voor de diagnostische keuzes die hij maakt en deze ook moet kunnen verantwoorden. Er bestaat geen absolute gouden standaard als het gaat om WISC-III-analyse. Iedere bestaande methode kent zwakke plekken. Onder de WISC-III-deskundigen bestaat nationaal en internationaal op een aantal punten verschil in visie. Deze FAQ-publicatie is een vervolg op het eerder verschenen artikel en dient ook binnen dat licht te worden bezien (Kaldenbach, 2006). Vanuit praktische overwegingen is ervoor gekozen om van het huidige artikel twee versies te publiceren. Voor u ligt de meest uitgebreide versie, gratis te downloaden via nl. De versie waarbij enkele antwoorden verkort zijn weergegeven, is gepubliceerd in Kind en Adolescent Praktijk 2007 (2) met verwijzing naar onderhavige webpublicatie. DE VRAGEN 1. Rapporteren over intern inconsistente schalen of factoren Ik heb Rebecca, een meisje van acht jaar, getest met de WISC-III. Beide schalen zijn intern inconsistent dus analyseer ik op factorniveau. Op factorniveau zijn de PO-factor en de VS-factor intern consistent, de VB-factor blijkt echter (net als de verbale schaal) intern inconsistent (IN:11, OV:5, WO:9 en BG:6). Hoe rapporteer ik hierover? Interne inconsistentie op schaalniveau impliceert binnen de hiërarchische analysemethode inderdaad analyse op factorniveau. In het rapport worden de subtests in dit geval dan ook gerangschikt onder de kopjes van de factoren. Bij de factoren Perceptuele Organisatie en Verwerkingssnelheid kan de algemene factoromschrijving worden aangehouden in de over de auteur Drs. Y. Kaldenbach, gz-psycholoog en kinder- en jeugdpsychloog NIP, Coördinator Psychodiagnostiek bij afdeling Jeugd van Altrecht GGZ te Utrecht. Naast erkend diagnostieksupervisor is hij lid van de commissie Basisaantekening Psychodiagnostiek NIP en geeft hij WISC-III-cursussen. ykaldenbach@hotmail.com. kind en adolescent praktijk 2 - juni

2 Trefwoorden WISC-III IQ intelligentietest kinderen hiërarchische analysemethode Scorehulp beschrijving, omdat deze factoren hom*ogeen (lees: intern consistent) zijn opgebouwd. Bij de factor Verbaal Begrip kan dat hier niet. Interne inconsistentie betekent immers dat de subtests van de factor in onvoldoende mate samenhangen met de factor als geheel, waardoor analyse van de factor als geheel niet is geoorloofd. Ten aanzien van de factor Verwerkingssnelheid (intern consistent) kan bijvoorbeeld het volgende worden geschreven: De factor Verwerkingssnelheid (104, gemiddeld niveau) is intern consistent. Rebecca s snelheid van visuele informatieverwerking, visueel associatief geheugen en visuele matching lijken leeftijdsadequaat ontwikkeld. Daar waar bij de schalen en overige factoren in geval van interne consistentie stelliger wordt geformuleerd ( zijn leeftijdsadequaat ontwikkeld ), worden bij de VS-factor met meer terughoudendheid uitspraken gedaan ( lijken leeftijdsadequaat ontwikkeld ) vanwege de lage betrouwbaarheid van deze factor (bij kinderen van zes-zeven jaar is de factor zelfs psychometrisch niet goed op te sporen; Kort e.a., 2005). De VB-factor was bij dit meisje intern inconsistent. De volgende verwoording is dan mogelijk: De factor Verbaal Begrip (86, benedengemiddeld niveau) is intern inconsistent, wat betekent dat de factor als geheel niet goed geïnterpreteerd kan worden. Rebecca s algemene kennis (IN) en woordenschat (WO) lijken leeftijdsadequaat ontwikkeld. Haar verbaal abstract redeneervermogen (OV) en inzicht in dagelijkse (sociale) situaties (BG 2 ) lijken echter zwak van niveau. Bij interne inconsistentie wordt dus overgegaan tot analyse op subtestniveau, waar met de nodige voorzichtigheid in hypothetische bewoordingen ( lijkt ) uitspraken worden gedaan. Tussen haakjes staan de afkortingen van de subtests waarop de uitspraken zijn gebaseerd (transparant en toetsbaar rapporteren). Bij dit meisje zouden er nog hypothesen kunnen worden beschreven over het verschil tussen aanwezige kennis en haar moeite met toepassing ervan binnen een wat complexere context die verbaal inzicht en abstractievermogen vereist. Er zijn ook collega s die ervoor kiezen IQ s van intern inconsistente schalen/factoren weg te laten uit de rapportage om te voorkomen dat hieraan ten onrechte belang wordt gehecht en onoordeelkundig gebruik kan optreden. Daar is wat voor te zeggen. Vanuit de visie die transparant en toetsbaar rapporteren voorstaat, heeft het echter de voorkeur altijd alle getallen te vermelden, ongeacht de uitkomsten daarvan (alle normscores, IQ s en betrouwbaarheidsintervallen). Afhankelijk van de resultaten kan dan bij sommige getallen een waarschuwing worden gezet wat betreft de (on)mogelijkheden tot interpretatie. Een ander voordeel van volledige vermelding van scores is dat collega s die een andere methode gebruiken, moeiteloos kunnen omrekenen naar hun eigen manier van werken en niet afhankelijk zijn van diagnostische keuzes van de vorige onderzoeker. Het is bovendien voor een toekomstige onderzoeker prettig dat alle relevante gegevens in een rapport worden vermeld. Dat scheelt veel tijd en moeite in geval van hertesten. Voor psychodiagnosten die er om soortgelijke redenen voor kiezen om het TIQ weg te laten bij een disharmonisch profiel op schaalniveau, is het goed om te weten dat internationale WISC-experts (Weiss e.a., 2006) met klem adviseren altijd het TIQ te vermelden omdat dit zelfs bij een disharmonische opbouw de beste samenvatting blijft van algeheel cognitief functioneren en nog steeds de best correlerende maat is met schoolprestaties ( among the highest known relationships between any two variables in the field of psychology, Weiss e.a., 2006, p.93). Ook de steekproef bevat veel kinderen met disharmonische profielen. FAQs in vervolg op eerdere publicatie 2. Disharmonisch profiel en vervolgonderzoek Is een disharmonisch profiel op schaalniveau (een significant verschil tussen het verbaal en performaal IQ) altijd reden voor vervolgonderzoek? Nee, disharmonische profielen komen ook in de normale populatie veel voor en zijn zeker niet per definitie reden voor vervolgonderzoek. Voor zover de auteur bekend, is er nog geen uitvoerig onderzoek gedaan bij Nederlandse kinderen naar het voorkomen van disharmonische WISC-III-profielen binnen de normale populatie. In Amerika, waar men van 1991 tot 2003 met de WISC-III werkte, bestaan hierover wel gegevens, zie tabel 1 (Kaufman & Lichtenberger, 2000). Bij 15% van deze kinderen bestaat een VIQ-PIQ verschil van minstens 19 punten, 10% van de kinderen heeft zelfs een verschil van 22 punten of meer. In de Amerikaanse steekproef werden 2 kind en adolescent praktijk 2 - juni 2007

3 op schaalniveau al significante discrepanties gevonden vanaf 11 punten verschil, op factorniveau lag de grens bij 12 punten. Hoewel deze gegevens niet zonder meer toepasbaar zijn op de Nederlandse populatie, wordt in ieder geval duidelijk dat disharmonische profielen, ook bij normalen niet uitzonderlijk zijn. In de steekproef van de Amerikaanse WISC-III had ongeveer een kwart van de kinderen een VIQ-PIQ discrepantie van minimaal 11 punten (Wechsler, 1991). % discrepanties in VIQ-PIQ VB-PO normale populatie (schalen) (factoren) 15% % % % % Tabel 1: Percentages normale Amerikaanse kinderen met een discrepantie tussen het verbaal en performaal IQ enerzijds en de factoren Verbaal Begrip en Perceptuele Organisatie anderzijds (Kaufman & Lichtenberger, 2000; Kaufman, 1994). zich verhoudt tot de overige scores binnen het eigen profiel (intra-individuele vergelijking; profielanalyse). Voorkom classificaties als zwak bij een normscore van bijvoorbeeld 13, bij een kind dat op alle overige subtests scores behaalt van 16 of hoger. De normscore 13 is dan weliswaar niet zo hoog als de rest, in absolute zin presteert het nog steeds beter dan de gemiddelde leeftijdgenoot. Een kind mag niet afgerekend worden op een kwaliteit omdat zijn overige kwaliteiten toevallig nóg beter ontwikkeld zijn. Het kan natuurlijk wel zijn dat het kind op basis van die overige capaciteiten op een dusdanig hoog niveau onderwijs volgt, dat de relatief minder sterk ontwikkelde kant hem op dat niveau moeite kan geven. Wanneer er problemen zijn ten gevolge van een disharmonisch profiel met achterblijvende verbale vaardigheden, kan het de moeite waard zijn kennis te nemen van een internationaal onderzoek (In: Weiss e.a., 2006) dat liet zien dat ouders met name de verbale capaciteiten van hun kind kunnen stimuleren door minder televisie te laten kijken en hun kinderen te stimuleren meer tijd met lezen en computergebruik door te brengen. Dit leidde tot hogere verbale scores op de WISC-IV en was onafhankelijk van het opleidingsniveau van de ouders. Ieder mens heeft sterke en minder ontwikkelde kanten en de meeste mensen kunnen daar prima mee functioneren. Het wordt pas een probleem als een kind in de praktijk vastloopt. Onderzoek kan dan inzicht geven in de reden van de stagnerende ontwikkeling en aanknopingspunten bieden voor een oplossing. Als het WISC-III-profiel doet vermoeden dat het disharmonische beeld met de problematiek van het kind samenhangt, dan kan doortesten geïndiceerd zijn. Het verdient aanbeveling van tevoren hypothesen te formuleren die met het vervolgonderzoek worden getoetst. Het toetsen van de hypothese moet leiden tot meer inzicht in de problematiek en bijdragen aan een passende benadering ( handelingsgerichte diagnostiek ). In de praktijk is het goed om niet alleen naar het absolute verschil te kijken, maar ook de hoogtes van de afzonderlijke IQ s te beschouwen. Een profiel met VIQ=138 en PIQ=113 kan andere problemen geven dan een kind waarbij VIQ=94 en PIQ=69 is gemeten, hoewel in beide gevallen een significant verschil van 25 punten aan de orde is ten gunste van de verbale schaal. Hiermee samenhangend is het belangrijk nader in te gaan op het onderscheid tussen absolute en relatieve verschillen, of deze nu tussen schalen, factoren of subtests optreden. Bij analyse kan gekeken worden naar hoe een kind presteert ten opzichte van de normgroep (interindividuele vergelijking) en hoe de prestatie op een subtest, schaal of factor 3. De Scorehulp We maken op ons werk met plezier gebruik van de WISC-III-Scorehulp. Het tabblad Score Converter is ons echter niet geheel helder. Wat kunnen/moeten we hiermee? Daarnaast hebben we gemerkt dat de Scorehulp beveiligd is. Wat is het wachtwoord? Met de Score Converter kunt u allerlei scores omrekenen naar equivalenten van andere gestandaardiseerde statistische maten. De Score Converter is dus niet specifiek voor de WISC-III. Zo kun je bijvoorbeeld T-scores, z-scores en IQ-scores ( Wechsler-scores ) naar elkaar omzetten. Hiervoor moeten de behaalde score van het kind en twee statistische kenmerken van die scoremaat (gemiddelde en standaarddeviatie) worden ingevoerd. Omrekening kan handig zijn wanneer u met bepaalde maten weinig ervaring hebt en niet goed weet wat nu hoog en laag is (denk aan stanines, een maat waarmee velen weinig feeling hebben). U kunt deze dan omrekenen naar een gestandaardiseerde score waarmee u bekend bent. Ook kunt u bij een behaalde T-score op een neuropsychologische taak bekijken of de prestatie past bij het gevonden IQ-interval. Sommige instellingen streven ernaar in hun rapporten bij zoveel mogelijk tests in soortgelijke eenheden te rapporteren. De Score Converter kan hierbij behulpzaam zijn. Het is echter niet aan te bevelen om van IQ-scores in uw rapport een andere score te maken. Een TIQ van 78 is gelijk aan een T-score van 35, een z-score van -1,47 en een normscore van 6, maar kind en adolescent praktijk 2 - juni

4 vermelding hiervan zal eerder onduidelijkheid veroorzaken dan wegnemen. Het is ook mogelijk om per subtest de behaalde normscore om te rekenen naar een subtest IQ-score. Het wordt afgeraden deze IQ-equivalenten in uw rapport te vermelden en normscores als IQ s te presenteren, omdat aan IQ-getallen vaak veel waarde wordt gehecht en ouders zouden kunnen gaan denken in termen van een licht verstandelijk gehandicapte visuele detailwaarneming bij een normscore van 3 op Onvolledige Tekeningen. Omrekening biedt mogelijkheden om bijvoorbeeld ook normscores te classificeren volgens de IQ-indeling van Resing en Blok (2002) als verantwoord alternatief voor de indeling van normscores zoals beschreven in Kaldenbach (2006) en Sattler en Saklofske (2001). Er zou dan gekozen kunnen worden om een normscore van 7 (IQ-equivalent is 85) op Informatie niet als zwak maar als benedengemiddeld aan te duiden. In tabel 2 ziet u de IQ-equivalenten van alle normscores (gelden eveneens voor de WPPSI-R, WAIS-III en SON-R 2 1 / 2-7). Daarbij is het goed dat de onderzoeker zich realiseert dat normscores net als IQ s ook schattingen zijn en dus een meetfout hebben. Ook normscores hebben betrouwbaarheidsmarges, hoewel die niet beschreven worden in de handleiding. Omdat de betrouwbaarheden van de subtests vrij laag zijn (reden waarom interpretatie op subtestniveau met voorzichtigheid dient plaats te vinden), hanteren Kaldenbach (2006) en Sattler en Saklofske (2001) een wat minder gedifferentieerde indeling, waarbij eigenlijk alleen maar wordt aangegeven of een score gemiddeld is, en indien dat niet het geval is, in welke richting (beter of slechter) en in welke mate deze van het gemiddelde afwijkt. Sommigen hebben moeite met de term zwak en ervaren deze als normatief. Door tentatief te formuleren (het gaat immers om subtestanalyse) wordt de term hierdoor al afgezwakt. Verder kan het vergeleken worden met schoolbeoordelingen. De beoordeling zwak (ook wel matig ) wordt dan gebruikt voor prestaties die tussen een onvoldoende en een voldoende in liggen. Dan over het tweede deel van de vraag. De Scorehulp is beveiligd tegen onbevoegde bewerkingen. In alle gele invulvelden kunnen de scores worden ingevoerd, de overige velden zijn niet te wijzigen en dat is ook niet nodig. Hiermee wordt het (onbedoeld) aanbrengen van wijzigingen in de opmaak en achterliggende formules voorkomen. De Scorehulp is een Alleen-lezen bestand. Dit betekent dat u het originele bestand niet kunt overschrijven met gegevens van cliënten. U wordt door het programma geleid naar de Opslaan als mogelijkheid, waardoor uw bronbestand schoon blijft. Op internet circuleren ook versies zonder de eigenschap Alleen-lezen. U kunt dit eenvoudig herstellen door het bestand te downloaden en via de rechtermuisknop Eigenschappen te kiezen, waarna u een vinkje zet in het hokje Alleen-lezen. Op deze manier is uw versie beveiligd tegen het overschrijven van uw origineel met cliëntgegevens. subtest normscore IQ-equivalenten 1 (zeer zwak) 55 (lichte verstandelijke beperking / licht zwakzinnig) 2 (zeer zwak) 60 (lichte verstandelijke beperking / licht zwakzinnig) 3 (zeer zwak) 65 (lichte verstandelijke beperking / licht zwakzinnig) 4 (zeer zwak) 70 (laag begaafd / moeilijk lerend) 5 (zwak) 75 (laag begaafd / moeilijk lerend) 6 (zwak) 80 (benedengemiddeld) 7 (zwak) 85 (benedengemiddeld) 8 (gemiddeld) 90 (gemiddeld) 9 (gemiddeld) 95 (gemiddeld) 10 (gemiddeld) 100 (gemiddeld) 11 (gemiddeld) 105 (gemiddeld) 12 (gemiddeld) 110 (gemiddeld) 13 (goed) 115 (bovengemiddeld) 14 (goed) 120 (bovengemiddeld) 15 (goed) 125 (begaafd) 16 (zeer goed) 130 (begaafd) 17 (zeer goed) 135 (zeer begaafd) 18 (zeer goed) 140 (zeer begaafd) 19 (zeer goed) 145 (zeer begaafd) Tabel 2: IQ-equivalenten van WISC-III-normscores. Achter de normscores wordt tussen haakjes de classificatie weergegeven zoals onder meer gehanteerd door Kaldenbach (2006) en Sattler & Saklovske (2001). Bij de IQ-equivalenten is de indeling van Resing & Blok (2002) vermeld. 4. Laaggemiddeld en hooggemiddeld Sommige gedragsdeskundigen op ons werk vinden de range voor het gemiddelde erg groot. Op die manier krijgt een kind met een IQ van 91 dezelfde classificatie als een kind met een IQ van 109. Om deze reden brengen zij binnen de range subtypen aan ( laaggemiddeld en hooggemiddeld ). Wat vind u hiervan? Er zit inderdaad een behoorlijk verschil (18 punten) tussen de genoemde getallen. Echter, beide gemeten IQ s zijn een schatting met een 95%-betrouwbaarheidsinterval. Deze intervallen overlappen elkaar waardoor gesteld kan worden dat het verschil tussen 91 en 109 waarschijnlijk door toeval is bepaald. Er is ook een ander statistisch argument om IQ s tussen de niet laaggemiddeld te noemen (los van de 4 kind en adolescent praktijk 2 - juni 2007

5 Foto: Aleid Denier van der Gon verwarring die bij lezers van het rapport kan ontstaan over diagnosten die deze indeling hanteert, reserveert de term het verschil tussen laaggemiddeld en benedengemiddeld ). hooggemiddeld voor scores tussen de 110 en 115, en laag- Indien een IQ van bijvoorbeeld 93 laaggemiddeld genoemd gemiddeld voor scores tussen de 85 en 90. Kortom, er bestaat wordt, differentieert de onderzoeker binnen de range van ook over deze termen geen eenduidigheid en geadviseerd het gemiddelde op een punt waar de behaalde score nog niet wordt ze verder niet te gebruiken. eens een halve standaarddeviatie van het puntgemiddelde afwijkt. De gehanteerde subtypering is bij een normaalverdeelde variabele statistisch niet te verantwoorden. De grenzen 5. Methode Serlier-Van den Bergh Ik heb pas een WISC-III-cursus gevolgd bij mw. dr. Annemaaike van 90 en 110 zijn in die zin al een concessie aan de statistiek Serlier-Van den Bergh. Een aantal onderdelen verschilt van de omdat deze op tweederde standaarddeviatie van het gemid- hiërarchische analysemethode zoals door u beschreven. Wat zijn de delde liggen (zie Kaldenbach, 2006). Hetzelfde kan gesteld belangrijkste verschillen en welke overwegingen liggen hieraan ten worden voor IQ s tussen die incidenteel als hoogge- grondslag? middeld in rapporten worden teruggevonden. Er wordt dan een mate van exactheid gesuggereerd die niet waar te maken Serlier is een deskundige neuropsycholoog en was onder is en losstaat van de onderliggende statistische kenmerken. meer actief betrokken bij de ontwikkeling van de WISC-R. Sommigen hanteren als gemiddelde range voor IQ-scores Voor een gedetailleerde beschrijving van haar methode kan , namelijk de scores binnen één standaarddeviatie (15) bij haar praktijk een up-to-date reader worden besteld. van het gemiddelde (100). In Kaldenbach (2006) werden de overwegingen hierbij al besproken. Een deel van de psycho- kind en adolescent praktijk 2 - juni 2007 Naast een aantal overeenkomsten zijn er ook verschillen tussen de twee methoden. Overeenkomsten zijn onder 5

6 meer het hanteren van een aantal handleidingtabellen, het significantieniveau p<0.05 en de classificatie van IQ-scores volgens Resing en Blok (2002). Ook de stapsgewijze opbouw en onderbouwde structuur van de analysemethoden is een punt van gelijkenis. Geen van beide methoden is statisch; zij ontwikkelen zich verder in het licht van nieuwe bevindingen en inzichten. Een belangrijk verschil is het gebruik van de factor Vrijheid van afleidbaarheid (door Serlier ook wel de NA-factor genoemd, Niet-Afleidbaarheid ). De factor Vrijheid van afleidbaarheid omvat de subtests Rekenen en Cijferreeksen. Binnen de WISC-R maakte Substitutie ook onderdeel uit van deze factor, maar binnen de WISC-III is Substitutie verhuisd naar de factor Verwerkingssnelheid. Serlier gebruikt de grootte van het verschil tussen de NA-factor en de VB-factor om te bepalen of het VIQ mag worden geïnterpreteerd. In Kaldenbach (2006) wordt beschreven dat de NA-factor op de oude WISC-R van toepassing is en alleen bij sommige buitenlandse versies van de WISC-III (zwak) wordt teruggevonden in factoranalytisch onderzoek en een omstreden status heeft. Ook andere publicaties beschrijven uitgebreid de zwaktes van deze factor, die in de WISC-IV nu ook internationaal helemaal is verstoten (Prifitera e.a., 2005). In Nederland wordt deze factor zelden teruggevonden en is deze statistisch zwak te noemen, reden waarom de factor binnen de hiërarchische analysemethode liever buiten beschouwing wordt gelaten. Serlier vindt de factor evenwel informatief en gebruikt deze daarom klinisch en wat voorzichtiger dan de rest, omdat het weglaten ervan in haar visie ook leidt tot het missen van belangrijke informatie. Factoranalytisch onderzoek is namelijk gebaseerd op groepen kinderen en in een groep gaat ook veel individuele informatie verloren. Voorstanders van klinisch gebruik van statistisch onvoldoende sterke factoren, zouden dan als het ware bij ieder WISC-III-profiel een soort n=1 klinische factoranalyse kunnen toepassen, waarbij wordt gekeken welke subtests opvallend afwijken in een bepaalde richting en wat de gemene deler van deze subtests is. Het is echter de vraag of de NA-factor hierin dan apart dient te worden uitgelicht. In principe zou dan voor iedere constellatie van subtests met overlap in meetpretentie of veronderstelde onderliggende cognitieve processen een factor kunnen worden onderscheiden. Denk in dat verband bijvoorbeeld aan een fictieve factor met Cijferreeksen en Plaatjes Ordenen. Ogenschijnlijk juist heel verschillend; beide doen evenwel een beroep op sequentiërende vaardigheden (CR: auditief sequentiëren, PO: visueel/ sociaal sequentiëren). Van subtests Overeenkomsten en Blokpatronen zou dan bijvoorbeeld op voorhand een factor Abstract Redeneren kunnen worden gemaakt. Hoewel dit waardevol kan zijn bij analyse van een gevonden individueel profiel, is het niet wenselijk al op voorhand factoren te onderscheiden die statistisch niet goed aantoonbaar zijn gebleken. Serlier volgt in grote lijnen de methode van Kaufman (Kaufman & Lichtenberger, 2000; Kaufman, 1994), die zij toepast op de Nederlandse populatie. In de boeken van Kaufman wordt uitgebreid aandacht besteed aan verantwoorde onderbouwing; het staat buiten kijf dat dit een goede, solide methode is voor WISC-III-analyse en -interpretatie. Er is internationaal ook kritiek op Kaufmans methode waarbij wordt betoogd dat Kaufman en zijn aanhangers te veel nadruk leggen op statistische analyse van intelligentietests en te weinig stilstaan bij klinische toepassing (Weiss e.a., 2006; Prifitera e.a., 2005). Deze kritiek lijkt niet op Serlier van toepassing omdat zij wel degelijk ook met een klinische bril kijkt en toepast. Het toepassen van Kaufmans methode in Nederland heeft als nadeel dat dan Amerikaanse normgegevens bij de Nederlandse (en Vlaamse) populatie worden gebruikt terwijl het niet vanzelfsprekend is dat Amerikaanse kinderen (en meer specifiek: de Amerikaanse steekproef) representatief zijn voor de Nederlands-Vlaamse doelgroep. Het is ook niet voor niets dat de WISC-III NL is gebaseerd op de WISC-III UK, omdat werd verondersteld dat de verschillen met Groot-Brittannië aanzienlijk kleiner zouden zijn dan met de Verenigde Staten (Kort e.a., 2005). In navolging van Kaufman kent Serliers methode een aantal regels, waarvan enkele hier nu kort zullen worden besproken. Een van de regels is het niet mogen interpreteren van het verbaal IQ als er minimaal 7 punten verschil is tussen de hoogste en de laagste verbale subtest. Binnen de performale schaal ligt de grens bij 9 punten verschil tussen performale subtests. Het beschouwen van absolute verschillen tussen scores binnen eenzelfde schaal om te beoordelen of de schaal als geheel nog geïnterpreteerd mag worden, is wezenlijk anders dan wat de hiërarchische analysemethode kenmerkt, waarbinnen juist de schaal als geheel als uitgangspunt wordt genomen en wordt onderzocht of de subtests binnen die schaal zich binnen aanvaardbare marges van dat gedeelde concept (lees: het schaalgemiddelde) bevinden (Kaldenbach, 2006). Overigens kijkt Serlier ook naar subtestafwijkingen van het eigen gemiddelde, alleen worden er afhankelijk van de betreffende subtest grensscores van 3, 4 of 5 punten gehanteerd waar Kaldenbach altijd uitgaat van 3 punten (één standaarddeviatie). De grootte van de absolute onderlinge afwijkingen tussen subtests (cut-off gebaseerd op Amerikaanse statistiek) of de richting van de afwijking ten opzichte van het schaalgemiddelde (wat zeer bepalend is voor het absolute verschil tussen subtests binnen een schaal), is binnen de hiërarchische analysemethode ondergeschikt, zolang deze maar in de buurt 6 kind en adolescent praktijk 2 - juni 2007

7 ligt van dat centrale concept (binnen een straal van 3 punten van het schaal- of factorgemiddelde). Is de afwijking binnen de marges (zie Kaldenbach, 2006), dan wordt de schaal binnen de hiërarchische analysemethode intern consistent genoemd. Een schaal of factor kan dan dus intern consistent zijn terwijl er binnen die schaal of factor wel degelijk subtests kunnen voorkomen die significant van elkaar verschillen volgens de tabel in de handleiding. Over deze subtestverschillen kunnen hypothesen worden geformuleerd. Een andere regel binnen Serliers methode is dat het PIQ niet mag worden geïnterpreteerd indien de factoren PO en VS meer dan 15 punten verschillen. Binnen de hiërarchische analysemethode is het uitgangspunt dat het PIQ geïnterpreteerd mag worden zolang de performale schaal intern consistent is (geen van de performale subtests wijkt 3 punten of meer af van het schaalgemiddelde), ongeacht hoe de factoren PO en VS zich tot elkaar verhouden. Opmerkelijk is dat de score op subtest Symbolen Vergelijken (onderdeel van de VS-factor) er dus voor kan zorgen dat het performaal IQ niet mag worden geïnterpreteerd, terwijl Symbolen Vergelijken geen subtest is die (standaard) deel uitmaakt van de performale schaal. Verder stelt Serliers methode dat een verschil van 11 punten of meer tussen VIQ en PIQ op iedere leeftijd significant is (zie Kaufman & Lichtenberger, 2000). Om te bepalen of de VIQ-PIQ discrepantie significant is, wordt door Kaldenbach tabel B.4 van de handleiding als uitgangspunt genomen, waarin bij p<0.05 afhankelijk van de leeftijd van het kind significantie optreedt bij discrepanties tussen de punten. Volgens de tabel in de Nederlandse handleiding is een verschil van 11 punten op geen enkele leeftijd significant, wat een duidelijk verschil is met de stelregel dat een verschil van 11 punten juist altijd significant is. Het is van belang dat psychodiagnosten voor zichzelf bepalen of ze gebruik wensen te maken van algemene vuistregels of handleidingtabellen; beide kennen voor- en nadelen. Hoewel er overeenstemming is wat betreft de classificatie van IQ-scores, is er verschil in naamgeving op het niveau van de normscores. Kaldenbach (2006) en Sattler en Saklofske (2001) noemen bijvoorbeeld alle normscores tussen 8 en 12 gemiddeld, Serliers methode kent de classificatie gemiddeld toe aan de normscores Eerder in dit artikel werd toegelicht hoe normscores kunnen worden omgerekend naar IQscores (zie tabel 2). Een normscore van 8 is gelijk aan een IQ van 90, de normscore 12 heeft 110 als IQ-equivalent. Binnen de hiërarchische analysemethode is ervoor gekozen analoog aan de range (Resing & Blok, 2002) op het niveau van de normscores 8-12 als gemiddeld te classificeren. Wanneer de range 9-11 als uitgangspunt dient, zou bij omrekening de consequentie zijn dat alleen IQ s tussen gemiddeld genoemd mogen worden. De grenzen van het gemiddelde zouden dan al komen te liggen bij een afwijking van éénderde standaarddeviatie van het puntgemiddelde. Gesteld kan worden dat Serliers methode wat uitgebreider is, met name op het gebied van de profielanalyse. Zij geeft de terechte waarschuwing dat profielanalyse alleen op hypothesevormende wijze en klinisch mag worden toegepast. Anders bestaat het risico dat psychodiagnosten uitspraken doen met een zekerheid die niet waar te maken is vanwege de lage subtestbetrouwbaarheden (zowel over individuele kinderen als ten aanzien van groepen kinderen met een bepaalde stoornis, zoals ADHD, PDD-NOS of NLD). De COTAN waarschuwde eerder tegen analyseren op subtestniveau, evenals de WISC-III-handleiding (NIP, 2005; Kort e.a., 2005). Voor verantwoorde hypothesevormende betekenisverlening aan significante subtestverschillen wordt verwezen naar Sattler en Saklofske (2001) die een uitgebreide opsomming geven van mogelijke betekenissen van allerlei verschillen tussen normscores. Via kan een bestand met profielhypothesen worden gedownload (zie verderop). Binnen de hiërarchische analysemethode wordt de WISC- III beschouwd als een goed instrument voor een cognitieve niveaubepaling, een globale sterkte/zwakte analyse en hypothesevorming die mogelijk binnen vervolgonderzoek nader kan worden getoetst. Collega s met een grote deskundigheid in specifieker analyseren op subtestniveau ( doorpuzzelen ) zullen in de hiërarchische methode mogelijkheden tot een meer gedifferentieerde verfijning onbenut zien. De te maken diagnostische keuze is het bepalen van het moment waarop de onderzoeker stopt met analyseren. Hierbij moet de afweging worden gemaakt tussen enerzijds geen klinisch relevante informatie willen missen en anderzijds voldoende betrouwbare uitspraken kunnen doen. Er zijn ongetwijfeld meer overeenkomsten en verschillen te benoemen dan hier besproken. De lezer kan zelf beoordelen wat de voor- en nadelen van de verschillende methoden zijn. Geen van de methoden is heilig of zonder beperkingen. Ze kunnen worden beschouwd als twee gedifferentieerde analysemethoden die naast elkaar bestaan en behalve een aantal overeenkomsten ook enkele duidelijke inhoudelijke verschillen kennen. Het is aan de psychodiagnost om zijn visie te bepalen en keuzes te maken, net zoals je bij de behandeling van een depressie als therapeut bijvoorbeeld kunt kiezen voor cognitieve gedragstherapie of interpersoonlijke therapie. Er leiden meerdere wegen naar Rome, waarbij er altijd sluiproutes, omwegen en doodlopende weggetjes zijn. Het is goed dat er meerdere methoden bestaan omdat dit leidt tot vakinhoudelijke discussie, scherpte en een proces van continue ontwikkeling. kind en adolescent praktijk 2 - juni

8 6. De LVG-methode Wat wordt geadviseerd ten aanzien van gebruik van de LVG-methode voor de WISC-III? In De Psycholoog verscheen enkele jaren geleden een artikel van Wim Pesch en Albert Ponsioen over het gebruik van de WISC-III bij de populatie van licht verstandelijk gehandicapten (Pesch & Ponsioen, 2004). Kort gezegd werd hierin een scoringsprotocol voorgesteld dat meer recht doet aan de specifieke kenmerken van de LVG-doelgroep. Er vindt een aangepaste berekening plaats van de IQ-scores, waarbij in de schalen ook subtests Cijferreeksen (VIQ) en Doolhoven (PIQ) worden meegewogen in het schaal-iq (uiteraard met statistische correctie voor de toevoeging van een extra subtest: de schaalscores worden met 5/6 vermenigvuldigd). Ook werd gebruik van een vierde factor voorgesteld, de zgn. numerieke factor. Voor meer informatie wordt naar het betreffende artikel verwezen. De voorgestelde aanpassing van de WISC-III-analysemethode bij de LVG-populatie is gebaseerd op onderzoek bij deze doelgroep met de eerste versie van de WISC-III uit Zoals bekend is deze in opspraak geraakt, waardoor in oktober 2003 en ten slotte mei 2005 herziene normen verschenen. In een mailcorrespondentie met de auteurs (januari 2006) meldde Pesch dat het voortschrijdende inzicht hun methode wat overbodig leek te maken en psychodiagnosten beter de handleiding kunnen aanhouden. Voor meer informatie over de waarde van een IQ-score bij kinderen met een lichte verstandelijke beperking wordt tevens verwezen naar Ponsioen (2005). 7. Kraijer: WISC-III-IQ s onder de 45 Ik heb gehoord over de methode van Kraijer waarbij met de WISC-III mogelijkheden ontstaan om ook binnen IQ s onder de 45 te differentiëren. Wat is u hierover bekend? Kraijer en Plas (2006) beschrijven in hun boek een methode om de WISC-III te kunnen gebruiken bij beperkte begaafdheid, gebaseerd op de meest recente editie van de test (Kort e.a., 2005). Omdat bij deze doelgroep per definitie een kloof bestaat tussen de kalenderleeftijd en de ontwikkelingsleeftijd of verstandelijke leeftijd, is testkeuze op basis van kalenderleeftijd vaak niet zinvol omdat er dan een bodemeffect gemeten zal worden (de tabelscores in de handleiding beginnen pas bij testprestaties die hoger liggen dan de testprestatie van dit kind). Kraijer en Plas (2006) adviseren daarom om een intelligentietest te kiezen op basis van de geschatte ontwikkelingsleeftijd en de kalenderleeftijd niet richtinggevend te laten zijn. Bij voorkeur wordt binnen hun methode een test gekozen met een handleidingtabel van de leeftijdsequivalent ( referentieleeftijd ), passend bij de ontwikkelingsleeftijd van het kind. Een jongen van veertien die wordt geschat op een ontwikkelingsleeftijd van zeven jaar kan dus prima de WISC-III doen, wordt hij geschat op een ontwikkelingsleeftijd van vijf jaar, dan heeft de WPPSI-R binnen deze methode de voorkeur boven de WISC-III, ondanks het feit dat de kalenderleeftijd aanzienlijk buiten het bereik van de WPPSI-R valt. Het gebruik van leeftijdequivalenten kan soms verwarring zaaien. Zo is het mogelijk dat een kind van 12;10 jaar een referentieleeftijd heeft van twee jaar jonger (10;10 jaar) terwijl zijn behaalde prestatie nog steeds valt binnen de marges van het gemiddelde bij vergelijking met leeftijdgenoten. De lezer kan zich voorstellen hoe eenvoudig het is om op basis van deze gegevens een ontwikkelingsachterstand van twee jaar te veronderstellen, terwijl dit niet juist is. Ook binnen een normale ontwikkeling bestaat aanzienlijke spreiding en het is altijd belangrijk om ook een normale ontwikkeling op te nemen in de differentiaaldiagnostiek. De WISC-III-handleiding vermeldt in tabel D.9 leeftijdsequivalenten vanaf 6;2 jaar voor ruwe subtestscores. Een referentieleeftijd/leeftijdsequivalent is de leeftijd waarop de behaalde score precies gemiddeld zou zijn geweest. In de praktijk wordt dan vaak gezegd dat een kind functioneert op het niveau van bijvoorbeeld een zevenjarige. Kraijer en Plas (2006) hebben een soortgelijke tabel ontwikkeld voor de WISC-III-leeftijdsequivalenten tussen 3;2 en 5;10 jaar. Hiervoor maakten zij gebruik van de methodiek van Smulders (1969). Er wordt vervolgens beschreven hoe op basis van de verhouding tussen referentieleeftijd (bij een zeer disharmonisch beeld kan in plaats hiervan de mediaan van de subtest referentieleeftijden gekozen worden) en kalenderleeftijd een IQ-score kan worden berekend die in de praktijk kan vallen onder het IQ-bereik van de WISC-III-handleiding. Een tienjarige jongen die op alle WISC-III-subtests minimaal scoort, zou volgens deze methode een VIQ en PIQ van 32 halen, terwijl de WISC-III-handleiding vanwege een bodemeffect zou uitkomen op een VIQ of PIQ <55. Voordeel van de beschreven methode is dat er differentiatie kan plaatsvinden waar de handleiding alles beneden de 55 op één hoop gooit. Hoewel de methode systematisch en onderbouwd is, is terughoudendheid geboden met het introduceren en beschrijven van WISC-III-IQ s die onder de bodem van deze test liggen en dus principieel fictief zijn. Bovendien kan men zich afvragen welke betekenis/validiteit het concept intelligentie heeft aan beide uiteinden van het spectrum. Dit is één van de redenen waarom het IQ-bereik van de meest recente editie van de WISC-III ook drastisch is beperkt. In de handleiding uit 2002 kwamen nog IQ s van 188 voor, nu komt een kind met dezelfde score in de huidige handleiding op een TIQ van 8 kind en adolescent praktijk 2 - juni 2007

9 145. Wanneer wordt uitgegaan van de normaalverdeling (zie figuur 1), kan gesteld worden dat 0,13% van de kinderen (dat is ruim anderhalf kind bij de WISC-III-steekproefgrootte van n=1239) een IQ heeft van 55 of 145 (beide drie sd s van het gemiddelde). Kraijer en Plas (2006) beschrijven helder dat hun methode een praktische doch methodologisch en ontwikkelingspsychologisch niet vlekkeloze oplossing is. Hoewel berekende leeftijdsequivalenten nauwkeuriger zijn dan geëxtrapoleerde, bezitten ze toch in vrij sterke mate het karakter van een schatting. Terughoudendheid bij de interpretatie is dus geboden (Kraijer & Plas, 2006, p. 383). Blokpatronen Ernst Ottem is Cijferreeksen een Noorse wetenschapper van het Begrijpen National Centre Figuur Leggen for Logopedics Substitutie in Oslo, die veel onderzoek heeft gedaan Woordkennis naar Doolhoven Wechslertests bij kinderen met beperkingen, voornamelijk op het gebied van taal en leren. Via een zoekopdracht op Overeenkomsten PubMed ( is een helder overzicht te vinden van zijn bevindingen ten aanzien van de WPPSI en de WISC-R. Zo ontwikkelde Ottem (1999) voor de WISC-R een nieuwe clustering van subtests voor kinderen met leesstoornissen (o.a. dyslexie) en autismespectrumstoornissen omdat eerdere indelingen van bijvoorbeeld Kaufman (1994) of Bannatyne (1974) bij deze populatie geen adequate verklaring konden bieden voor de verschillende pieken en dalen in de profielen. Dit leidde tot een nieuwe indeling in factoren die geclusterd zijn op basis van gemeenschappelijke onderliggende cognitieve processen (Ottem, 1999), in plaats van ad hoc statistisch factoranalytisch onderzoek bij algemene groepen met een ondervertegenwoordiging van kinderen met specifieke problematiek (indelingen van Kaufman en Bannatyne). Ten aanzien van drie modi van cognitief functioneren onderscheidt Ottem per modus twee factoren: een verbale-nonverbale modus (verbale en non-verbale factor), een kennismodus (procedurele en declaratieve factor) en een verwerkingsmodus (transformatie- en preservatiefactor). In een latere publicatie past Ottem (2003) de indeling aan waarbij deze niet langer specifiek is voor enkele doelgroepen. Hij maakt een onderscheid tussen kennisafhankelijke ( knowledge-dependent ) en van informatieverwerking afhankelijke ( processingdependent ) subtests waarbij binnen beide typen subtests wordt gedifferentieerd tussen zien (wat en hoe) en weten (wat en hoe). In figuur 2 is de indeling van Ottem (2003) vertaald naar de WISC-III (subtest Symbolen Vergelijken is toegevoegd door ondergetekende, verder hebben de WISC-R en de WISC-III ,13% 2,15% 13,59% 34,13% 34,13% 13,59% 2,15% 0,13% dezelfde subtests). WISC-III afhankelijk van informatieverwerking afhankelijk van kennis zien hoe weten hoe zien dat weten dat Plaatjes Ordenen Rekenen Onvolledige Tekeningen Informatie 0,13% ,15% 13,59% 34,13% 34,13% 13,59% 2,15% 0,13% Blokpatronen Cijferreeksen Begrijpen Figuur Leggen Substitutie Woordkennis Figuur 1: Normaalcurve met percentages en IQ s aan de hand van standaarddevaties Symbolen Vergelijken WISC-III afhankelijk van 8. De Ottemfactoren afhankelijk van informatieverwerking kennis Is het verantwoord gebruik te maken van de Ottemfactoren bij de zien WISC-III? weten zien weten Plaatjes Ordenen Rekenen Onvolledige Tekeningen Informatie Doolhoven Overeenkomsten Symbolen Vergelijken Figuur 2: Indeling van WISC-III-subtests gebaseerd op Ottem (2003) De Ottemfactoren zijn in Nederland vrij onbekend gebleven en slechts incidenteel onderzocht (Nieuwenhuis, 2005). Los van de inhoudelijke kritiek die denkbaar is op de soms arbitraire toewijzing van subtests door Ottem (1999; 2003) aan bepaalde factoren, is het voornaamste bezwaar dat de indeling gebaseerd is op de WISC-R en er bij de auteur van dit artikel geen publicaties bekend zijn met betrekking tot validering van de Ottemfactoren in relatie tot de WISC-III. Dat maakt toepassing op de WISC-III discutabel, in afwachting van verder onderzoek. Zijn methode is evenwel als concept een waardevolle aanvulling op de klassieke manieren van analyseren, omdat deze meer aandacht heeft voor onderliggende cognitieve processen en hierdoor meer gerichte mogelijkheden biedt om bij kinderen met specifieke stoornissen te ontrafelen waar de sterke en zwakke kanten liggen. 9. Bestaan cultuurvrije tests? Ik werk veel met allochtone adolescenten. Daarom kies ik eigenlijk automatisch voor de SON-R omdat die cultuurvrij is. Welke waarde heeft de WISC-III binnen deze populatie? Om te beginnen is het goed te benadrukken dat geen enkele test cultuurvrij is. Iedere test doet een beroep op impliciete (Nederlandse) taal- en cultuurkennis. Het accent op verbale capaciteiten kan echter per test verschillen. kind en adolescent praktijk 2 - juni

10 Nederlandse intelligentietests zijn niet racistisch, maar wel etnocentrisch, waardoor met name niet-westerse migranten worden benadeeld en hun IQ in die zin altijd een onderschatting van hun werkelijke mogelijkheden vormt (in de internationale literatuur staat het verschil tussen capaciteiten en testprestatie bekend als de ability-achievement discrepancy ). De vertekening ( bias ) werkt altijd één kant op en hangt samen met wat wel de acculturatiegraad wordt genoemd (Georgas e.a., 2003). Ook de SON-R is geen zuiver non-verbale test (overigens wel een stuk non-verbaler dan de WISC-III), zeker niet wanneer de test op verbale wijze wordt afgenomen. In tabel 3.21 van de WISC-III-handleiding is te zien dat allochtone kinderen weliswaar gemiddeld een kleine 10 punten lager scoren dan autochtone kinderen, maar dat dit geen specifiek lagere score is op de verbale onderdelen. Het algemene beeld dat allochtonen vanwege de taal beter een non-verbale test kunnen ondergaan, blijkt empirisch dus niet vanzelfsprekend: allochtone kinderen die met de WISC-III getest worden, kennen geen specifieke verbale uitval. Vergelijkbare bevindingen kwamen naar voren in een Amerikaans onderzoek (In: Weiss e.a., 2006) waarbij de WISC-IV onder Hispanics werd afgenomen. De verschillende IQ-factoren correleerden positief met de acculturatiegraad, maar van (specifieke) verbale uitval was geen sprake. Het is waarschijnlijk dat de lagere prestatie van allochtonen als groep op de WISC-III grotendeels verklaarbaar is vanuit demografische en sociaal-economische factoren en dat van de lagere scores, indien hiervoor gecorrigeerd, weinig overblijft. Weiss e.a. (2006) beschrijven een onderzoek waarin na aftrek van dit type factoren slechts 1,6% verklaarde variantie binnen het totaal IQ overblijft, die toe te schrijven is aan de etnische achtergrond. Er wordt meer variantie verklaard door de verwachtingen van ouders ten aanzien van de prestaties van hun kind (31%), dan door het opleidingsniveau en het inkomen van de ouders bij elkaar. Een nadeel van de SON-R is de smallere meetpretentie (non-verbale capaciteiten) ten opzichte van de WISC-III (bij sommige doelgroepen is dit juist een voordeel). Daar staat tegenover dat de SON-R door de COTAN beter is beoordeeld dan de WISC-III: goed op alle zeven categorieën, tegenover voldoende normen, betrouwbaarheid en begripsvaliditeit van de WISC-III, naast de onvoldoende op criteriumvaliditeit wegens gebrek aan onderzoeksgegevens op dit vlak (NIP, 2000/2005). Enige nuancering van de COTAN-beoordeling van de SON-R 5 1 /2-17 (Snijders e.a., 1988) is echter op zijn plaats. De COTAN noemt normen na 15 jaar verouderd en na 20 jaar onbruikbaar. De normgegevens in de SON-R 5 1 /2-17 handleiding en op de cd-rom zijn verzameld in de periode voor publicatie, in COTAN-beoordelingen hebben een beperkte geldigheidsduur en het zou interessant zijn te discussiëren over de mogelijkheid van het ontwikkelen van een uiterste houdbaarheidsdatum voor COTAN-beoordelingen. De SON-R 5 1 /2-17 werd in 1990 beoordeeld. De SON-R 2 1 /2-7 werd in 1998 uitgegeven en het normeringsonderzoek vond in plaats, waardoor de goede COTAN-beoordeling van deze test (eveneens zeven keer goed ) minder gedateerd is. Een ander verschil tussen de WISC-III en de SON-R is dat deze laatste uitsluitend 80%- waarschijnlijkheidsintervallen vermeldt, wat betekent dat de kans op een meetfout 20% is. De WISC-III biedt de keuze tussen betrouwbaarheidsintervallen van 90% en 95%. De keuze voor een SON-R of een WISC-III hangt af van de reden van het onderzoek. De predictieve validiteit ten aanzien van een extern criterium (bijv. schoolsucces) is voor allochtone en autochtone kinderen even hoog. Bij de vraag naar een schooladvies is het juist verstandig om een test te kiezen met de veronderstelde taal- en cultuurkennis (bijvoorbeeld de WISC-III of de NIO), want tegen deze bias lopen kinderen op school ook aan. Tenslotte nog een praktisch punt voor psychodiagnosten die regelmatig kinderen testen van ouders die het Arabische schrift gebruiken. Het zal hun meer dan eens zijn opgevallen dat jonge kinderen bij de WISC-III-subtest Plaatjes Ordenen de plaatjes conform het Arabische schrift van rechts naar links neerleggen. Zolang de volgorde correct is en het kind duidelijk noemt bij welk kaartje het verhaal begint, mag u dit antwoord goed rekenen. Een leuke illustratie kan toelichten welke invloed achtergrond kan hebben bij het beantwoorden van testvragen. Bekijk figuur 3 en beschrijf in één zin met de woorden bomen en onweer wat u ziet. Doe dit in chronologische volgorde. Westerse mensen met een schrift van links naar rechts zullen waarschijnlijk iets zeggen als Het is mooi weer bij de bomen, maar er komt onweer aan. Mensen die gewend zijn van rechts naar links te lezen (Arabisch schrift, Ivriet, etc.), neigen eerder naar antwoorden als Het onweerde net, maar nu is het weer bij de bomen opgeklaard. En mensen uit bepaalde delen van Afrika zullen geen bomen zien maar hierin drie struisvogels herkennen, met hun kop in het zand gestoken. Waarneming, zo blijkt maar weer, is subjectief en geschiedt door een bril van aanwezige kennis en ervaring, en is dus cultuurgebonden. Bij doelgroepen die doorgaans meer moeite tonen bij het presteren op tests (of dit nu allochtonen zijn of kinderen met bijvoorbeeld leerstoornissen), herkennen veel onderzoekers de neiging om, sterker dan bij andere kinderen, eruit te halen wat erin zit. Er wordt dan meer doorgevraagd op testitems waarbij dit wel mag van de handleiding maar niet wordt voorgeschreven, om ervoor te zorgen dat het IQ een weergave is van wat een kind maximaal kan. In de Engelsta- 10 kind en adolescent praktijk 2 - juni 2007

11 lige literatuur wordt hiernaar verwezen als de discussie over het willen meten van een typical vs. an optimal performance (Prifitera e.a., 2005). Streven naar een optimale prestatie lijkt nobel en kindvriendelijk, maar heeft als nadeel dat het IQ vervolgens meer capaciteiten kan suggereren dan dat het kind in de schoolsituatie kan waarmaken. Daar zit hij doorgaans immers niet één-op-één met een leerkracht die hem zo intensief begeleidt en in dezelfde mate als de onderzoeker moeite doet om hem optimaal te laten presteren en daarbij aanvankelijke fouten door de vingers ziet. Op proefwerken krijgen kinderen ook geen punten voor vragen die in eerste instantie fout zijn maar waarbij na herhaald doorvragen toch het inzicht was getoond dat het kind het goede antwoord weet. Bij bepaalde antwoorden op verbale onderdelen is doorvragen verplicht, bij de overige vragen wordt geadviseerd hiermee enigszins behoudend om te gaan, ook omdat doorvragen eigenlijk een vorm van feedback geven is (het kind merkt dat zijn antwoord blijkbaar niet goed genoeg is) en de motivatie kan beïnvloeden. Figuur 3: Beschrijf in één zin met de woorden bomen en onweer in chronologische volgorde wat u hier ziet 10. Waarom Tabel C.1 niet wordt gebruikt binnen de hiërarchische analysemethode Binnen de hiërarchische analysemethode is het uitgangspunt dat een schaal of factor intern inconsistent wordt genoemd wanneer minimaal één subtest 3 punten of meer afwijkt van het schaal- of factorgemiddelde. In tabel C.1 van de handleiding is echter te zien dat deze stelregel soms onnauwkeurig is en soms kan leiden tot enkele decimalen verschil per subtest. Waarom maakt u geen gebruik van deze tabel? Indien gekozen wordt voor gebruik van een tabel uit de handleiding, dan ligt tabel C.1b het meest voor de hand voor de schalen, omdat deze uitgaat van de 5 standaardsubtests van iedere schaal. Tabel C.1a neemt 4 subtests per schaal als uitgangspunt, wat een verwarrende benaming is, omdat het hier de factoren Verbaal Begrip en Perceptuele Organisatie betreft. Wanneer u gebruik maakt van de handleiding op dit punt, stuit u op het probleem dat er niet wordt voorzien in getallen ten aanzien van de factor Verwerkingssnelheid in deze tabel. De mogelijkheid bestaat om in tabel B.5 de betrokken subtests Substitutie en Symbolen Vergelijken op onderling significante verschillen te toetsen, maar er wordt dan een andere methode gehanteerd dan in de C.1-tabellen en er wordt bovendien uitgesplitst naar leeftijd. Het zou inconsequent zijn om binnen de factoren verschillende methodes te hanteren. Verschillen die je dan vindt, kunnen een gevolg zijn van verschillen in toegepaste analysemethoden en daardoor ruis veroorzaken bij het doen van betrouwbare uitspraken over het kind en zijn profiel. Los hiervan is er echter nog een andere reden waarom de hiërarchische analysemethode kiest voor de 3 punten en tabel C.1 niet gebruikt. De hiërarchische analysemethode is gebaseerd op de statistische kenmerken van de normscores (m=10, sd=3) en het uitgangspunt dat iets gemiddeld wordt genoemd als het minder dan een standaarddeviatie afwijkt van het schaal- of factorgemiddelde. Dat is iets anders dan het hanteren van een grensscore vanaf welke een statistisch significant verschil is ontstaan binnen een specifieke steekproef. Het is mogelijk ervoor te kiezen aan de hand van de handleidingtabel te bepalen of er interne inconsistentie op schaalniveau bestaat, waarbij grensscores soms bijvoorbeeld 2,7 of 3,4 zijn (niet altijd exact 3). Iedere afwijking van 3 in tabel C.1 zou echter gezien kunnen worden als een imperfectie van de steekproef, omdat de scores van de steekproef als geheel geïndexeerd zijn op m=10 en sd=3. Dat dit vervolgens niet bij iedere subtest of op iedere testleeftijd exact terugkomt, heeft betrekking op toevalsvariabelen (meetfout) en steekproefkenmerken. Een illustratie vanuit de kansberekening kan toelichten waarom binnen de hiërarchische analysemethode op dit punt bewust is gekozen voor de algemene statistiek en niet die van de steekproef uit de handleiding. Bij een steekproef met een dobbelsteen van n=60 worpen, is er een algemene statistische kans dat je tien keer een 6 gooit. In een losse trial van 60 worpen zal waarschijnlijk niet elk cijfer precies tien keer worden gegooid, wat natuurlijk niets verandert aan het feit dat de kans op een 6 gewoon 1/6 is en blijft (uitgaande van eerlijke en betrouwbare dobbelstenen, een rechte ondergrond, etc.). Het is mogelijk dat er bij deze 60 worpen twaalf keer een 6 wordt gegooid, en de volgende 60 worpen slechts acht zessen opleveren. Je zou dan na de eerste 60 worpen bij de vervolgkansberekening kunnen stellen dat de kans op een 6 1/5 is, uitgaande van de specifieke kenmerken van de steekproef die zojuist is getrokken, waarin toeval bepaalde dat er in de praktijk van een steekproef afwijkingen van de algemene statistiek optraden. Of er wordt onverminderd uitgegaan van de onderliggende algemene statistiek die geldt en blijft gelden. kind en adolescent praktijk 2 - juni

Nog meer weergeven

Hiërarchische analyse van de - PDF Gratis download (2024)

References

Top Articles
Latest Posts
Article information

Author: Geoffrey Lueilwitz

Last Updated:

Views: 6364

Rating: 5 / 5 (80 voted)

Reviews: 95% of readers found this page helpful

Author information

Name: Geoffrey Lueilwitz

Birthday: 1997-03-23

Address: 74183 Thomas Course, Port Micheal, OK 55446-1529

Phone: +13408645881558

Job: Global Representative

Hobby: Sailing, Vehicle restoration, Rowing, Ghost hunting, Scrapbooking, Rugby, Board sports

Introduction: My name is Geoffrey Lueilwitz, I am a zealous, encouraging, sparkling, enchanting, graceful, faithful, nice person who loves writing and wants to share my knowledge and understanding with you.