|
Ben Vroom en Erik Hartman hebben in 1999 een gebruikstest
uitgevoerd van een prototype van www.wereldkinderen.nl. Doel
was om daarin zoveel mogelijk problemen op te sporen op het
gebied van gebruiksvriendelijkheid en effectiviteit, voordat
hij zou worden gelanceerd.
Drie vragen bij de testopzet willen we in dit artikel bespreken:
- Keuze voor plus-en-minmethode of hardopdenkmethode?
- Wel of geen opdrachten?
- Alleen gebruikersproblemen opsporen of ook problemen
vanuit zenderperpectief?
Inhoud artikel:
De website
Eerst iets over de geteste site. Wereldkinderen heeft twee
hoofdactiviteiten:
- projecthulp aan kinderen in nood in ontwikkelingslanden
- adoptie van kinderen uit die landen naar Nederlandse gezinnen
Wereldkinderen kent een landelijk bureau en 20 regio's waarin
leden actief zijn. Regio's organiseren bijvoorbeeld avonden
over adoptie in bepaalde landen en gespreksgroepen voor mensen
die op een kind wachten of er net een gekregen hebben. Ook steunen
veel regio's projecten in landen waaruit kinderen geadopteerd
zijn.

Homepage
De website bevat bijzonder veel informatie, met name over adoptie,
projecthulp, de organisatie zelf en de regionale afdelingen.
'Nieuws' en 'Het trefpunt' (discussie) waren nog oningevuld.

Beginpagina rubriek Adoptie
De gebruikstest
De gebruikstest was er dus op gericht om zoveel mogelijk problemen
op te sporen die ten koste zouden gaan van het functioneren
van de website, en aanwijzingen voor verbetering te krijgen.
Enerzijds is getracht om zoveel mogelijk gebruikersproblemen
op te sporen (gebruikersperspectief). Anderzijds is vanuit de
doelen van de website gezocht naar problemen die het bereiken
ervan in de weg zouden kunnen staan (zenderperspectief).
Inventarisatie doelen
Voordat de test werd uitgevoerd, zijn de doelen van de website
geïnventariseerd en uitgesplitst per doelgroep. Voor elke doelgroep
is een aparte vragenlijst gemaakt en een aparte lijst met opdrachten
die de proefpersonen moesten kunnen uitvoeren (bijvoorbeeld
"Meld je aan als vrijwilliger van Wereldkinderen." of "Zoek
op welke adoptiekosten fiscaal aftrekbaar zijn.").
Uitvoering
De test is uitgevoerd met behulp van de hardopdenkmethode
en de vragenlijst. De proefpersonen moesten eerst hardopdenkend
een tijdje vrijelijk op de site rondsurfen, vervolgens werd
de voor de bewuste doelgroep opgestelde vragenlijst afgenomen
en ten slotte moesten ze hardopdenkend een aantal opdrachten
uitvoeren.
Proefpersonen
De gebruikstest is afgenomen bij 15 proefbezoekers uit de zes
belangrijkste doelgroepen van de site: algemene belangstellenden,
in adoptie geïnteresseerden, mensen die op een adoptiekind wachten,
ouders met een adoptiekind, leden van Wereldkinderen die in
een regio actief zijn en mogelijke sponsors van Wereldkinderen.
Resultaten
De gebruikstest leverde een schat aan informatie over de
site op:
- 17 zeer urgente problemen (belemmeren functioneren website
ernstig)
- 41 urgente problemen (belemmeren optimaal functioneren website)
- 21 problemen (onhandig maar overkomelijk)
- 7 punten van sterke algemene waardering
Zie voor een uitgebreider overzicht de belangrijkste
resultaten op deze site of het verslag van de gebruikstest
(zie literatuurlijst onderaan).
Hardopdenkmethode of plus-en-minmethode?
Voor het opsporen van zoveel mogelijk problemen lijkt de door
ons gebruikte hardopdenkmethode voor de hand te liggen: je ziet
wat mensen doen, waar het mis gaat en krijgt dankzij de daarbij
uitgesproken gedachten inzicht in de redenen daarvoor en de
mogelijkheden om de problemen op te lossen.
Op grond van Sienot (1997) lijkt de digitale plus-en-minmethode
echter op het eerste gezicht effectiever.
Deze werkt als volgt: proefpersonen bekijken de website en omcirkelen
met de muis delen die ze goed of niet goed vinden, en zeggen
daarbij 'plus' of 'min'. De testleider registreert de plussen
en minnen, alle gedrag op het scherm wordt geregistreerd met
een screencam-programma. Na afloop wordt dit als een filmpje
opnieuw afgedraaid en lichten de proefpersonen de plussen en
minnen toe.
In zijn onderzoek levert de plus-en-minmethode in vergelijking
met de hardopdenkmethode gemiddeld per proefpersoon meer feedback
op. In totaal brengt de plus-en-minmethode zo'n 30 tot 40% méér
problemen aan het licht. Tevens is de feedback informatiever
wat betreft suggesties voor verbetering.
|
|
selectie |
begrip |
acceptatie |
relevantie
+
volledigheid |
waardering |
| hardopdenkmethode |
1.15
(14) |
4.65
(45) |
0.4
(6) |
1.75
(37) |
1.1
(23) |
| plus-en-minmethode |
0.65 (14) |
4.05
(54) |
0.5
(7) |
1.75
(38) |
2.75
(48) |
Uit onderzoek
Sienot (1997): gemiddeld aantal opgespoorde problemen per proefpersoon.
Tussen haakjes: totaal aantal verschillende problemen (bewerking
van Sienot (1997), tabel 2)
Afgaande op de uitleg in zijn publicatie lijkt Sienot echter
de hardopdenkmethode niet op de gebruikelijke manier te hebben
toegepast: hij heeft tijdens het bekijken van de site alleen
een registratie van de beeldschermbewegingen gemaakt en niet
van de hardop uitgesproken gedachten daarbij. Hij heeft achteraf
het filmpje van de beeldschermbewegingen laten becommentariëren
door de proefpersonen, net als bij de plus-en-minmethode. Wij
vermoeden dat daardoor veel van de informatie die wordt verkregen
door mensen tijdens het bekijken van de website hardop te laten
denken, verloren kan gaan. Allerlei spontane reacties zullen
niet nog eens achteraf worden geuit.
Belangrijker is dat er aanzienlijk minder tijd overblijft voor
het bekijken van de website als het commentaar achteraf verzameld
moet worden, wat bij de plus-en-minmethode onvermijdelijk is.
Wij hadden ongeveer een uur per proefpersoon. De website was
groot, dus er viel veel te bekijken en te becommentariëren/evalueren.
Tijdens de hardopdenksessies verkregen wij voortdurend relevante
feedback. Elke minuut bleek nuttig. De tijd voor het laten bekijken
zou ernstig worden beperkt als in dat uur ook tijd voor het
achteraf becommentariëren zou moeten worden ingeruimd. Bij de
gebruikelijke vorm van de hardopdenkmethode treedt die beperking
niet op, omdat bekijken en de registratie van gebruikersgedrag
en -uitingen tegelijkertijd plaatsvinden. Je kunt in dezelfde
tijd dus per proefpersoon wellicht over twee keer zoveel onderdelen
van de website feedback verzamelen. Dat is een factor van doorslaggevend
belang.
Kijken we naar het soort feedback dat Sienot met de hardopdenkmethode
en de plus-en-minmethode heeft verkregen, dan zien we hierin
geen reden om onze voorkeur voor de hardopdenkmethode te heroverwegen.
De plus-en-minmethode leverde beduidend meer informatie op over
waarderingsproblemen, de hardopdenkmethode wat meer over selectieproblemen.
De rest is ongeveer om het even. Wij neigen ernaar om selectieproblemen
belangrijker te vinden dan waarderingsproblemen. Het gaat bij
selectieproblemen, als we Sienot goed begrijpen (zijn uitleg
is niet heel duidelijk), onder meer om problemen op het gebied
van navigatie en ontsluiting van informatie. Dit zijn bij websites
over het algemeen nogal kritische aspecten. Navigatie- en ontsluitingsproblemen
kunnen ervoor zorgen dat hele delen van een website nauwelijks
bezocht worden.
Wat de verschillen in waarderingsproblemen betreft: wij nemen
aan dat Sienots resultaten minder uiteen zouden hebben gelegen
als de door ons gebruikte vorm van de hardopdenkmethode zou
zijn gebruikt. En we zijn geneigd toch meer waarde te hechten
aan informatie over de werking van de site - grofweg: inhoud,
ontsluiting en gebruiksgemak - dan over de waardering.
Wel of geen opdrachten?
Het lijkt wel of de hardopdenkmethode standaard wordt uitgevoerd
mét opdrachten (proefpersonen krijgen opdrachten die ze hardopdenkend
moeten uitvoeren). Usability-goeroe Jakob Nielsen propageert
zulke gebruikstests op zijn gerenommeerde website www.useit.com:
"There is only one valid way to gather usability data: observe
real users as they use your site to accomplish real tasks."
(Alertbox 12 december 1999, "Voodoo Usability")
Jared Spool doet in zijn boek 'Web site usability' verslag
van 14 gebruikstests van websites waarbij hij heeft getest mét
opdrachten, en ook Christian Gram heeft zijn studenten dat laten
doen. Het lijkt ook zo voor de hand te liggen. Simpel gezegd:
geef proefpersonen een aantal opdrachten om dingen op een website
te doen of te zoeken en registreer wat er mis gaat. Succes verzekerd.
|
hardopdenkmeth/
plus-en-minmeth
|
selectie |
begrip |
acceptatie |
relevantie
+
volledigheid |
waardering |
Totaal |
totaal
met opdrachten |
1.0
(17) |
5.65
(51) |
0.35
(5) |
0.85
(19) |
1.6
(30) |
9.45
(122) |
totaal
zonder
opdrachten |
0.8 (11) |
3.05
(48) |
0.55
(8) |
2.65
(56) |
2.25
(41) |
9.30
(164) |
Uit onderzoek
Sienot (1997): Vergelijking resultaten met en zonder opdrachten;
gemiddelden per proefpersoon en tussen haakjes het totaal te onderscheiden
problemen (Bewerking Sienot (1997) tabel 2. Totalen laatste kolom
berekend door Ben Vroom)
Dat het geven van opdrachten succesvol is, is ook onze ervaring.
Maar testen zonder opdrachten is waarschijnlijk minstens zo
zinvol. Bovenstaande cijfers wijzen daarop. Een grote website
kan in potentie honderden problemen herbergen. Opdrachten zijn
altijd beperkt in aantal en kunnen dus maar een beperkt aantal
problemen aan het licht brengen. De kans is groot dat proefpersonen
op veel meer plaatsen terecht komen als hun de vrije hand wordt
gelaten. Zeker als aan de gebruikstest mensen meedoen uit de
verschillende doelgroepen, kan het site-bezoek sterk uiteenlopen.
Daardoor kunnen meer onderdelen worden bezocht die problematisch
blijken. Sienot wijst op dit effect ter verklaring van de verschillen
in opgespoorde problemen op het gebied van relevantie en volledigheid.
Ook Gram wijst erop dat door het gebruik van opdrachten slechts
gedeeltes van websites zijn geëvalueerd.
Aan de andere kant ligt het voor de hand dat zoektaken extra
informatie kunnen opleveren over de vindbaarheid van informatie,
en daarmee over de interface, navigatie-elementen, de structuur
van de site. Bij het uitvoeren van opdrachten wordt echt getest
hoe mensen met de site overweg kunnen. De verschillen op het
gebied van selectieproblemen wijzen in die richting. Bovendien
lijkt Sienots onderzoek erop te wijzen dat begripsproblemen
hiermee eerder kunnen worden opgespoord, ook niet onbelangrijk.
Beide varianten hebben dus hun verschillende sterke kanten.
Gelukkig is voor een probleemopsporende gebruikstest de vraag
of je wél of géén opdrachten gebruikt, eigenlijk geen vraag.
Je kunt zonder problemen beide doen: eerst vrijelijk laten rondsurfen
en dan nog wat opdrachten geven. Dat hebben we gedaan.
Vrije surfsessies
Onze ervaring is dat je met een vrije hardopdenksessie allerhande
problemen kunt opsporen. Doordat we proefpersonen uit de verschillende
doelgroepen hebben gebruikt, die ieder een eigen interesse hadden
en op hun eigen manier de site bekeken, leverde iedere sessie
voortdurend nieuwe informatie op, naast bevestiging van informatie
uit eerdere sessies. Dit heeft ons een enorme variatie aan relevante
feedback opgeleverd. Wij schatten dat we 70 tot 80% van de informatie
via de vrije hardopdenksessies hebben verkregen. Daar zat veel
belangrijke informatie bij die we waarschijnlijk nooit hadden
gekregen als we alleen van opdrachten gebruik hadden gemaakt.
Een voorbeeld. Een nogal prominent geplaatste passage over
een intakestop bleek mensen die in adoptie zijn geïnteresseerd
tot de verkeerde conclusie te kunnen brengen dat Wereldkinderen
hun niets te bieden zou hebben.
|