Met 'Boer zoekt vrouw' de semantische kloof overbruggen

Screenshot Waisda.nl (momenteel offline, in 2011 komt er een nieuwe versie)

Screenshot Waisda.nl (momenteel offline, in 2011 komt er een nieuwe versie)

Beelden voor de toekomst

Het taggingspel Waisda? maakt deel uit van een serie pilots die binnen het project Beelden voor de Toekomst worden uitgevoerd om de mogelijkheden van publieksparticipatie te verkennen. Waisda? heeft al een aantal gerenommeerde prijzen gewonnen. Begin december won Waisda? de derde prijs op de Digitaal Erfgoedconferentie 2010. Daarvoor won het spel onder meer de 'Best Archives on the Web Award’ in de categorie ‘Best Use of Crowdsourcing for Description’. Het spel, dat spelers vraagt om tags toe te kennen aan bewegend beeld, leverde al meer dan 400.000 trefwoorden op. De succesvolle video labelinggame is ontwikkeld door het Nederlands Instituut voor Beeld en Geluid in samenwerking met de KRO in het kader van Beelden van de Toekomst. Een kijkje achter de schermen bij Waisda? leert dat tags het zoeken naar materiaal gemakkelijker maakt. Taggingdeskundige Lotte Belice Baltussen van Waisda? gaf tekst en uitleg.

Jullie winnen veel prijzen, betekent dit ook dat jullie veel spelers hebben?
"Er zijn ongeveer 600 geregistreerde spelers. Dat lijkt misschien niet veel, maar er zijn in totaal al meer dan 400.000 tags toegevoegd. Uit onderzoek blijkt dat er ook een aantal erg fanatieke spelers is. 250 mensen hebben het spel meer dan drie keer gespeeld en 40 mensen zelfs meer dan tien keer. Die 400.000 tags zijn voor ons een prachtige dataset om mee te werken."

Waarom zijn die tags zo belangrijk voor jullie?
"Het is tijdgerelateerde informatie die programma's beter doorzoekbaar maakt. Tot nu toe zijn televisieprogramma's op itemniveau beschreven. Als je echt een specifiek shot zoekt, heb je niet zoveel aan die informatie. Je moet dan een heel stuk van een programma kijken voor je bij het juiste fragment bent. Uit een onderzoek van een collega van mij blijkt dat mensen gewoon heel snel fragmenten willen kunnen nabestellen. Voor mediaprofessionals zijn de tags een uitkomst omdat ze veel effectiever kunnen zoeken. Tags zorgen ervoor dat je precies bij het juiste shot uitkomt. Er zijn verschillende manieren om tijdgerelateerde metadata toe te voegen. Zo maken we gebruik van keyframes, een chronologisch overzicht van shots uit een programma die automatisch met intervals worden gegenereerd. De gebruiker kan op een shot klikken en springt dan direct naar het desbetreffende moment in de video. Verder werken we aan de instroom van ondertitels van Teletekstpagina 888 en spraakherkenning voor radioprogramma's, wat beide eveneens tijdgerelateerde metadata is."

Hoeveel mensen werken er aan Waisda?
"De eerste versie is ontwikkeld door Johan Oomen en Maarten Brinkerink van het Nederlands Instituut voor Beeld en Geluid in samenwerking met de KRO. Zij hebben veel samengewerkt met Just Vervaart, die toen voor de KRO werkte. In september vorig jaar ben ik erbij gekomen. Ik heb voor mijn studie onderzoek gedaan naar tagging en daarmee kon ik hier doorgaan. We werken verder samen met het internetbureau Q42 en de Vrije Universiteit. De mensen van de Web & Media groep van de VU doen in het kader van het EU-project Presto PRIME onderzoek naar de tags. Bij de VU werken ongeveer 4 à 5 mensen aan Waisda? Q42 heeft de website gebouwd."

Is een spelvorm effectief voor het toevoegen van tags?
"Het ontsluiten van bewegend beeld door middel van tags is ontzettend arbeidsintensief. Crowdsourcing werkt in dit geval heel goed. Hoe meer mensen meedoen, des te sneller het gaat. Een spel is ook een leuke vorm van publieksinteractie. Spelers ontdekken dat een archief ook leuk kan zijn."

Hoe lok je mensen voor het spel?
"We doen veel aan promotie via de Boer zoekt vrouw-website en we proberen spelers vast te houden door het competitie-element. Tijdens het spelen zie je of je andere spelers aan het inhalen bent. Dat stimuleert tot doorspelen. Prijzen uitdelen werkt ook goed, hebben we gemerkt. In de periode dat je een Boer zoekt vrouw-bordspel kon winnen, heeft één speler drie uur achter elkaar gespeeld en meer dan 3.300 tags toegevoegd. In de toekomst willen we nog meer gebruik maken van het competitie-element."

Is het ontsloten archiefmateriaal alleen interessant voor mediaprofessionals?
"Ook het grote publiek heeft er veel aan, juist omdat de tags niet door archivarissen of documentalisten zijn toegevoegd. Leken gebruiken andere woorden om materiaal te zoeken en te beschrijven. In de wetenschap wordt dit de 'semantic gap' genoemd. De semantic gap is het verschil tussen de gecontroleerde termen die informatieprofessionals gebruiken en de vrije zoektermen die leken gebruiken als ze iets zoeken. Een spel als Waisda?, met input van gewone gebruikers, overbrugt deze semantische kloof. De tags die worden toegevoegd vormen een welkome aanvulling op de termen die professionals toevoegen op basis van woordenlijsten."

Wat is de kwaliteit van de tags?
"Het basisprincipe van Waisda? is dat we er vanuit gaan dat een tag bruikbaar is als deze binnen 10 seconden door twee of meer spelers wordt toegevoegd. Dit wordt een match genoemd. Op dit moment zijn 40% van de tags gematched. Echter, als je kijkt naar alle tags die spelers hebben toegevoegd, dan blijkt dat meer dan 90% twee keer of vaker in de tagdatabase voorkomt. Het is te verwachten dat deze tags nog gematched moeten worden. Over een heel groot deel van de tags bestaat dus consensus."

Wat hebben jullie nog meer geleerd uit de evaluaties?
"Voor de spelers staat het spelelement voorop. Games hebben normaliter een begin en een eind. Mensen raken nu soms in de war omdat ze midden in een uitzending van Boer zoekt vrouw of Barend & Van Dorp vallen als ze beginnen te spelen. In de volgende versie van Waisda? die in 2011 wordt gelanceerd, hebben de games een heel duidelijk begin- en eindpunt. We hebben om die reden gekozen voor uitzendingen van Man bijt hond, alle afleveringen zijn namelijk al gesegmenteerd. Dan heb je allemaal brokjes die een spel op zich vormen. En het is natuurlijk ook erg leuk materiaal om naar te kijken. Man bijt hond heeft ook veel fans online. We hopen dat de bezoekers van de Man bijt hond-site ook Waisda? gaan spelen. Waisda? krijgt ook meer echte game-elementen zoals levels en badges die je kunt winnen zodat spelen nog uitdagender wordt."

Wanneer kunnen de tags echt gebruikt worden om programma's te doorzoeken?
"We hopen dat dat vanaf het tweede kwartaal in 2011 mogelijk is. Bij de Vrije Universiteit hebben ze al een testzoekmachine gemaakt die goed werkt. We willen de tags trouwens ook toevoegen aan het eigen informatiesysteem van de publieke omroep, samen met de ondertitels van Teletekstpagina 888 en spraakherkenning voor radioprogramma's. Die ondertitels zijn ook tijdgerelateerde metadata. Dan kun je binnen drie lagen zoeken: tags, spraakherkenning voor audiomateriaal en ondertitels."

Marie-José Klaver

Update december 2010: de website Waisda.nl is uit de lucht gehaald omdat de pilotfase ten einde is. In 2011 wordt in samenwerking met de NCRV een nieuwe versie van Waisda? gelanceerd.