Skip navigation

Redactieadres:

Panteia B.V.

Postbus 7001

2701 AA Zoetermeer

T: 079 - 322 22 00

F: 079 - 343 01 01

E: redactie@panteia.nl

De communicatieparadox

Wat te doen met al die data

Door drs. R.J.M. Vogels*

Al vele jaren staan er stukken in kranten en tijdschriften dat informatietechnologie in de toekomst grote invloed zal hebben op ons leven. Een enorme open deur dus dat dit ook voor het doen van onderzoek gevolgen heeft. Onderzoeken wordt in ieder geval nooit meer zo gemakkelijk als het was.

Het wordt nog gemakkelijker...
Vrijwel iedereen in Nederland heeft immers een GSM, sommige mensen zelfs meer dan één. Volgens de GSM-aanbieders waren er in 2008 ruim 19 miljoen actieve GSM-aansluitingen in Nederland. We zijn ook zo goed als allemaal per e-mail thuis en op het werk te benaderen en we kunnen ook overal internetten. En internetten kunnen we op steeds meer plekken: op de pc, de playstation/wii, de MP3-speler en de GSM. Kortom: we kunnen overal een vragenlijstje invullen via internet en we kunnen iedereen bellen voor een telefonisch interview. Papieren vragenlijsten zijn in principe dus niet meer nodig. Zeker als je weet dat een gemiddeld huishouden in Nederland meer dan 200 geadresseerde Direct Marketing poststukken per jaar ontvangt. Om nog maar niet te spreken over de vele kilo's ongeadresseerde reclame die op de mat valt. 'Serieuze' post kan hierin ondersneeuwen evenals een schriftelijke vragenlijst.

...of toch niet?
Terecht worden consumenten en ook bedrijven in bescherming genomen tegen Spam en ongewenste telefoontjes. Onderzoeksbureaus aangesloten bij de Research Keurmerkgroep houden zich strikt aan de regels: zij versturen dus geen e-mail aan mensen die dat niet willen en ze bellen alleen mensen die daartegen geen bezwaar hebben. En dat worden er helaas steeds minder. Het telefoonboek was zo'n 10 jaar geleden nog de bron bij uitstek om een representatieve steekproef te trekken. Bijna ieder huishouden had een vaste aansluiting en kon dus getrokken worden. Nu hebben steeds minder huishoudens een vermelding in het telefoonboek. Sinds 2003 is het aantal huishoudens met een traditionele vaste telefoonlijn bij KPN gehalveerd. Huishoudens die bellen via de kabel of VOIP of alleen per GSM zijn doorgaans niet opgenomen in de telefoongids. Bovendien zijn er steeds meer mensen die bij Infofilter hebben aangegeven niet benaderd te willen worden voor enquêtes. Inmiddels heeft dit een wettelijke vorm gekregen door middel van het per 1 juli ingevoerde 'bel-mij-niet' register in Nederland.

Nog een ander punt is dat niet iedereen dezelfde voorkeur heeft voor de wijze waarop wordt meegedaan om een vragenlijst te beantwoorden. Ouderen, 50-plussers, zijn goed te benaderen via een vaste telefoonlijn. Twintigers en dertigers reageren goed op internet. Jongeren doen bijna alles met hun mobieltje. En dan hebben we het nog niet over culturele verschillen. In internetpanels zijn bijvoorbeeld kerkgangers en mensen met een voorkeur voor de Christelijke partijen ondervertegenwoordigd. Niet-westerse immigranten zijn eveneens ondervertegenwoordigd in de panels. Bovendien kennen internetpanels een harde kern invullers: 20% van de deelnemers vult 80% van de vragenlijsten in.

Het trekken van de representatieve steekproef van mensen die ook kunnen en mogen worden benaderd is dus de laatste jaren steeds moeilijker geworden. En helaas bieden de internetpanels niet in alle gevallen een afdoende oplossing. De responsratio's op telefonische en internetonderzoeken nemen gestaag af. Er zijn duidelijke signalen van onderzoeksmoeheid.

Er lijkt zelfs sprake te zijn van een communicatieparadox. Nog nooit in de geschiedenis hadden wij zoveel communicatiemogelijkheden ter beschikking en desondanks zijn we steeds slechter bereikbaar.

ssHoe moet het dan?
Onderzoeksbureaus moeten dus op zoek naar nieuwe mogelijkheden van dataverzameling. Gelukkig zijn die er nog volop. De enige bron die onuitputtelijk is en steeds groter wordt is namelijk informatie.

Ons gedrag is bijna op de seconde te volgen. GSM-providers weten bijna precies waar wij ons bevinden zolang ons mobieltje aan staat. Met onze pin- en creditcardtransacties en klantenkaarten is te zien hoeveel we waar kopen en ook nog welke artikelen. Met de OV-kaart weten we ook het reisgedrag en op steeds meer plekken staan camera's die ons volgen. Alles wat we doen op internet is ook in kaart te brengen. Via Google.nl/trends is te zien hoe vaak een bepaalde zoekterm in welke landen en welke steden is ingevoerd.

Heel veel van wat we doen wordt dus opgeslagen. En heel vaak zonder dat we het weten. Eigenlijk hoeven we dus niet meer te vragen wat mensen doen, we kunnen gewoon kijken naar wat ze doen. En dat 'kijken' is nog veel sneller, nauwkeuriger en betrouwbaarder ook. Als je de data maar op de goede manier beschikbaar krijgt en ook kunt analyseren.

De overheid weet ook veel van haar burgers. Het Burger Service Nummer is de sleutel waarmee bijna alles te koppelen is. Voor burgers zelf is dat soms handig, bijvoorbeeld via het vooraf ingevulde Belastingformulier. Als we een uitkering aanvragen is via Suwinet te zien hoe de arbeids- en inkomenshistorie in elkaar zit en of we wel recht hebben op een uitkering: of we geen studie volgen, niet in de gevangenis zitten, geen al te dure auto's op onze naam hebben staan en niet toevallig nog een andere uitkering hebben.

Net als het bedrijfsleven kan de overheid het effect van beleidsmaatregelen dus op de voet volgen als de data maar op een goede manier worden gebruikt. Zo is het in principe heel goed mogelijk om het effect van marktwerking in de gezondheidszorg te volgen. De verschillende partijen blijven echter te veel op de 'data' zitten en willen die niet beschikbaar stellen aan onderzoekers om de effecten te kunnen onderzoeken. Die partijen hebben overigens valide redenen om die data niet beschikbaar te stellen: het gaat om zeer vertrouwelijke informatie. Uit oogpunt van onderzoek is het zeer te betreuren, want nu blijft de discussie maar heen en weer gaan tussen mensen die 'geloven' in marktwerking en zij die dat per definitie niet doen. Terwijl met feiten is aan te tonen wie er gelijk heeft. Nu krijgt marktwerking vaak de schuld van problemen die misschien niets te maken hebben met het invoeren van marktwerking.

Dat er nogal wat komt kijken om de enorme hoeveelheden informatie snel te kunnen analyseren leren de ervaringen van de Nationale Databank Wegverkeersgegevens (NDW). Op 6 juli is deze in de bètavariant gelanceerd en twee weken later alweer stilgelegd omdat de stroom gegevens niet stabiel genoeg is en de informatie van de NDW te sterk afwijkt van de verkeersinformatie die Rijkswaterstaat gewoonlijk verstrekt. De databank moet in september weer in de lucht zijn. Het idee is de komende twee jaar steeds meer wegen aan de databank toe te voegen. Als alles goed gaat bevat het systeem in 2012 informatie over files, werkzaamheden, omleidingen, evenementen, incidenten en afsluitingen van 5500 kilometer wegennet. De databank moet ervoor zorgen dat reizigers zelf de beste keuze kunnen maken voor auto, trein, bus of fiets als vervoermiddel. Er komt heel wat techniek bij kijken want inmiddels is er al zo'n 65 miljoen uitgegeven voor deze databank. Het zal dus nog wel even duren voordat we net zo gemakkelijk de NBW opstarten als we nu de Buienradar.nl raadplegen.

Cijfers alleen niet genoeg
Enorme hoeveelheden data zijn dus heel nuttig als je ze goed kunt ontsluiten en analyseren. Vaak wordt het pas bruikbare informatie als er ook een koppeling is te maken met kwalitatieve gegevens: wat ging er mis, waarom bent u zo boos, wat is de belangrijkste reden voor u om dit te doen, waarom kiest u nu voor de concurrent? Het verzamelen en snel analyseren van dit soort gegevens is voor bedrijven steeds belangrijker. Dit soort vragen kun je stellen rond de contactmomenten: als klanten zelf contact opnemen of als er een goede reden is voor het bedrijf om contact op te nemen. Bijvoorbeeld bij het aflopen van een contract. De informatie is te verzamelen tijdens het contact, maar kan ook via een korte vragenlijst na het contactmoment worden verzameld. Een aantal gemeenten werkt ook al op deze wijze om de gemeentelijke dienstverlening te evalueren. Dit in tegenstelling tot of naast de jaarlijkse vragenlijst waarmee in één keer vragen worden gesteld over alle aspecten waarmee een burger mogelijk te maken heeft gehad. Dat zijn vaak te lange vragenlijsten waarin zaken aan de orde komen die de mensen zich al lang niet meer goed weten te herinneren of die helemaal niet relevant zijn voor veel burgers.

De wat-waarom-vragen, de open vragen, en andere ongestructureerde data worden in het algemeen nog weinig gebruikt in onderzoek. Belangrijkste reden hiervoor is dat het analyseren vaak handwerk is en erg veel tijd vraagt. Op dat gebied zijn echter ook veel nieuwe ontwikkelingen te zien. Tekstanalysesoftware is steeds slimmer geworden en telt niet alleen woorden, maar 'snapt' ook voor een deel contexten waarin woorden staan. De Nederlandse politie heeft bijvoorbeeld een 'digitale wasmachine' waarmee harde schijven van computers die bij een inval in beslag worden genomen razendsnel zijn te analyseren op verdachte termen. Bedrijven gebruiken dezelfde software om discussies die op blogs, chatsites en fora worden gehouden over bijvoorbeeld bepaalde auto's te verzamelen en te analyseren.

Het vak wordt voor onderzoekers dus een stuk complexer. ICT-vaardigheden worden nog belangrijker en kennis van databases en mogelijkheden om hiermee te werken cruciaal. Aan het panklare SPSS-bestandje waarmee de analyses gedaan kunnen worden en het rapport wordt geschreven, zullen onderzoekers over een paar jaar met weemoed terugdenken.

Bron:
NOBVO-onderzoek, MOA, 2006
CBS, raming Stratus
Google.nl/trends

*René Vogels is accountmanager bij Stratus

Location http://www.basis-online.nl/index.cfm/1,127,489,0,html