Verplicht delen van data is een slecht idee

Om concurrentie gelijke kansen te geven, zouden grote technologiebedrijven hun datasets moeten vrijgeven, vinden sommige antitrustvoorvechters. Maar is dat geen oplossing op zoek naar een probleem?

Een populair standpunt in zowel de EU als in de VS is dat grote technologiebedrijven hun data moeten delen met kleinere concurrenten om die de gelegenheid te geven beter te concurreren. Het nieuwste voorstel voor het delen van gegevens komt van professor Mayer-Schonberger, wiens eerdere werk op het gebied van Big Data en het recht om data te (laten) verwijderen hem veel sympathisanten in (Amerikaanse) politieke kringen heeft opgeleverd. De kerngedachte is dat bedrijven boven een bepaalde omvang subsets van hun gegevens aan concurrenten moeten afstaan. Amazon, bijvoorbeeld, zou de wereld voorzien van zijn verkoopgegevens, zodat iedereen een alternatieve aanbevelingsalgoritme zou kunnen creëren.

Vrijwillige afspraken over het delen van gegevens tussen concurrenten bestaan al generaties lang. Het meest in het oog springende voorbeeld zijn kredietbureaus, waarbij banken en andere financiële instellingen vrijwillig informatie bundelen om een nauwkeuriger beeld te krijgen van de risico's voor potentiële kredietverstrekkers, verzekeraars en werkgevers.

Maar in de nu voorgestelde universele en verplichte vorm kampt het delen van gegevens met veel gebreken, niet alleen in de specifieke details van de uitvoering, maar ook met fundamentele gebreken die het in principe onaantrekkelijk en in de praktijk onwerkbaar maken.

Delen van data is nachtmerrie voor privacy

Als mensen bereid zijn om hun informatie te delen met Google of Facebook, volgt daaruit niet automatisch dat ze diezelfde data willen delen met alle concurrenten van deze bedrijven. Gedwongen gegevensuitwisseling druist in tegen elke notie van effectieve privacybescherming. Bedrijven met aantrekkelijke en wenselijke datamanagementpraktijken zouden verplicht zijn om persoonlijke informatie door te geven aan andere bedrijven die geen processen in consumentenbescherming hebben geïmplementeerd.

Dit zou allemaal kunnen worden opgelost als bedrijven verplicht zouden zijn de data onidentificeerbaar voordat deze wordt doorgegeven. Maar natuurlijk is juist de identificeerbare informatie hetgeen waarom het gaat. Nieuwe sociale netwerken willen geen anonieme gegevens; ze willen de lijst van Facebook-gebruikers en alles wat Facebook over hen weet. De concurrenten van Google willen geen willekeurige zoekgegevens; ze willen gegevens op individueel niveau, geïdentificeerd aan de hand van het IP-adres, apparaat-ID en andere identifiers die door de privacyregelgevers als persoonlijke informatie worden beschouwd. Amazon-concurrenten willen geen geaggregeerde verkoopgegevens; ze willen dat de individuele Amazone-profielen van Amazon hun aanbevelingsengines trainen.

Het onuitputtelijke karakter van data geeft vaak het gevoel dat er geen verlies is en alleen winst uit het delen van gegevens. Laten we het allemaal samen gebruiken, want het kan niet opgebruikt worden!

Dat data onuitputtelijk is te gebruiken betekent nog niet dat er geen (financiële) lasten achter zitten. Informatie komt niet uit de hemel vallen. Het bestaat in tastbare computerrecords. Het aanleggen en onderhouden van nauwkeurige, actuele, relevante databanken is een enorm dure taak, waarbij schaal ertoe doet. Deze databanken zijn vaak een kostbaar bedrijfsmiddel, met waarden van in de miljarden euro's. Het is moeilijk in te zien waarom een bedrijf hierin zou investeren als het resultaat van zijn werk onmiddellijk beschikbaar zou worden gesteld aan alle concurrenten zonder tegemoetkoming of tegen minimale kosten.

Het idee van datauitwisseling zou voorbijgaan aan particuliere contracten en de Europese richtlijnen, die investeerders stimuleren om waardevolle databanken op te zetten en te onderhouden.

Oplossing voor centralisatie?

Natuurlijk stelt de antitrustwetgeving niet dat ondernemingen met een groot marktaandeel aan speciale vereisten moeten voldoen zoals het delen van gegevens of van intellectueel eigendom totdat de concurrentie succesvoller is geworden.

Toch kan gegevensuitwisseling een denkbare reactie zijn als nieuwe bedrijven geen toegang krijgen tot de informatie die zij nodig hebben om volledig te kunnen concurreren met gevestigde bedrijven. Telkens wanneer antitrustorganisaties deze kwestie hebben bekeken in het geval van fusies tussen concurrenten, hebben zij echter vastgesteld dat er na de fusie voldoende gegevens zijn om volledige en effectieve concurrentie van alternatieve aanbieders mogelijk te maken.

Mayer-Schonberger is van mening dat het delen van gegevens nodig is om systeemstoringen als gevolg van centralisatie te voorkomen. Als één bedrijf de beste aanbevelingsengine levert die de meeste mensen willen gebruiken, wat gebeurt er dan als die service een fout maakt? Je kan nergens anders heen om een alternatief antwoord te krijgen dat die fout kan corrigeren. Het resultaat zou catastrofaal misleidende zoekresultaten, aanbevelingen voor de consument en nieuwsfeeds kunnen zijn. Als één bedrijf alle gegevens beheert, wat gebeurt er dan als er een inbreuk op de beveiliging is? Het is een enkel faalpunt dat catastrofale gevolgen kan hebben voor het hele systeem.

Maar als je daar dieper over nadenkt, kom je er achter dat die argumentatie bangmakerij is. Gedwongen gegevensuitwisseling zorgt er niet voor dat de gegevens uit de oorspronkelijke database verdwijnen. Dus welke veiligheidsrisico's er ook aanwezig waren, ze zijn er nog steeds. En met het delen van gegevens is elke nieuwe entiteit die de oorspronkelijke gegevens ontvangt een nieuw potentieel faalpunt.

Als een bedrijf zijn gepersonaliseerde data verkeerd heeft samengesteld, hoeven consumenten niet naar een concurrent te gaan om zich daarvan bewust te worden. Het is alsof je de verkeerde maat schoen krijgt; je weet dat het niet past omdat het pijn doet. Dus, wat gebeurt er met fouten in de personalisatie? U leest het voorgestelde artikel niet, u koopt het aanbevolen product niet en u klikt niet op de aangeboden zoekresultaten. En het algoritme leert daarvan en probeert het de volgende keer beter te doen.

Mayer-Schonberger heeft een blinde vlek

Als dat niet zo is, dan zijn er alternatieven. Misschien wel de grootste blinde vlek in de argumentatie van Mayer-Schonberger is de aanname dat Amazon geen concurrenten heeft zoals Wal-Mart, Facebook geen concurrenten zoals Snapchat, Twitter en LinkedIn, en Google geen concurrenten heeft zoals Bing en DuckDuckGo, om nog maar te zwijgen van Yelp en Travelocity. Systematisch, regelmatig en wijdverspreid falen van deze diensten zou niet catastrofaal zijn, behalve voor de bedrijven zelf, die hun marktaandeel onmiddellijk zouden zien eroderen als mensen massaal overstappen naar alternatieven.

Er is een wijdverbreid gevoel dat er iets mis is in de technologische sector en veel analisten zijn op zoek naar oplossingen die de status quo zullen verbeteren. Naar mijn mening is het verplicht delen van gegevens een oplossing die op zoek is naar een probleem. Maar zelfs degenen die denken dat de huidige technologiemarkt een goede dosis hervorming nodig heeft, zouden er goed aan doen om naar andere praktische en werkbare alternatieven te zoeken.

Related:

Copyright © 2018 IDG Communications, Inc.

Discover what your peers are reading. Sign up for our FREE email newsletters today!