We gedragen ons als draken op een bed van data
Data is het nieuwe goud, is ons al eens verteld. Maar draken die op goud zitten doen er niets mee – ze slapen er alleen maar op. En zo gedragen wij ons ook: we verzamelen data, beschermen het tegen indringers, betalen voor steeds meer opslagruimte, maar gebruiken het nauwelijks. Martijn Aslander rekende het recent uit in een scherp artikel op iBestuur: 90% van alle opgeslagen data bestaat uit kopieën.
Maar wat gebeurt er als je anders omgaat met data? Niet als een draak die hamstert, maar als een dataheld die selecteert op waarde? Die vraag verkent dit artikel, met één simpel criterium: wat is deze data eigenlijk waard?
Meldingen op de Gmail dat het account volloopt. Oude backups van je telefoon met allerlei mooie en onzinnige foto’s en doorgestuurde afbeeldingen. Gedownloade whitepapers waar je écht wat mee wilde doen uit 2017. Belastingdocumenten uit 2003. Herkenbaar?
Dit gedrag is wijdverspreid, niet alleen onder ondernemers. Standup filosoof en dataheld Martijn Aslander dook in de cijfers en vond vijf feiten die iedere manager zou moeten weten over data:
- Negentig procent van alle opgeslagen data bestaat uit kopieën van iets wat al eerder bestond, volgens onderzoeksbureau IDC.
- Slechts 14 procent van alle bedrijfsdata is bedrijfskritisch, zo blijkt uit onderzoek van Veritas. De overige 86 procent is rommel die we voor de zekerheid bewaren.
- Vierenvijftig procent van alle opgeslagen enterprise-data is zogeheten dark data: bestanden die ooit zijn aangemaakt maar nooit meer worden geopend of geanalyseerd.
- Minder dan twee procent van alle data die in een jaar wordt gecreëerd, wordt daadwerkelijk bewaard tot het jaar daarop, aldus datzelfde IDC. De rest verdwijnt omdat het streams, caches en logs betrof die tijdelijk waren.
- Eén PowerPoint-presentatie bestaat gemiddeld in zes tot achttien kopieën: in mailboxen, op bureaubladen, in de cloud, in back-ups. Vermenigvuldig dat eens met het aantal presentaties in je organisatie.
En de allerbelangrijkste die Martijn heel mooi scherp stelt: de opgeslagen data wereldwijd verdubbelt elke vier jaar. Maar verdubbelt ook onze productiviteit? De GDP? Nope. Dus waarom verwijderen we niet onze data wanneer het geen waarde heeft?
Digitale luiheid is rationeel
Gmail heeft de superhandige Archive functie: weg uit je inbox, maar wel terug te vinden. Het verliezen van de foto’s van je smartphone lijkt me een pijnlijk idee, ook al staan er waarschijnlijk honderden mislukte foto’s tussen. Die whitepapers kun je nog eens nodig hebben ter inspiratie, al heb je ze jaren niet geopend. Het is FOMO: fear of missing out.
Opslaan kost één klik. Maar echt bedenken of je iets beter kunt verwijderen of anders opslaan? Dat kost denken, beslissen, tijd en het aanvoelen van risico’s. Wat als je het later toch nodig hebt? Het risico van onnodig opslaan voelt veel kleiner dan het risico van per ongeluk het verkeerde bestand hebben verwijderd: risk aversion. Die asymmetrie maakt digitale luiheid volkomen rationeel. Maar het heeft wel degelijk gevolgen:
- We betalen voor opslag die we niet echt gebruiken. Veel kan weg, want het wordt nimmer nooit meer gebruikt. Nu zit OneDrive ingebakken bij Office 365, dus neem eens Amazon S3 standaard opslag: $0.023 per GB per maand (eerste 50TB), 100GB = $2.30 per maand = $27.60 per jaar ≈ €25 per jaar. Klinkt laag maar kijk dan eens naar je dataverbruik per persoon. Grote bestanden rondmailen naar iedereen? Je mail wordt óók meerdere instanties gebackupt. Op SharePoint zetten als single source? Wordt het ook meerdere keren gedupliceerd.
- We overtreden de AVG zonder het te weten. Die mails en cv’s van kandidaten voor die functie van vijf jaar geleden? Volgens de wet mag je ze maximaal vier weken na de sollicitatieprocedure bewaren. Die oude klantenlijst van een project uit 2019? Had allang gewist moeten zijn.
- Terugvinden kost steeds meer moeite. Zit dat akkoord op die offerte nou in je mail? Chat? Of toch een folder? Is het die folder over die klant, dat product of toch onder administratie? Zelfs met een goede zoekfunctie moet je eerst weten wat je precies zoekt.
- Systemen worden steeds trager. Een CRM met 10.000 oude contacten reageert langzamer dan een met 2.000 actieve. Zoeken duurt langer en de back-ups duren langer. En dus ook het synchroniseren tussen apparaten duurt langer. En elke keer dat je een bestand opent en denkt “dit moet ik eigenlijk opruimen”, verlies je focus.
- Beveiligingsrisico’s nemen toe. Elk oud bestand vergroot het aanvalsoppervlakte. Als je niet weet wat je eigenlijk hebt aan data, kun je ook geen prioriteiten stellen op basis van gevoeligheid. Waarschijnlijk heeft ook iedereen toegang tot alles voor ‘het geval data’: oud personeel, partners, stagiaires. Data governance mist. Elk account met teveel rechten is een potentiële ingang voor aanvallers.
- Analyse en AI werken slechter. Als je systemen volzitten met oude rommel, krijg je “garbage in, garbage out”. Patronen zoeken in data waar 86 procent ruis is, levert geen inzichten maar statistische herrie.
Alles kunnen bewaren voelt als rijkdom, maar uiteindelijk geeft het je ook last.
Als data echt een grondstof is… waar zijn die raffinaderijen?
In 2006 presenteerde Clive Humby een presentatie genaamd: “Data is the new oil”. Want ruwe olie is waardeloos tot je het raffineert tot benzine, diesel, kerosine. Wat overblijft – teer, zwavel, verontreinigingen – wordt echter verwijderd, niet opgeslagen voor het geval dat. Bij data slaan we wel alles op: de ruwe data, de bijproducten, het afval, de kopieën van het afval. Negentig procent is duplicaat, 86 procent rommel. Waar is het proces dat ruwe data omzet in bruikbare inzichten? Bij de meeste organisaties ontbreekt de data-infrastructuur hiervoor en zit nog veel data vast in datasilo’s (en daar is data-archeologie voor nodig!)
Nu is olie is eindig en data oneindig vermenigvuldigbaar. Schaarste creëert waarde bij olie, overvloed vernietigt de waarde van data. Tweede verschil: olie veroudert niet, data wel. Die cv’s uit 2019 zijn niet alleen waardeloos maar een juridisch risico. Data is geen stabiele grondstof maar een bederfelijk product. En als data echt een productieve grondstof is, waarom zie je dat niet terug in economische groei? Of het is rommel dat niets bijdraagt, of we zijn slecht in raffineren.
Raffineren betekent selecteren. Ruwe data die binnenkomt wordt verwerkt: wat waardevol is wordt behouden en gestructureerd, wat bijproduct is wordt kortetermijn bewaard, wat afval is wordt verwijderd. Maar dat vereist een proces met eigenaren, lifecycles en automatische archivering. Organisaties die data als grondstof behandelen meten niet hoeveel data ze hebben, maar hoeveel bruikbare data. Want het gaat niet om de hoeveelheid ruwe olie die je opslaat, maar om hoeveel benzine je eruit kunt raffineren.
De waarde van data
Wanneer ik voor klanten schrijf over ‘de waarde van data’ gaat het altijd over raffineren: analyseren, segmenteren, trends, verrijken en voorspellen. Eerst een stapje terug.
Data raffineren kost geld. En ook data opslaan kost geld. Minder data in je organisatie kost dus minder. Maar wiens verantwoordelijkheid is dat eigenlijk? Ik weet nog de mails van mijn collega’s van klantenservice dat de G-Schijf vol zat, maar ik ben verder nooit door een manager aangesproken op mijn inefficiënte dataverbruik. Ik denk dat de IT-manager ook niet zo snel door de CFO wordt aangesproken op de kosten voor dataopslag, want die CFO ziet wel graag de administratie goed opgeslagen. Stijgende IT-kosten is zo eigenlijk een gegeven, niemand is verantwoordelijk.
Dat is zelfs nu bedrijven graag ‘datagedreven’ willen zijn, volgens het build, measure, learn-principe van de LEAN-startup: aannames testen om data op te halen waarmee je leert wat wel en niet een positief verschil maakt op de juiste KPI’s (en niet op zogeheten vanity metrics leunt). LEAN is echter een volledig gedachtengoed dat heel streng is op data: het wordt gezien als inventory waste en een van de zeven kernverspillingen (muda). het leidende principe is dat alles wat opgeslagen wordt zonder directe klantwaarde verspilling is.
Kortom: data kost geld, minder data is juist waardevol voor bedrijven. Hoe doe je dat?
Van draak naar dataheld: 7 praktische stappen
De draak uit de opening slaapt op een berg goud zonder het ooit te gebruiken. De dataheld verslaat die draak, pakt de berg data aan en bouwt een raffinage-proces. Van draak naar dataheld vereist discipline. Zeven praktische stappen waar je vandaag mee kunt beginnen:
- Stop met mailen, start met linken. Die PowerPoint naar zes mensen mailen? Zet ‘m op SharePoint/Drive, mail de link. Direct 6x minder opslag, iedereen kijkt naar dezelfde versie, geen verwarring welke de laatste is. Begin bij jezelf: één week alleen links delen. Tel hoeveel attachments je bespaart.
- Verwijder je mail regelmatig. Plan een half uur iedere week in met als doel zoveel mogelijk MB aan mail te verwijderen. Je komt vanzelf uit bij attachements die heen en weer gaan, nieuwsbrieven en notificaties, sollicitaties en klantenmails ouder dan dan twee jaar. Door dit regelmatig te doen, krijg je voor jezelf scherper welke mail je niet hoeft te archiveren of bewaren. Je vaardigheid van mail verwerken wordt daardoor efficiënter.
- Begin met gedownloade bestanden te archiveren. Label je bestanden en verwerk die ook volgens die labels. Dus: facturen? Is administratie. Klantnotities in je CRM. Heeft het een doel, deadline en stappen? Dat is een project, voor je projectadministratie. Een whitepaper die je niet meer nodig hebt? Verwijderen, of in een mapje die je jaarlijks leegt. Je mapje Downloads moet leeg. Kostte het je veel moeite om een bestand te archiveren? Dan gebruik je dat mapje waarschijnlijk ook nooit. De PARA-methode biedt een mooie raamwerk dat ik zelf toepas.
- Doorloop je mappen. Je hebt er waarschijnlijk vele duizenden, allemaal met bestanden die je ‘ooit’ nog eens nodig kan hebben. Maak het visueel doorlopen ervan een doel, iedere week een aantal Zodat je bestanden spot die echt weg kunnen (gebruik daarvoor de ‘zou-ik-dit-nu-nog downloadentest’). Bestanden gaat herordenen. En gaat nadenken over structuur. Werk je projectmatig? Heb je vooral veel doorlopende taken? Moet je veel vastleggen ter verantwoording? Zaken nazoeken?
- Wijs een data-coördinator aan. In de vier voorgaande stappen ben je vooral met je eigen data in de weer geweest om basisprincipes te leren. Daarbij kom je ook uit op vraagstukken: hoe gaan wij met deze data om? Die onduidelijkheid in je organisatie maakt dat iedereen op veilig speelt en alles maar bewaard. In stap 5 ga je dataregels vastleggen en breder toepassen: offertes ouder dan 2 jaar = delete, projectmappen 3 maanden na oplevering = archief, meeting notities gaan in shared doc, oude versies na oplevering = delete. De data-coördinator cultiveert die regels en draagt deze uit via onboarding nieuwe collega’s, teamoverleg agendapunt, templates.
- Plaats dataverbruik in je organisatie. Ga nu een niveau hoger, tussen afdelingen. Maak dit geen IT-ding, maar een meetbare doelstelling die voor iedere afdeling wordt ingevuld. Dat vraagt om een data-coördinator per afdeling die datavermindering cultiveren, best practices uitwisselen, business-kansen spotten. Zo kom je op grotere vraagstukken, zoals in welk formaat leggen wij onze data vast? Hoe kunnen we dat praktischer doen zonder onnodige duplicaten? Hoe maken we het beter doorzoekbaar? Dat is waar je echt systematisch gaat denken als organisatie over je data, en dit is dus het kennisgebied van Martijn Aslander, die oa aanjager is van persoonlijkkennismanagement.nl en net een echte bestseller schreef over Obsidian, eindelijk grip op je informatie.
- Meet de ROI van data opruimen. Nu loop je in de kijker van het management: leuk dat we alles beter kunnen vinden maar wat kost dat wel niet qua tijd? Dit is het niveau waarop je gaat vertalen naar cijfers die je vervolgens kunt optimaliseren. Dus hoeveel minuten per dag besteedt je team aan het zoeken naar bestanden? Hoeveel kost dataopslag jullie nou? Hoe lang duurt de onboarding van nieuwe medewerkers? Zet die cijfers in het management dashboard en zie effectief databeheer als manier om die cijfers te verbeteren.
Deze zeven praktische stappen doorloop je één voor één. Met elke stap krijg je meer inzichten en kom je bij grotere vraagstukken. Zo kom je als organisatie bij een herijking van de waarde van data.
Data als doorlopend proces
Het grote probleem bij veel organisaties is dat er weinig aandacht is voor het kennisniveau van de kenniswerkers. Ga maar na: heb jij ooit bij een nieuwe baan moeten laten zien hoe goed jij werkt in Microsoft Word? Excel? En dan bij een bestaande baan: hoe ging de uitrol van Zoom of Microsoft Teams? Wordt er dan überhaupt gekeken hoe jij met data omgaat?
In de dynamische wereld van AI speelt data een steeds grotere rol. Het is vaak het grote struikelblok voor een succesvolle AI-implementatie. En dat gaat dus verder dan alleen een IT-vraagstuk: het gaat om de bedrijfscultuur rondom data.



Reacties