De data lake-hype voorbij: tijd voor een Intelligent Data Platform  

Ben jij meer van de logica of van de creativiteit? De linkerhelft van je hersenen is meer rationeel en logisch, in je rechterhelft zitten je creatieve eigenschappen waarmee je grote verbanden ziet. Niemand is alleen maar die chaotische creatieveling of die gestructureerde wiskundige. Vaak werken je helften samen. Een creatief idee heeft bijvoorbeeld structuur nodig om goed uitgevoerd te kunnen worden. En dát maakt je intelligent. Het principe van je brein geldt ook voor de manier waarop je met je data omgaat. Want ook jouw organisatie wordt slimmer wanneer je gestructureerde data in je logical data warehouse combineert met de ongestructureerde gegevens in je data lake. Waarom? Dat leg ik uit in dit blog.

Data lake: ruw en ongestructureerd

Data lakes zijn een hot topic. Een dergelijke oplossing voor data-opslag is goedkoop, je kunt er grote hoeveelheden data van elk type format in kwijt en je kunt er geavanceerde analyses met diverse tools op los laten. Ruimte voor innovatie en experimenteren dus. Het nadeel? Data lakes kenmerken zich doordat data ruw en ongestructureerd wordt opgeslagen. Ideaal voor IoT-data, clickstreams en machinedata. Maar, een data lake leent zich daardoor niet echt voor het opslaan van gestructureerde data. Doe je dat wel, dan raak je alle referenties en verbanden tussen die gegevens kwijt. Zonde.

Je data lake wordt al snel een data swamp

Maak je gebruik van een data lake? Dan heb je data scientists nodig om analyses uit te voeren en algoritmes op je lake los te laten. Doe je dat niet, dan zit je met een datamoeras. Alle data die erin wegzakken, vind je onmogelijk terug. Wil je sales, inkoop, onderhoud of elke andere afdeling in je organisatie vanuit je lake van inzichten voorzien, dan heb je verschillende tussenstappen nodig om dat te bereiken. Om weer structuur – en dus vindbaarheid – terug te brengen in data worden er daarom vaak verschillende datalagen bovenop een data lake aangebracht. En dat lijkt weer verdacht veel op die traditionele data warehouses uit het verleden.

Data driven werken met alleen een data lake? Niet te doen

Klinkt paradoxaal toch? Je stopt al je gestructureerde data uit diverse bronnen in een chaotisch meer en vervolgens ga je het opnieuw ordenen. Bovendien leidt dat ook nog eens tot extra kosten – die je juist wilde besparen – en is de data die je ‘oproept’ in je systeem altijd verouderd. Want het gestructureerd aan de oppervlakte brengen van die gegevens in je data lake kost nou eenmaal tijd.

Datagedreven werken als organisatie is er niet bij als je enkel gebruik maakt van een data lake. Want je business heeft niet zoveel aan inzichten van gisteren in een economie waarin je snel moet beslissen op basis van de actualiteit. Een data lake is daarom niet de meest ideale bron voor snel – of liever nog: real-time – inzicht. Benader daarom je informatielandschap eens op een andere manier. Een intelligente manier. Met ruimte voor structuur en executie én creativiteit.

Neem een voorbeeld aan de natuur

Waarom zou je alleen je rechterhersenhelft gebruiken als je met je linkerhelft erbij twee keer zo intelligent met je kennis om kunt gaan? En, om maar meteen het bruggetje naar mijn oplossing te maken: wat als je die linker- en rechtercapaciteiten voor elk type gebruiker beschikbaar kunt maken? Structureer je datalandschap daarom naar het beste voorbeeld, recht uit de natuur: je brein. Oftewel: een intelligent data platform.

Net als je brein heeft een intelligent data platform een logische en creatieve kant. Met de creatieve kant kan het zowel grotere contexten ‘zien’ als out-of-the-box ideeën genereren op basis van data. Die kun je vervolgens in de praktijk loslaten op de gestructureerde kant van je platform. De plek waar je gerichte vragen stelt aan het systeem en kant-en-klare inzichten kunt opdiepen.

Digitalisering

Meer weten over data?

In deze gids vind je tips over hoe jij de beste datastrategie kan samenstellen. Onderscheid jouw bedrijf met een succesvolle datastrategie.

De bouwstenen van een intelligent data platform

Waar dit platform concreet uit bestaat? Door een data lake met een logisch data warehouse te combineren, creëer je een intelligent data platform. Zo profiteer je van alle voordelen van data science en traditionele analyses. Kortom: écht het beste van twee datawerelden.

Met je data lake vol ruwe gegevens experimenteer en innoveer je. Met name je data scientists en engineers zijn bezig in die hoek. Niet alle data in je lake zijn namelijk direct interessant voor je verschillende bedrijfsonderdelen. Sommige van die data wel. Die breng je daarom ook onder in je logisch data warehouse. Daar sla je voornamelijk tactische en strategische data op. Door niet alles in dat gestructureerde systeem op te slaan, blijft het licht in gebruik en kan het daardoor snel – en dus real-time – vragen van onder meer business analisten en andere gebruikers uit je organisatie beantwoorden.

Creatief en logisch: investeer in een intelligent data platform

Investeer je in een langetermijnsamenwerking tussen die ‘hersenhelften’ in data-opslag? Dan investeer je in een intelligent data platform, waar je zowel creatief als logisch mee aan de slag kunt. Intelligent datamanagement waarmee je niet alleen slagvaardiger bent, maar waarmee je ook klaar bent voor toekomstige innovaties op het gebied van data science en data-analyses.