Het semantische vraagstuk – waarom technologie het nog steeds niet alleen kan.


Data is al jaren uitgegroeid tot een van de meest waardevolle grondstoffen van iedere organisatie. Met data sturen we strategische keuzes, verbeteren we dienstverlening, beheren we risico’s en meten we succes. Het is dan ook niet vreemd dat we al meer dan twee decennia bezig zijn met het ontwikkelen van steeds geavanceerdere data-architecturen en oplossingen die ons moeten helpen om betere inzichten te leveren. Wat opvalt, is dat bijna elke nieuwe generatie technologie claimt het ultieme antwoord te hebben gevonden op het grootste, maar minst tastbare probleem: het semantische vraagstuk.

Toch merken we in de praktijk dat, ondanks technologische vooruitgang, organisaties nog steeds worstelen met dezelfde fundamentele vragen. Wanneer is een klant nu precies een klant? Welke omzet hoort bij welke periode? Wat verstaan we onder een actief product? Het maakt niet uit hoe modern de technologie is; betekenis bepaalt de waarde van data en die betekenis is nooit vanzelfsprekend.

De conclusie blijft, ook anno nu: het semantische probleem is springlevend.

Wie terugkijkt naar het begin van de moderne datawarehousing, ziet dat Kimball’s dimensioneel modelleren de eerste grote stap was richting een semantisch consistente datalaag. Feiten en dimensies gaven structuur aan de werkelijkheid van de business. De data werd gepresenteerd in herkenbare vorm, waardoor gebruikers sneller begrepen wat ze voor zich hadden. Dat werkte goed, maar alleen zolang de werkelijkheid niet te complex of veranderlijk werd.

Daar tegenover staat Inmon’s Corporate Information Factory, waar semantiek vooral in een generiek en centraal enterprise model werd verankerd. Hierdoor ontstond consistentie op enterprise-niveau, maar flexibiliteit moest worden ingeleverd zodra er veranderingen in de organisatie plaatsvonden. Dat leidde al snel tot spanning tussen stabiliteit en wendbaarheid.

Om dat spanningsveld te doorbreken, kwam Data Vault op. Deze aanpak introduceerde een modulair fundament waarin brondata historisch compleet en volledig te herleiden blijft. De semantische logica werd bewust omhoog verplaatst, naar lagen bovenop het fundament. Hierdoor werd verandering mogelijk zonder de hele data-architectuur te breken.

Met de opkomst van het Logical Data Warehouse en virtualisatietechnieken ontstond vervolgens de gedachte dat data niet meer altijd fysiek geïntegreerd hoefde te worden. De semantische laag werd in views, mappings en modelleringstools belegd, waardoor meerdere bronnen één taal spraken — maar alleen zolang de onderliggende definities goed waren afgestemd.

Vandaag leven we in een wereld van Lakehouse-concepten, Data Products, Semantic Tiers, headless BI-architecturen en metadata-gedreven governance. De technologie kan veel meer dan twintig jaar geleden: semantiek wordt steeds vaker losgetrokken van de fysieke opslag en beheerd in een eigen semantische laag.

Datawarehouse concepten door de jaren

Dat klinkt als dé oplossing. Maar er is een belangrijk detail: Technologie kan structuur bieden voor semantiek, maar het kan geen betekenis creëren zonder mensen.

Waar technologie belooft en organisaties nog steeds moeten leveren

Softwareleveranciers laten graag zien hoe hun producten automatisch relaties leggen tussen datapunten, verbanden ontdekken, modellen genereren en self-service inzichten ontsluiten. Dankzij AI ontstaat nu zelfs de claim dat systemen “zelf” kunnen bepalen wat data betekent.

Maar zelfs de meest geavanceerde tooling kan niet beslissen wanneer een product actief is volgens contractvoorwaarde, wie verantwoordelijk is voor datadefinities, welk datapunt juridisch leidend is of welke uitsluitingen gelden in stuurinformatie. Technologie kan context afleiden uit patronen, maar niet uit strategische intentie.

Semantiek blijft uiteindelijk een menselijke keuze, gebaseerd op inzicht in beleid, wetgeving, klantprocessen, cultuur en historie — kortom: context die niet in data staat.

Dat betekent dat organisaties hun eigen semantiek moeten organiseren. Dat vraagt om eigenaarschap op datadomeinen, overeenstemming tussen afdelingen, actieve keuzes over definities, governance die bewaakt dat afspraken blijven gelden en communicatie die ervoor zorgt dat iedereen dezelfde taal blijft spreken.

Wanneer dat ontbreekt, wordt zelfs de beste technologie blind.

Een voorbeeld uit de praktijk

Neem “omzet”. Een data-engine kan omzet bij elkaar optellen. AI kan herkennen dat “revenue” waarschijnlijk hetzelfde is als “omzet”.

Maar:

  • telt korting mee?
  • wanneer wordt omzet genomen: bij contract of levering?
  • welke uitzonderingen gelden voor specifieke productgroepen?
  • wordt gecorrigeerde omzet gebruikt of bruto omzet?

De technologie ziet alleen data.
De business bepaalt de betekenis.

Datakwaliteit, compliance en strategische stuurinformatie vallen of staan met afgesproken definities. Kortom: semantiek vraagt om volwassen data governance. De technologie kan dan niet redden wat inhoudelijk ontbreekt.

De AI-hype en de terugkerende belofte

Nu zitten we midden in de wereld van Large Language Modelsgeneratieve AI en automatisch semantisch begrip. De boodschap die softwareleveranciers nu uitdragen:

“AI begrijpt data zoals mensen dat doen.”

AI kan inderdaad labels genereren, patronen verbinden en suggesties voor definities doen. Het kan ontbrekende context schatten op basis van wat het eerder heeft gezien. Dat is waardevol — en versnelt veel werk. Maar het is geen vervanging voor:

  • strategische keuzes
  • juridische verantwoordelijkheid
  • domeinkennis
  • menselijke interpretatie

AI kan semantiek ondersteunen — niet bepalen. Want als de bronapplicaties slecht gestructureerd zijn, definities inconsistent, of datakwaliteit ondermaats… dan versterkt AI alleen maar ruis. En dan is er nog iets: technologie kan veel, maar kan niet uitleggen waarom iets klopt. Dáár komt de mens weer om de hoek kijken.

De mens blijft de drager van betekenis

De toekomst van data wordt slimmer, sneller en meer geautomatiseerd. Maar het werk van data-professionals verschuift niet weg, het verschuift omhoog. Wat blijft essentieel:

  • inzicht in businesscontext
  • vaardigheden om te verbinden en vertalen
  • governance en ownership organiseren
  • semantiek borgen en bewaken
  • nuance en interpretatie brengen waar AI tekortschiet

Conclusie: De toekomst van de data-professional is veiliggesteld

Want:

  • Data begrijpt zichzelf niet
  • Technologie kan geen strategie kiezen
  • AI kent geen context zonder contextgever
Data professional blijft de spil in context verzamelen

Daarom blijft de data-professional — gewapend met kennis, analytisch vermogen, communicatiekracht en een gezonde dosis realiteitszin — een onmisbare schakel. De tools worden steeds beter. De architecturen steeds slimmer. De mogelijkheden steeds indrukwekkender. Zolang organisaties verschillen in taal, interpretatie en doel…zal semantiek altijd mensenwerk blijven. En zal de data-professional het verschil blijven maken.