Jeg har mange år arbejdet med leksikografi, læren om strukturerede opslagsværker, nærmere bestemt ordbøger. Dette arbejde indbærer detaljeret arbejde med databaser, informationstyper, adskillelse af indhold og præsentation, strukturering af data, datavask, vedligeholdelsesstrategier og meget andet.

Da sproget er så heterogent, og sprog er så forskellige, har jeg fået et meget bredt fundament for al slags dataanalyse og databehandling. Derudover har jeg i mange år været ansvarlig for forretningsudvikling og har derfra stor erfaring med ikke-sproglige datasæt som fx logdatabaser, CRM og CMS.

Har du datasæt, hvor der er guld at hente, men du kan ikke få det adskilt fra al den støj, der også er i databasen?

Har du datasæt, der er ustrukturerede, så du frygter at smide guld væk, hvis du forsøger at rydde op i dem?

Eller er bange for, at du ikke får alt guldet med, når du søger?

Har du flere datasæt, der i et vist omfang indeholder det samme, men du kan ikke samle dem, fordi formaterne eller informationstyperne er forskellige?

Hvis du står med disse eller lignende problemer, skal du ikke fortvivle. Jeg kan hjælpe.