Google Refine is een project dat oorspronkelijk bekend stond als Freebase Gridworks. Het  “data-schoonmaak” programma van Metaweb is al enige tijd geleden aangekocht door Google. Maar wat doet het? Laten we beginnen met “wie” het doet. Want dit is echt een tool voor data-geeks. Beschik je over grote hoeveelheden, min of gestructureerde, gegevens en wil je die “schoonmaken”? Dan is Google Refine een krachtig stuk gereedschap. Ben je handig met Excel, dan kom je ook een heel eind (en soms zelfs verder). Maar Google Refine onderscheidt zich op bepaalde onderdelen. Soms werkt het gewoon handiger en sneller…

Vergelijkbare data opsporen en zo nodig wijzigen, geen enkel probleem. Spellingsvarianten en spelfouten in databasevelden zijn binnen seconden verdwenen. Ook het  transformeren van het ene naar het andere formaat, web services en mogelijkheden om te koppelen aan databases zoals Freebase, ontbreken niet.

Google Refine is een opensource “webserver” die je kunt downloaden, installeren en uitvoeren op de eigen computer. En dat is (zeker bij Google tegenwoordig) altijd een prettig en veilig idee wanneer je grote hoeveelheden data wilt schoonmaken 🙂

Meer informatie:



Vergelijkbare bronnen