Onze excuses, deze website ondersteunt de website print functie niet.

De drie V's: Volume, Variety & Velocity

Hoe definiëren we Big Data en is Big Data hetzelfde als grote hoeveelheden gegevens? Volume is het eerste van de drie kenmerken van Big Data die Doug Laney al in 2001 onderscheidde in een onderzoeksverslag van de Meta Group. De twee andere zijn Variety en Velocity.

Volume ligt het meest voor de hand als kenmerk van Big Data en betreft vooral de relatie tussen omvang en verwerkingscapaciteit. Dit aspect is aan verandering onderhevig omdat het verzamelen van gegevens zal blijven toenemen, evenals de ICT-capaciteit voor de opslag en verwerking ervan. Een juiste omgang met volume vraagt om schaalbare opslag en gedistribueerde technieken voor het kosteneffectief raadplegen of aggregeren van gegevens.

Variety verwijst naar de grote variatie aan soorten gegevens die wordt opgeslagen en nog moet worden verwerkt en geanalyseerd, iets waarvoor de traditionele relationele databases meestal ongeschikt zijn. Nieuwe soorten gegevens van sociale netwerken, communicatie tussen machines (M2M) en mobiele apparatuur komen bovenop de reeds bestaande soorten gestructureerde informatie die computers genereren bij de verwerking van transacties. Voorbeelden van dergelijke nieuwe gegevenssoorten zijn foto's, geluids- en beeldbestanden, gps-data, medische dossiers, instrumentmetingen, afbeeldingen, RFID, logbestanden en webdocumenten, BLOBs, RTF-bestanden en tekststrings. Ongestructureerde gegevens zoals spraak en sociale media maken verwerking en categorisering extra complex en vragen om nieuwe technologieën, zoals spraakverwerking voor gegevensdelving, analyse van ongezuiverde tekst en patroonherkenning.

7