
Ai, BIG DATA och smarta system kommer förändra vård och omsorg lika mycket som penicillin, röntgen och antibiotika. Vi går här igenom de 10 V’na du måste ha kolla på om Ai.
17 juli 2024
Ai, BIG DATA och smarta system kommer förändra vård och omsorg lika mycket som penicillin, röntgen och antibiotika. Vi går här igenom de 10 V’na du måste ha kolla på för att förstå big data och dess roll.

De 10 V’na är
Volym
Den mest uppenbara egenskapen är volymen som fångar hela skalan av en viss datauppsättning. Tänk till exempel på 40 000 appar som läggs till i appbutiken varje år. På samma sätt görs 1 av 40 000 sökningar över Google varje sekund.
Stora siffror har den omedelbara ”wow faktorn” med big data. Oavsett om det är de 2,2 miljarder aktiva månatliga användarna på Facebook eller de 2,2 miljarder kopparna kaffe som konsumeras på en dag, fångar stora siffror egenskaper om stora delar av befolkningen, och förmedlar insikter som kan kännas universella i sin omfattning.
Hastighet (Velocity)
I nästan alla exemplen ovan var hastigheten för data också en viktig egenskap. Hastighet ökar volymen, vilket gör att vi kan brottas med data som en dynamisk storhet. I big data hänvisar det till hur snabbt data genereras och hur snabbt den rör sig. Hastighet är viktigt för företag som behöver deras data för att vara snabbt tillgängliga för att kunna fatta välgrundade beslut.
Mängd (Variety)
Variety, här, hänvisar till flera typer av data som ständigt cirkulerar och är en integrerad kvalitet av big data. Olika datamängder är ostrukturerade. Detta inkluderar data som delas via sociala medier och snabbmeddelanden regelbundet som videor, ljud och telefoninspelningar.
Sedan finns det 10% semi-strukturerad data i omlopp inklusive e-post, webbsidor, zippade filer, etc. Slutligen finns det sällsynthet av strukturerade data såsom finansiella transaktioner.
Datatyper är en avgörande egenskap hos big data eftersom ostrukturerad data måste rengöras och struktureras innan den kan användas för dataanalys. Faktum är att tillgången på ren data är en av de största utmaningarna som dataforskare står inför. Enligt Forbes lägger de flesta dataforskare 60 % av sin tid på att rensa data.
Variabilitet
Variabilitet är ett mått på inkonsekvenserna i data och förväxlas ofta med variation. För att förstå variabilitet, låt oss överväga ett exempel. Du går till ett kafé varje dag och köper samma latte varje dag. Det kan dock lukta eller smaka något eller avsevärt olika varje dag.
Denna typ av inkonsekvens i data är en viktig egenskap eftersom den sätter gränser för datas reproducerbarhet. Detta är särskilt relevant i sentimentanalys som är mycket svårare för AI-modeller jämfört med människor. Sentimentanalys kräver en extra nivå av input, det vill säga sammanhang.
Precision (Veracity)
Veracity hänvisar till datakällans tillförlitlighet. Många faktorer kan bidra till tillförlitligheten hos den input de tillhandahåller vid en viss tidpunkt i en viss situation.
Sannolikhet är särskilt viktigt för att fatta datadrivna beslut för företag, eftersom reproducerbarheten av mönster är starkt beroende av trovärdigheten hos initiala datainmatningar.
Giltighet (Validity)
Giltighet avser riktigheten av data för dess avsedda användning. Till exempel kan du skaffa en datauppsättning som hänför sig till data relaterade till ditt ämne för förfrågan, vilket ökar uppgiften att bilda en meningsfull relation och förfrågan.
Volatilitet
Volatilitet hänvisar till tidsöverväganden som läggs på en viss datamängd. Det handlar om att överväga om data som förvärvades för ett år sedan skulle vara relevant för analys för prediktiv modellering idag. Detta är specifikt för de analyser som görs.
Säkerhet (Vulnerability)
Big data kan ge detaljera information om en konsument, patient eller användare. Det är därför extra viktigt att data är avidentifierad för att ge en översikt men inte en insikt om personen bakom datan.
Visualisering
Med ett nytt datavisualiseringsverktyg som släpps varje månad eller så, är visualisering av data nyckeln till insiktsfulla resultat. Den traditionella x-y-plotten räcker inte längre för den typ av komplexa detaljer som går in i kategoriseringar och mönster över olika parametrar som erhålls via big data-analys.
Värde
Big data är ingenting om det inte kan producera meningsfullt värde. Big data ska leda till ett värde för patienten, konsumenten eller användaren av tjänsten.
Dessa 10 V’na är egenskaperna som hjälper till att förstå dess komplexitet.
Big Data och Data Science är två begrepp som spelar en avgörande roll för att möjliggöra datadrivet beslutsfattande. 90 % av världens data har skapats under de senaste två åren, vilket ger en otrolig mängd data som skapas dagligen.
Genom att använda data på ett smart sätt kommer vi kunna upptäcka sjukdomar snabbare, upptäcka nya antibiotikum, se resurs behov i större detalj och erbjuda mer precis vård.
Källor
Forbes
Oracle
Stack overflow
Datasciencedojo
Nielsen