Zephyrnet-logotyp

Datakvalitet kontra databerikning – DATAVERSITET

Datum:

datakvalitet kontra databerikningdatakvalitet kontra databerikning
PCH.Vector / Shutterstock.com

Data Quality (DQ), graden av företagens och konsumenternas förtroende för datas användbarhet, förblir ett problem för att få affärsinsikter och hantera risker. Enligt nyare forskning tar det i genomsnitt 15 timmar för att lösa ett visst datakvalitetsproblem eller incident, och under 2024 och därefter kommer 25 % eller mer av intäkterna att bli föremål för DQ-problem.

Som svar på dessa utmaningar, över 50% av organisationer planerar att implementera AI och automationslösningar, inklusive datarikning. Databerikning beskriver de processer och aktiviteter som utökar befintliga datamängder för att förbättra datakvaliteten och generera djupare insikter.

Anrikning fortsätter att vara en populär begäran, vilket bevisats av fler än 19 av var 20:e kundupplevelse (CX) ledare som investerar i det eller planerar att göra det. Dessutom finner företag att en 10% förbättring av kundledskvaliteten genom databerikning kan resultera i en försäljningsökning på 40 %. 

Ändå är dataförbättring inte en magisk kula som kan lösa allt Datakvalitetsproblem. För att verkligen få fördelar med datakvalitet måste företagare förstå skillnaderna mellan datakvalitet och databerikning, hur de kompletterar varandra och hur man berikar data som en datakvalitetstaktik. 

Förstå datakvalitet med konsekvens

När de ombeds definiera datakvalitet, beskriver företagare vanligtvis att de har data de kan använda för att slutföra och lyckas med arbetsmål. Däremot kan varje person tolka bra DQ lite olika, beroende på de problem och krav de ser och när frågan ställs. 

En del av denna förvirring kan förklaras av hur DQ kan bedömas. Affärsenheter mäter acceptabla data på olika dimensioner, inklusive noggrannhet, fullständighet, konsekvens, integritet, unikhet och giltighet. Varje lag kan använda olika kombinationer av DQ-indikatorer för olika attribut eller vikta dem olika.

Vad som utgör ett bra mål DQ kanske inte synkroniseras över hela företaget, särskilt om verksamheten och Datastrategi är oklara. Inte konstigt att ett företag lätt kan ha säljare som gör 85% av pinsamma misstag på grund av felaktig kunddata och dubbletter av register över system med motstridig information. 

Därför är det avgörande för varje företag att få en konsekvent förståelse av DQ, särskilt där en extern datakälla sannolikt har sin unika DQ-definition. Som William McKnight, en rådgivare till många av världens mest kända organisationer, säger i sin webbseminarium, DQ-förbättringar sker när människor vet hur renare data ser ut och vidtar åtgärder för att komma dit. Denna konsekventa DQ-beskrivning är avgörande för att veta om och när tillgängliga data ska förstärkas. 

Förstå databerikning

Databerikning är en datakvalitetstaktik som omfattar integrationsprocesser och åtgärder behövs för att förstärka befintliga datamängder. Företag förbättrar sin data för att fylla i saknade luckor, förstå kontextuella nyanser och lägga till ytterligare detaljer för att beskriva en enhet – vanligtvis en potentiell eller aktiv kund. För alla mål har organisationer valet av vilken data som ska förstärkas.

Företag använder olika typer av databerikning som riktar in sig på kritiska attribut och ger insikter i linje med affärsmål. Exempel på anrikningstyper inkluderar:

Vanligtvis överensstämmer databerikning med andra företagsdatakvalitetstaktik. Under denna process standardiserar IT eller teknikteamet tredjepartsdata eller extern dataformatering innan integrationen. 

Denna process innebär att extrahera och transformera extern data så att systemen som tar emot den kan läsa och förstå den. Som ett sista steg i extrahera, transformera och ladda (ETL), lägger applikationen till extern data i de interna systemen och lägger till aktuell data.

Hur databerikning fungerar med datakvalitet

Effektiviteten av databerikning kan eller kanske inte påverkar datakvaliteten. Resultaten beror på olika faktorer, såsom DQ-mål, den datauppsättning som lagts till, hur denna data integreras och datauppsättningens kaliber före anrikningen.

För att illustrera denna punkt, ta ett exempel skapat med hjälp av GPT-chatt. Ett företag startar processen med sina marknadsavdelningsregister, som visas nedan:

Källa: ChatGPT

För att förbättra datakvaliteten för en kommande kampanj köper företagets chef data från tredje part för att fylla i saknade e-postmeddelanden och samla in ytterligare information om ålder. Inget vidare görs med organisationens befintliga data. Efter avslutad databerikning vidarebefordrar IT de uppdaterade kundregistren till marknadsföring för deras ansträngning.

Källa: ChatGPT

Medan marknadsförare kan rikta in sig på kunder över 40, visar sig den berikade datan vara utmanande att använda. Är Mr. Johnsons förnamn Mike? Har Sarah Millers e-post uppdaterats korrekt från sarah.miller@verizon.com till adressen med email.com? Vad händer om marknadsförare behöver en företags-e-postadress istället för en personlig för att följa dataskyddslagarna?

Marknadsförare eller IT kan komplettera uppgifterna manuellt eller använda ett datakvalitetsverktyg för att åtgärda avvikelser. Men att få en företags-e-postadress skulle visa sig vara särskilt tidskrävande att lägga till retroaktivt.

I det här fallet påverkade eller minskade inte databerikningen datakvaliteten. Det kostar dock mer för företaget att reda ut resultaten. När den skalas över tusentals poster leder konsekvenserna av denna taktik till en dataröra.

Implementera ett robust datakvalitetsprogram 

Exemplet ovan visar varför företag behöver implementera en solid Program för datakvalitet före anrikning. Data förvaltare är kärnan i detta arbete eftersom de är utsedda att hantera och hålla sina datauppsättningar i gott skick, enligt en konsekvent DQ-definition. 

Data stewards verkar i ett DQ-program genom ansvariga Data Governance, en tjänst som formaliserar och harmoniserar dataroller, kommunikation, processer och mätningar mellan företagsteam. Ansvarsfull datastyrning vägleder datakvalitetsprogrammet och stödjer dess syfte, viktiga komponenter och DQ-taktik, inklusive databerikning. 

Tänk till exempel på marknadsföringsteamet i exemplet ovan. Genom Data Governance-tjänster kan teamet utse en dataansvarig från marknadsföringsteamet, uppdatera företaget och automatisera datarensningsprocesser. På så sätt, innan någon anrikningsprocess påbörjas, kunde företaget flagga och lösa poster som saknar viktiga detaljer, såsom ett förnamn och ett e-postmeddelande.

Eftersom det är iterativt att nå en konsekvent DQ-definition måste företag regelbundet övervaka och korrigera DQ för att minska riskerna från felaktiga data, och säkerställa tillräckligt förtroende och integritet i deras data innan du lägger till fler poster. Särskilt som företag samlar in streaming- eller realtidsdata måste de bedöma och rensa data rutinmässigt.

Att ha ett DQ-program som betjänas av ansvarig Data Governance minimerar dessutom riskerna för att bryta mot dataregler, som GDPR. Till exempel kan integration av ytterligare demografisk data från andra källor med europeiska kunder utan uttryckligt medgivande leda till betydande böter. Dataöverföringar från en källa till en annan är subjekt till juridiskt skydd, vilket gör ett DQ-program med Data Government-tjänster absolut nödvändigt före anrikning.

Tillämpa databerikning för att förbättra datakvaliteten

När en organisation väl har etablerat ett robust datakvalitetsprogram och uppnått tillräckliga framsteg med att äga tillräckliga datatillgångar, även om de är små och målinriktade, bör den överväga databerikning för ytterligare DQ-förbättringar. Denna taktik bidrar till förbättrad DQ genom förbättrad granularitet när den körs väl. Exempel inkluderar följande:

  • Vevo implementerat riktade annonser och marknadssegmentering över 35 Connected TV (CTV)-plattformar med hjälp av AnalyticsIQ-identitetsdata.
  • En nöjespark ökade sin närvaro och intäkter under covid-19-pandemin genom att köra bil 15% högre omvandlingar, 117 % fler målsidesvisningar och en 62 % lägre kostnad per målsidesvisning.
  • FN antog en 15-årig hållbarhet plan, inklusive Sustainable Development Goals (SDG), och förbättrad datakvalitet kring prestationsindikatorer så att de kunde hjälpa andra länder att fatta evidensbaserade strategiska beslut.
  • Försäkringsbyråer utnyttjade geospatial berikning, tillade Platsinformation till sina kunder. Denna praxis möjliggjorde en mer omfattande bedömning av fastighetsrisker och gjorde försäkringspriserna mer realistiska.
  • American Express minskade avsevärt bedrägliga transaktioner med 60% genom databerikning. Företaget stärkte sina data med kontext genom att lägga till IP-adresser, e-postadresser och leveransadresser som tillhandahålls av handlarna. American Express korsrefererade denna förbättrade data med information lagrad i dess system, vilket visar ett framgångsrikt användningsfall för att förebygga bedrägerier.

Slutsats

Som användningsfallen ovan visar kan databerikning fungera för att förbättra datakvaliteten. När detta händer ser organisationer betydande och synliga förbättringar mot sina affärsmål med mer exakta bilder av sina kunder, prestationsmål och tillgångar. 

Dessa resultat kräver dock att företag arbetar för att upprätta ett DQ-program med ansvarsfullt stöd för datastyrning. På så sätt känner organisationer till den bästa taktiken för att göra DQ acceptabel och gör dem vid lämplig tidpunkt. En gång företag ansluta deras DQ-taktik med de tillgängliga resurserna tilldelade för deras DQ-program, bör de överväga databerikning för att fatta beslut och öppna affärsmöjligheter.

plats_img

Senaste intelligens

plats_img