Zephyrnet-logotyp

Överladdningsvärde från data 2024 – DATAVERSITY

Datum:

Utan tvekan har initiativ som generativ AI (GenAI) och molnmigrering fått den största uppmärksamheten bland influencers och dataledare i år, eftersom organisationer försökte avgöra hur, och om, de var vettiga för sin verksamhet. Denna trend ser ut att fortsätta under 2024, eftersom nästan alla Gartners främsta strategiska förutsägelser kretsar kring AI och dess inverkan. Vidare kommenterar analytikerföretaget att 2027 kommer produktivitetsvärdet av AI att erkännas som ett primär ekonomisk indikator av nationell makt.

Medan den generativa AI-surren inte bör ignoreras, som alla andra datstrategi, det är avgörande att data- och analyspersonal är kristallklara i sina prioriteringar och anpassade till affärsplanerna, prioriteringarna och målen. 

Under det kommande året kommer organisationer att utvärdera och modernisera datahanteringsmetoder för att skapa bättre affärsresultat; bestämma när AI ska implementeras; bättre förstå vilken roll semantisk metadata spelar i datastrukturer; och påskynda antagandet av kunskapsgrafer – som kommer att drivas av stora språkmodeller (LLM) och konvergensen av Labeled Property Graphs (LPG) och Resource Description Frameworks (RDF). 

Under 2024 kommer trender för data- och kunskapshantering att omfatta:

1. Organisationer kommer (äntligen) att hantera hypen kring AI.

När det öronbedövande bruset kring GenAI når ett crescendo, kommer organisationer att tvingas dämpa hypen och främja ett realistiskt och ansvarsfullt förhållningssätt till denna störande teknik. Oavsett om det är en AI-kris kring bristen på GPU:er, klimateffekter av att träna stora språkmodeller (LLM) eller oro kring integritet, etik, partiskhet och/eller styrning, kommer dessa utmaningar att förvärras innan de blir bättre, vilket leder till att många undrar om det är värt att tillämpa GenAI i första hand.

Även om företagens påtryckningar kan få organisationer att "göra något med AI", måste datadriven komma först och förbli högsta prioritet. När allt kommer omkring är det lika viktigt att se till att grunddata är organiserad, delbar och sammankopplad som att fråga om GenAI-modeller är pålitliga, tillförlitliga, deterministiska, förklarliga, etiska och fria från partiskhet. 

Innan de distribuerar GenAI-lösningar till produktion måste organisationer vara säkra på att skydda sin immateriella egendom och planera för potentiella ansvarsfrågor. Detta beror på att medan GenAI kan ersätta människor i vissa fall, finns det ingen yrkesansvarsförsäkring för LLM. Detta innebär att affärsprocesser som involverar GenAI fortfarande kommer att kräva omfattande "människor-i-slingan"-engagemang som kan kompensera för eventuella effektivitetsvinster. 

Under 2024 förväntar vi dig att se leverantörer accelerera förbättringar av sina produkterbjudanden genom att lägga till nya gränssnitt fokuserade på att möta GenAI-marknadstrenden. Organisationer måste dock vara medvetna om att dessa kanske inte är något annat än påskruvade plåster. Att ta itu med utmaningar som datakvalitet och säkerställa enhetlig, semantiskt konsekvent åtkomst till korrekt, pålitlig data kommer att kräva att man anger en tydlig datastrategi, samt att man tar ett realistiskt, affärsdrivet tillvägagångssätt. Utan detta kommer organisationer att fortsätta att betala en "dålig dataskatt" eftersom AI/ML-modeller kommer att kämpa för att komma förbi ett proof of concept och i slutändan misslyckas med att leverera på hypen.

2. Antagandet av kunskapsdiagram kommer att accelerera på grund av LLM och teknologikonvergens.

En nyckelfaktor som bromsar införandet av kunskapsdiagram (KG) är den omfattande (och dyra) processen att utveckla de nödvändiga domänmodellerna. LLM:er kan optimera flera uppgifter, allt från utvecklingen av taxonomier, klassificering av enheter och extrahering av nya egenskaper och relationer från ostrukturerad data. Om det görs på rätt sätt kan LLM:er sänka kostnaderna för informationsutvinning, eftersom de rätta verktygen och metoderna kan hantera kvaliteten på textanalyspipelines och bootstrap/utveckla KG:er till en bråkdel av den ansträngning som för närvarande krävs. LLM:er kommer också att göra det lättare att konsumera KGs genom att använda naturliga språkfrågor och sammanfattningar.

Märkta egenskapsdiagram och ramverk för resursbeskrivning kommer också att hjälpa till att driva på kunskapsdiagram, eftersom var och en är kraftfulla datamodeller med starka synergier när de kombineras. Så medan RDF och LPG är optimerade för olika saker, inser datahanterare och teknikleverantörer att de tillsammans ger ett heltäckande och flexibelt tillvägagångssätt för datamodellering och integration. Kombinationen av dessa grafteknologistackar kommer att göra det möjligt för företag att skapa bättre datahanteringsmetoder, där dataanalys, referensdata och metadatahantering, datadelning och återanvändning hanteras på ett effektivt och framtidssäkert sätt. När en effektiv grafbas har byggts kan den återanvändas och återanvändas i organisationer för att leverera resultat på företagsnivå, istället för att begränsas till frånkopplade KG-implementeringar.

I takt med att innovativa och framväxande teknologier som digitala tvillingar, IoT, AI och ML får ytterligare sinnesdelning, kommer hantering av data att bli ännu viktigare. Genom att använda LPG- och RDF-kapacitet tillsammans kan organisationer representera komplexa datarelationer mellan AI- och ML-modeller, samt spåra IoT-data för att stödja dessa nya användningsfall. Dessutom, när både omfattningen och mångfalden av data ökar, kommer denna kombination också att möta behovet av bättre prestanda.

Som ett resultat kan du förvänta dig att användningen av kunskapsdiagram kommer att fortsätta att växa under 2024 när företag försöker ansluta, bearbeta, analysera och fråga de stora volymdatauppsättningarna som för närvarande används. 

3. Dataväv kommer att bli myndig och kommer att använda semantisk metadata.

Bra beslut bygger på delad data, särskilt rätt data vid rätt tidpunkt. Ibland är utmaningen att själva informationen ofta väcker fler frågor än den besvarar. Denna trend kommer att fortsätta att förvärras innan den förbättras, eftersom osammanhängande dataekosystem med olika verktyg, plattformar och frånkopplade datasilos blir allt mer utmanande för företag. Det är därför konceptet med en dataväv har dykt upp som en metod för att bättre hantera och dela sin data.

Datavävens holistiska mål är kulmen på datahanteringsverktyg utformade för att hantera data från att identifiera, komma åt, rengöra, berika, transformera, styra och analysera. Det är en stor ordning och det kommer att ta flera år att mogna innan antagandet sker mellan företag.

Nuvarande lösningar var inte fullt utvecklade för att leverera alla löften om en dataväv. Under det kommande året kommer organisationer att införliva kunskapsgrafer och artificiell intelligens för metadatahantering för att förbättra dagens erbjudanden och kommer att vara ett nyckelkriterium för att göra dem mer effektiva. Semantisk metadata kommer att fungera som en möjliggörande faktor för decentraliserad datahantering, enligt datanätsparadigmet. Det kommer också att ge ett formellt sammanhang om innebörden av dataelement som styrs oberoende, tjänar olika affärsfunktioner och förkroppsligar olika affärslogik och antaganden. Dessutom kommer dessa lösningar att utvecklas och införliva självlärande metadataanalyser, vilket leder till identifiering av dataanvändningsmönster för att optimera, automatisera och komma åt domänspecifik data genom dataprodukter.  

Datasäkerhet, åtkomst, styrning och partiskhet fortsätter att rutinmässigt påverka den dagliga verksamheten, och med generativ AI som får så mycket uppmärksamhet, kommer organisationer att försöka utnyttja en dataväv som drivs av semantisk teknologi för att sänka ägandekostnaderna och driftskostnaderna, samtidigt som data förbättras dela och lita på.

plats_img

Senaste intelligens

plats_img