Zephyrnet-logo

Beleid voor gegevensbewaring moet evolueren om opkomende technologieën en datagroei aan te pakken – DATAVERSITY

Datum:

De opkomst van nieuwe technologieën, waaronder AI, IoT en blockchain, naast de wijdverbreide omarming van digitale transformatie, heeft geleid tot een dramatische toename van data. De afhankelijkheid van data-analyse om datagestuurde besluitvorming te stimuleren, vereist ook grote hoeveelheden data voor zinvolle inzichten.

Terwijl AI en generatieve AI (GenAI) tools en systemen bijdragen aan de enorme groei van bedrijfsdata, hebben deze systemen grote hoeveelheden actuele en kwalitatieve data nodig om te ‘voeden’. grote taalmodellen (LLM's).

Sommige bedrijven beginnen zich nog maar net met GenAI bezig te houden en passen het toe om bedrijfsprocessen te automatiseren en een efficiëntere werkplek te creëren, maar veel bedrijven hebben het al geïmplementeerd. Volgens Gartner's Budgetprioriteiten voor 2024 voor CFO's verslag81% van de respondenten is van plan dit jaar meer aan GenAI uit te geven.

Wat betekent dit allemaal? De opkomst van AI en de wijdverbreide trends in de richting van digitale transformatie en datagedreven besluitvorming decision hebben de perfecte storm gecreëerd: te veel data gecombineerd met verouderd dataretentie- en datalevenscyclusbeleid dat geen gelijke tred heeft gehouden.

Herbeoordeling van verouderde strategieën voor de levenscyclus en retentie van gegevens

Bedrijven moeten hun beleid voor het bewaren van gegevens opnieuw beoordelen, heroverwegen en moderniseren om niet alleen bedrijfsgegevens te beveiligen, maar ook om te blijven voldoen aan het groeiende ecosysteem van wereldwijde regelgeving voor gegevensprivacy.

Met het enorme volume aan gegevensbronnen dat zich uitstrekt over meerdere assets en verschillende systemen op verschillende bestemmingen, is de complexiteit ongekend. Als gevolg hiervan moeten organisaties hun raamwerk voor databeheer opnieuw evalueren gedurende de hele datalevenscyclus, inclusief dataclassificatie (bijvoorbeeld het automatisch markeren van data en de duur ervan), databescherming, hygiëne en datavernietiging.

Zodra de drijvende krachten achter de toename van data binnen de organisatie zijn geïdentificeerd, moeten bedrijven de volgende stappen ondernemen voordat ze zich verdiepen in het updaten van het dataretentiebeleid:

  • Voer een gegevensaudit uit: Bedrijven moeten eerst alle bronnen identificeren waar gegevens worden gegenereerd, opgeslagen of verwerkt. De taak om te bepalen waar alle gegevens worden opgeslagen, is eenvoudiger dan het klinkt. Het kan onder meer worden opgeslagen in databases, bestandsservers, cloudopslag, apparaten van werknemers en applicaties van derden. Veel van de hedendaagse organisaties hanteren een hybride benadering van gegevensopslag, waarbij gebruik wordt gemaakt van opslag op locatie, in de cloud en op eindpunten om aan hun behoeften te voldoen. Gevoelige of kritieke gegevens kunnen bijvoorbeeld ter plaatse worden opgeslagen voor verbeterde beveiliging, terwijl minder gevoelige gegevens of archiefgegevens in de cloud kunnen worden opgeslagen. Hoewel het opslaan van gegevens op eindpunten van werknemers meer gemak kan bieden, kan het ook kwetsbaar zijn voor gegevensverlies of diefstal als apparaten kwijtraken, worden gestolen of gecompromitteerd. Het implementeren van eindpuntbeveiligingsmaatregelen zoals encryptie, gegevensback-up en de mogelijkheid om gegevens op afstand op te schonen is van cruciaal belang voor de bescherming van bedrijfsgegevens. Ten slotte is het ook belangrijk om de bevindingen van de audit te documenteren, inclusief eventuele geïdentificeerde kwetsbaarheden of risico’s. Deze documentatie zal dienen als basis voor het ontwikkelen van herstelplannen en het verbeteren van gegevensopslagpraktijken.
  • Gegevens classificeren: Zodra de audit is voltooid, moeten de gegevens worden geclassificeerd op basis van de gevoeligheid en het belang ervan voor de organisatie en in ‘buckets’ worden geplaatst, waaronder persoonlijk identificeerbare informatie (PII), financiële gegevens, intellectueel eigendom of gevoelige bedrijfsinformatie. Deze stap zou onder meer moeten bestaan ​​uit het bepalen hoe oud de gegevens zijn, het scheiden van de ‘goede’ gegevens van de overtollige, verouderde en triviale (ROT) gegevens, en het markeren van gegevens die niet langer nodig zijn voor onmiddellijke vernietiging via gegevensopschoning.
  • Beperk de risico's van gekloonde gegevens: Het dupliceren van gegevens van on-premise naar de cloud is een veelvoorkomend probleem voor bedrijven. Dit verhoogt niet alleen de opgeslagen gegevens (en de kosten voor opslag), maar vergroot ook het risico op gegevensdiefstal als gevolg van een lek. De eerste stap bij het beheersen van het kloonprobleem is vaststellen welke gegevens zijn gedupliceerd en waar deze zich bevinden. Een onderzoek naar de locatie van gegevens kan een beter inzicht geven in hoe deze zijn gekloond en wie er mogelijk ongeoorloofde toegang toe heeft. Gekloonde gegevens kunnen ook gevoelige informatie en/of PII bevatten. Het gebruik van voorzorgsmaatregelen zoals encryptie kan gegevens beschermen, ongeacht of deze zich in transit of ‘in rust’ bevinden. Ten slotte moeten gekloonde gegevens veilig worden verwijderd van alle opslaglocaties en back-ups.

Beleid voor gegevensbewaring voor het AI-tijdperk

Nu organisaties AI omarmen, moeten ze ook het beleid inzake de levenscyclus van gegevens en het behoud ervan op elkaar afstemmen. Zodra de audit-, classificatie- en onderzoeksfasen zijn voltooid, zullen bedrijven beter gepositioneerd zijn om het retentiebeleid bij te werken zodat het de huidige IT-omgeving weerspiegelt. Een van de belangrijkste aspecten van een beleid dat past bij 2024 is schaalbaarheid om tegemoet te komen aan de toenemende hoeveelheden gegevens die nodig zijn voor het trainen en inzetten van LLM's. Ik herhaal: voor betere AI-resultaten (en ROI) moeten gegevens accuraat, actueel en volledig zijn.

De huidige effectieve programma's voor het bewaren van gegevens vereisen ook effectieve levenscyclusbeheer- en bestuursprocessen die prioriteit geven aan duidelijk beleid en procedures voor bewaring die bewaarperioden, processen voor het opschonen van gegevens, evenals verantwoordings- en rapportagemaatregelen identificeren. 

Ten slotte kan niet genoeg worden gezegd dat meer gegevens gepaard gaan met meer risico's op het gebied van gegevensprivacy, compliance en beveiliging. Organisaties moeten robuuste maatregelen implementeren om bewaarde gegevens te beschermen tegen ongeoorloofde toegang, inbreuken en misbruik. Naast het gebruik van encryptie, toegangscontroles en anonimiseringstechnieken kan het uitvoeren van consistente beveiligingsaudits effectief zijn bij het beschermen van gevoelige informatie en het voldoen aan het groeiende aantal wereldwijde privacyregelgevingen, waarvan vele zijn gemodelleerd naar de alomvattende AVG.

Het opnieuw beoordelen van welk beleid dan ook kost tijd en voorbereidend werk. Door het moeizame proces van het opzetten van nieuwe datalevenscyclusprocessen en dataretentiebeleid zullen bedrijven een solide basis kunnen leggen om data effectiever te benutten in het AI-tijdperk, terwijl de risico’s worden beperkt en compliance wordt gewaarborgd.

spot_img

Laatste intelligentie

spot_img