Logo Zéphyrnet

Prédictions de gestion des données pour 2024 : cinq tendances émergentes – DATAVERSITY

Date :

Alors que nous approchons de la fin de l’année 2023, il est impératif pour les responsables de la gestion des données de regarder dans leurs rétroviseurs pour évaluer et, si nécessaire, affiner leurs stratégies de gestion des données. Une chose est claire ; Si les organisations centrées sur les données veulent réussir en 2024, elles devront se préparer à un environnement dans lequel les données sont de plus en plus distribuées.

Dans cette optique, nous voyons émerger cinq tendances importantes en matière de gestion des données en 2024 : l’anti-gravité des données prévaudra ; les produits de données gagneront en importance ; les organisations apprendront à adopter l’IA générative (GenAI) et à l’exploiter avec succès ; les organisations géreront plus efficacement les coûts du cloud ; et la sécurité et la gouvernance des données seront simplifiées.  

Examinons de plus près chacune de ces tendances :

L'anti-gravité des données prévaudra

La notion de gravité des données, qui est une analogie avec la nature des données et leur capacité à attirer des applications et des services supplémentaires, n'existe plus. Toute organisation dotée d'un système moderne Stratégie de données a besoin d'un entrepôt de données ainsi que d'un lac de données, voire de plusieurs, pour répondre à ses besoins commerciaux. Au cours des deux dernières décennies, les entrepôts de données et les lacs de données sont devenus populaires pour résoudre les problèmes de silos de données des entreprises, mais ils ont créé des problèmes encore plus graves. En effet, les entrepôts de données et les lacs de données sont composés à la fois de systèmes sur site et dans le cloud, et sont souvent géographiquement dispersés. En outre, même si chaque fournisseur de services cloud essaie de résoudre de nombreux problèmes de données et d'analyse de manière indépendante, la plupart des organisations gèrent leurs données et analyses dans un environnement multi-cloud, en sélectionnant les produits et services de deux ou plusieurs fournisseurs de services cloud. 

C’est pourquoi l’antigravité des données, où les données et les applications restent réparties au-delà des frontières régionales et nuageuses, sera la nouvelle norme en 2024 et au-delà. D’autres facteurs contribuant à l’anti-gravité des données seront l’augmentation des coûts de réplication des données, la souveraineté des données, les lois et réglementations locales en matière de gouvernance des données et la nécessité d’accélérer l’obtention d’informations. Alors que la tendance anti-gravité des données se poursuit, les responsables de la gestion des données devraient investir dans des technologies basées sur la gestion distribuée des données.

Les produits de données gagneront en importance

2024 sera une année charnière pour l’ascension de maillage de données, qui englobe la nature intrinsèquement distribuée des données. Contrairement aux paradigmes traditionnels et centralisés dans lesquels les données sont stockées et gérées par une équipe de données centrale qui fournit des projets de données aux utilisateurs professionnels, le maillage de données est organisé autour de plusieurs domaines de données, dont chacun est géré par les principaux consommateurs professionnels de ces données. Dans un maillage de données, le rôle de l'informatique consiste désormais à fournir les bases permettant aux domaines de données d'effectuer leur travail, c'est-à-dire la création et la distribution de produits de données dans toute l'entreprise.   

Le tournant sera la prise de conscience que les produits de données doivent être traités avec le même niveau d’importance que toute autre offre de produits. Prenez, par exemple, une capsule Tylenol : sa valeur ne réside pas seulement dans la capsule elle-même, mais également dans l'emballage complet qui gagne la confiance du consommateur : de la description et de l'utilisation prévue à la liste des ingrédients et aux mesures de sécurité. De la même manière, les catalogues de données constituent le « packaging » crucial qui transforme les données brutes en actifs fiables et consommables.

À l’ère des données, il ne suffit pas de simplement présenter les données de manière attrayante ; les organisations doivent améliorer l’ensemble de l’expérience de l’utilisateur final. Faisant écho aux meilleures pratiques des géants du commerce électronique, les plateformes de données contemporaines doivent offrir des fonctionnalités telles que des recommandations personnalisées et des produits phares populaires, tout en renforçant la confiance grâce à l'approbation des utilisateurs et à la visibilité du traçage des données. De plus, ces plates-formes devraient faciliter les requêtes en temps réel directement à partir du catalogue de données et maintenir une boucle de rétroaction interactive pour les demandes des utilisateurs, les demandes de données et les modifications. Tout comme une livraison rapide est essentielle dans le commerce électronique, un accès rapide et fiable aux données devient indispensable pour les organisations.

Les organisations auront du mal à adopter GenAI et à en tirer parti avec succès

Les organisations sont confrontées à de nombreux défis lorsqu'elles tentent de mettre en œuvre GenAI et les grands modèles de langage (LLM), notamment des problèmes de qualité des données, de gouvernance, de conformité éthique et de gestion des coûts. Chaque obstacle a des liens directs ou indirects avec la stratégie globale de gestion des données d'une organisation, affectant la capacité de l'organisation à garantir l'intégrité des données introduites dans les modèles d'IA, à respecter des directives réglementaires complexes ou à faciliter l'intégration du modèle dans les systèmes existants.

Les organisations devront gérer les coûts du cloud plus efficacement

Alors que les entreprises continuent de déplacer leurs opérations de données vers le cloud, elles sont confrontées à un obstacle de taille : l’escalade incessante et insoutenable des dépenses liées aux données cloud. Pour l’année à venir, le mandat n’est pas seulement de maîtriser cette hausse des coûts, mais de le faire tout en maintenant un service de haute qualité et une performance compétitive. La hausse des coûts d'hébergement cloud et de gestion des données empêche les entreprises de prévoir et de budgétiser efficacement, et les coûts auparavant fiables du stockage de données sur site sont devenus éclipsés par les structures tarifaires volatiles du cloud.

Pour faire face à cette pression financière, les entreprises doivent analyser minutieusement les dépenses liées au cloud et rechercher des gains d'efficacité sans sacrifier les performances. Cela implique un examen détaillé des modèles d’utilisation des données, l’identification des zones d’inefficacité et la prise en compte d’options de stockage plus rentables. Pour gérer efficacement les coûts des données cloud, les entreprises doivent se concentrer sur le calcul consommé par les requêtes et les volumes de sortie de données associés, en tablant l'utilisation des ensembles de données et en optimisant les solutions de stockage. Ces efforts sont renforcés par l'adoption des principes d'opérations financières (FinOps), qui allient la responsabilité financière au modèle de dépenses flexible du cloud. 

En surveillant régulièrement les dépenses, en prévoyant les coûts et en mettant en œuvre les meilleures pratiques financières dans la gestion du cloud, les organisations peuvent équilibrer les économies de coûts et l'efficacité opérationnelle, garantissant ainsi que leurs stratégies de données sont économiquement et fonctionnellement robustes. En 2024, nous assisterons à une augmentation significative de l’utilisation des tableaux de bord FinOps pour mieux gérer les frais de données cloud.

La sécurité et la gouvernance des données devront être simplifiées

Des données mal intégrées ont un impact sur l’agilité d’une organisation à plusieurs niveaux, mais cet impact se fait peut-être plus fortement sentir au niveau de la sécurité et de la gouvernance des données. Étant donné que la mise à jour individuelle d’une myriade de systèmes cloisonnés prend du temps, il est impossible de sécuriser ou de gouverner simultanément tous les systèmes de l’entreprise. 

Pour relever ce défi, les organisations s'appuient sur des politiques mondiales en matière de sécurité et de gouvernance des données. Les politiques globales de sécurité des données peuvent être basées non seulement sur les rôles des utilisateurs, mais également sur l'emplacement, de sorte qu'une personne en vacances ne puisse pas accéder aux données depuis le bureau principal. Les politiques mondiales de gouvernance des données peuvent également normaliser automatiquement l’orthographe de certains mots, dans les différents systèmes d’une entreprise. 

Cependant, afin de synchroniser l'application des politiques globales en temps réel, de telles mises en œuvre de sécurité et de gouvernance des données nécessitent le fondement d'une approche logique de la gestion des données, et une telle approche est abordée dans la section suivante. 

L'avenir est logique

Pour surmonter les défis inhérents à chacune de ces cinq tendances, les organisations devront être en mesure de tirer parti de stratégies de gestion des données conçues dès le départ pour prendre en charge les données distribuées. Les approches traditionnelles de gestion des données reposent sur la réplication physique des données de plusieurs systèmes vers un référentiel central, comme un entrepôt de données ou un lac de données, mais de telles approches, par définition et également en pratique, ne prennent pas en charge les données intrinsèquement distribuées. En revanche, les approches logiques de gestion des données permettent des connexions en temps réel pour disperser des données sans réplication, afin de prendre en charge les données intrinsèquement distribuées. 

En conséquence, la gestion logique des données sera là pour rester en 2024 et au-delà, car elle permet à chaque organisation de gérer les données distribuées de la manière la plus efficace et la plus rentable possible.

spot_img

Dernières informations

spot_img