Logo Zéphyrnet

The Cool Kids Corner : Gouvernance des données et IA – DATAVERSITY

Date :

Bonjour! Je m'appelle Mark Horseman et bienvenue Le coin cool des enfants. Il s'agit de mon enregistrement mensuel pour partager avec vous les personnes et les idées que je rencontre en tant qu'évangéliste des données avec DATAVERSITY. (Lire la chronique du mois dernier ici.) Ce mois-ci, nous parlons de l'interaction entre la gouvernance des données et l'intelligence artificielle (IA). À quoi devons-nous faire attention pendant que nos organisations se précipitent pour adopter des solutions d’IA comme ChatGPT et bien d’autres ? Quels sont les bénéfices? Quels sont les risques ? Et finalement, nous verrons ce que Enfants cool disent. 

L’intelligence artificielle (IA) existe depuis des décennies. Il n’est pas né comme ça. Cependant, ce qu’il a fait, c’est plonger dans l’air du temps culturel d’une manière que nous voyons rarement la technologie le faire. Comment ce changement s’est-il produit ? Un grand nombre de méthodes et de théories théorisées par les spécialistes de l’IA au début de l’informatique sont devenues réalité lorsque la puissance de calcul est devenue facilement disponible pour exécuter les algorithmes proposés par ces premiers visionnaires. 

La puissance de calcul mentionnée ci-dessus a permis la création d’outils d’intelligence artificielle populaires comme ChatGPT et bien d’autres. Ces outils soulèvent désormais des questions autour de la gouvernance des données. Votre équipe de gouvernance des données se préoccupe de la conformité, des risques et, finalement, de la production, de l'utilisation et de la définition des données. Lorsque l’on utilise l’IA, en particulier un grand modèle de langage (LLM), pour produire ou organiser du contenu, il existe plusieurs défis importants en matière de gouvernance des données. 

  • Intimité: Les données que vous insérez dans le modèle peuvent parfois être utilisées pour une formation future, ce qui signifie qu'elles pourraient être utilisées dans les résultats générés par d'autres utilisateurs. L'année dernière, il y a eu un violation d'un LLM de sorte que les données de conversation ont été impliquées dans la fuite. Si vous utilisez des données confidentielles, cela peut être plutôt négatif. 
  • Exactitude: Le terme désignant un LLM constituant des résultats non véridiques est appelé un hallucination. Selon le modèle utilisé, les hallucinations peuvent représenter jusqu'à 40 % des résultats. Cela nécessite certaines directives d'utilisation pour les utilisateurs afin d'éviter les problèmes de qualité. 
  • Conformité : Selon les types d'activités dans lesquelles les utilisateurs souhaitent s'engager, l'utilisation de ChatGPT pourrait aller à l'encontre de divers contrôles législatifs, notamment les données RGPD, CCPA, HIPPA et PCI. Cela varie bien sûr selon le cas d’utilisation, mais n’est pas hors du domaine des possibilités. Encore une fois, les utilisateurs auraient besoin de directives sur l'utilisation de l'intelligence artificielle de la part de leur équipe de gouvernance des données pour utiliser l'outil sans crainte.  
  • Éthique: Il y a eu plusieurs articles dans l'actualité ces derniers temps selon lesquels l'IA aurait des biais inhérents en raison de ses données d'entraînement. Que ce soit l'histoire de l'IA blanchir un étudiant du MIT pour lui donner un aspect plus professionnel, ou les outils de reconnaissance faciale ne fonctionnent bien qu'avec les utilisateurs caucasiens car les données d'entraînement n'étaient pas très diversifiées. L’éthique est quelque chose que nous devons prendre en compte à chaque étape lors de l’utilisation de toute solution d’IA. Un algorithme n'a aucune capacité à être moral ou éthique : c'est aux humains d'intervenir et de garantir l'équité dans le fonctionnement de tout modèle. 
  • À l'épreuve du futur : De nombreux organismes législatifs cherchent à réglementer spécifiquement l'utilisation de l'intelligence artificielle, qu'il s'agisse d'un LLM ou d'un algorithme d'apprentissage automatique qui exploite un moteur de recommandation. Un projet de loi exigeant qu'une organisation puisse décrire la manière dont un algorithme sélectionne en fonction des données d'apprentissage pourrait être assez onéreux à maintenir pour certaines organisations. Cela pourrait ne pas rendre raisonnablement possible l’utilisation de ces outils à l’avenir si les algorithmes en question constituent une véritable boîte noire. Un exemple de législation potentielle est l'AIDA qui vient du Canada
  • IA de l'Ombre : Les organisations sont confrontées à des employés qui utilisent des outils d'IA à distance de leur bureau, sans soutien en matière de politique, de procédure ou de lignes directrices pour garantir les préoccupations ci-dessus en matière de confidentialité, d'exactitude, de conformité et d'éthique. Abhishek Gupta a écrit un article éclairant intitulé "Méfiez-vous de l'émergence de l'IA fantôme" qui met en lumière certains de ces problèmes. En bref, mettez quelque chose en place et socialisez-le, car cela peut arriver dans votre organisation. 

Quels sont les Enfants cool Que pensez-vous de l'interaction entre la gouvernance des données et l'IA ? Ce mois-ci, notre enfant cool is Sarah Rasmussen, partenaire d'engagement pour First San Francisco Partners. Sarah fera une présentation à Enterprise Data World (EDW) dans quelques jours seulement. Son exposé, « Comment la gouvernance des données et la maturité des capacités de gestion des données devraient influencer votre investissement dans les modèles IA/ML », couvrira les sujets suivants : 

  • Présentez un modèle d'IA/ML déconstruit, un modèle de domaine détaillant les composants commerciaux, de gouvernance, de technologie et de données les plus critiques et les plus courants qui font partie ou influencent son cycle de vie. 
  • Démontrer la nécessité d'un modèle opérationnel de gouvernance des données pour garantir que les entrées et sorties du modèle IA/ML sont comprises et gérées de manière proactive. Cela prépare le terrain pour identifier et surmonter les risques réglementaires et de réputation et garantir que l'utilisation éthique des données d'un individu est toujours au premier plan. 
  • Explorez les parties prenantes étonnamment importantes de l'écosystème, à l'intérieur et à l'extérieur de l'organisation, qui influencent le succès du modèle et avec lesquelles les développeurs de modèles doivent interagir de manière transparente. 
  • Résumez pourquoi le fait de se concentrer sur la maturation de ses capacités de gouvernance et de gestion des données pour prendre en charge les modèles d'IA/ML profite à une multitude d'autres cas d'utilisation au niveau de l'entreprise. 

N'oubliez pas que vous pouvez rencontrer Enfants cool comme Sarah aux événements DATAVERSITY : 

Vous voulez devenir l'un des Des enfants sympas ? Il ne vous reste plus qu'à partager vos idées avec la communauté ! Pour être actif dans la communauté, participez aux webinaires DATAVERSITY, participez à des événements et réseautez avec des collègues partageant les mêmes idées. 

Le mois prochain, nous discuterons de la demande croissante en matière de gestion des données de référence : pourquoi est-elle plus à la mode que jamais ? Restez à l'écoute!

spot_img

Dernières informations

spot_img