Logo Zéphyrnet

Meilleures pratiques pour une équipe de données moderne par @ttunguz

Date :

Les équipes de données sont devenir des équipes d'ingénierie logicielle.

Le 14 décembre nous avons accueilli Philippe Zelitchenko, vice-président des données chez ZoomInfo, pour parler de la façon dont il a construit cette discipline au sein de son équipe et c'était fascinant. Le la vidéo est ici.

[Contenu intégré]

À l’instar du mouvement Devops, le mouvement Dataops vise à faire évoluer l’utilisation des données au sein des entreprises sans augmenter les effectifs de l’équipe data.

Pour ce faire, Philip définit des produits de données à l'aide de DPRD, structure son équipe de données avec cinq rôles clés et définit des rôles clairs entre l'équipe de données et les autres membres de l'entreprise.

Les DPRD, ou Data Product Requirements Documents, contiennent les informations clés sur un produit de données : ce qu'il fournira, comment il produira de la valeur, comment les données seront gouvernées, y compris les alertes sur la qualité des données.

Contrairement au code, les données sont stochastiques ou imprévisibles. Les données peuvent changer en taille, forme, distribution ou format. Cela ajoute une dimension supplémentaire de complexité aux DPRD.

En plus du DPRD, l'équipe de données ZoomInfo utilise un TEP ou un plan d'exécution technique qui aligne les équipes techniques internes sur l'architecture et la gouvernance.

L’équipe données a cinq rôles clés :

  1. Data PMs : quarterback les DPRD. Ils recueillent les commentaires des utilisateurs, définissent la valeur, sollicitent les commentaires du reste de l'équipe, puis gèrent l'exécution du plan.
  2. Logique métier : l'équipe d'ingénierie des données construit les pipelines ETL tandis que l'équipe de science des données recherche et implémente des algorithmes d'apprentissage automatique pour les produits de données pilotés par MLDS.
  3. Data analysts : intégrés/détachés auprès des différentes équipes opérationnelles, les analystes analysent les données dont chaque équipe a besoin en utilisant l'infrastructure fournie par la plateforme de données.
  4. Gouvernance des données : garantit la qualité/exactitude des données, définit les politiques de contrôle d'accès pour la sécurité, définit la procédure opérationnelle d'alerte et de surveillance et aide à définir les contrats de données entre les producteurs, les transformateurs et les consommateurs.
  5. Plateforme de données : construit l'infrastructure de données universelle pour l'entreprise.

Enfin, l'équipe ZoomInfo développe un produit interne appelé Heartbeat qui mesure l'utilisation des principaux produits de données, évalue la priorité, les SOP pour l'impact sur les SLA et la communication avec les praticiens des données à travers l'organisation de manière automatisée.

Pour Philip, diriger l'équipe de données consiste à se concentrer sur les produits de données qui génèrent une valeur significative pour l'entreprise. J'ai énormément appris sur la manière dont fonctionnent les équipes de données modernes, qui s'appuient sur les disciplines du génie logiciel.

Merci Philippe !

spot_img

Dernières informations

spot_img