Logo Zéphyrnet

Annonce de la mise à jour du connecteur Microsoft OneDrive (V2) pour Amazon Kendra

Date :

Amazone Kendra est un service de recherche intelligent alimenté par l'apprentissage automatique (ML), permettant aux organisations de fournir des informations pertinentes aux clients et aux employés, quand ils en ont besoin.

Amazon Kendra utilise des algorithmes ML pour permettre aux utilisateurs d'utiliser des requêtes en langage naturel pour rechercher des informations dispersées sur plusieurs sources de données dans une entreprise, y compris les systèmes de stockage de documents couramment utilisés tels que Microsoft onedrive.

OneDrive est un service de stockage cloud en ligne qui vous permet d'héberger votre contenu et de le synchroniser automatiquement sur plusieurs appareils. Amazon Kendra peut indexer des formats de documents tels que Microsoft OneNote, HTML, PDF, Microsoft Word, Microsoft PowerPoint, Microsoft Excel, Rich Text, JSON, XML, CSV, XSLT et texte brut.

Nous sommes ravis d'annoncer que nous avons mis à jour le connecteur OneDrive pour Amazon Kendra afin d'ajouter encore plus de fonctionnalités. Par exemple, nous avons ajouté la prise en charge de la recherche de documents OneNote. De plus, vous pouvez désormais choisir d'utiliser les informations d'identité ou ACL pour rendre vos recherches plus précises.

Le connecteur aide à indexer les documents et leurs informations de contrôle d'accès pour limiter les résultats de la recherche aux seuls documents auxquels l'utilisateur est autorisé à accéder. Pour afficher les résultats de la recherche en fonction des droits d'accès de l'utilisateur et en utilisant uniquement les informations de l'utilisateur, le connecteur fournit un analyseur d'identité pour charger les informations principales, telles que les mappages d'utilisateurs et de groupes dans un magasin principal.

Dans cet article, nous montrons comment configurer plusieurs sources de données dans Amazon Kendra pour fournir un emplacement central pour effectuer des recherches dans votre référentiel de documents.

Vue d'ensemble de la solution

Pour notre solution, nous montrons comment indexer un référentiel ou un dossier OneDrive à l'aide du connecteur Amazon Kendra pour OneDrive. La solution consiste en les étapes suivantes :

  1. Créer et configurer une application sur Portail Microsoft Azure et obtenir les identifiants d'authentification.
  2. Créez une source de données OneDrive via la console Amazon Kendra.
  3. Indexez les données dans le référentiel OneDrive.
  4. Exécutez un exemple de requête pour obtenir les informations.
  5. Filtrez la requête par utilisateurs ou groupes.

Pré-requis

Pour essayer le connecteur Amazon Kendra pour OneDrive, vous avez besoin des éléments suivants :

Configurer une application Azure et attribuer des autorisations de connexion

Avant de configurer la source de données OneDrive, nous avons besoin de quelques détails sur le référentiel OneDrive. Effectuez les étapes suivantes :

  1. Connectez-vous à Azure.
  2. Après vous être connecté avec les informations d'identification de votre compte, choisissez Inscriptions d'applications, Puis choisissez Nouvelle inscription.
  3. Donnez un nom approprié à votre application et enregistrez l'application.
  4. Collectez les informations sur l'ID client, l'ID locataire et d'autres détails de l'application.
  5. Pour obtenir un secret client, choisissez Ajouter un certificat ou un secret sous Identifiants du client.
  6. Selectionnez Nouveau secret client et fournissez la description et la date d'expiration appropriées.
  7. Notez les valeurs client-id, tenant-id et secret-id. Nous les utilisons pour authentifier l'application OAuth2.
  8. Accédez à L'Application, choisissez Autorisations API dans le volet de navigation, puis choisissez Ajouter une autorisation.
  9. Selectionnez Microsoft Graph.
  10. Sous Autorisations d'application, Entrer Déposez votre dernière attestation dans la barre de recherche et sous Fichiers, sélectionnez Fichiers.Lire.Tout.
  11. Selectionnez Ajouter des autorisations
  12. De même, ajoutez les autorisations suivantes sur le Microsoft Graph option pour l'application que vous avez créée :
    1. Group.Read.All
    2. Notes.Read.All

Une fois terminé, les autorisations de l'API ressembleront à la capture d'écran suivante.

Configurer le connecteur Amazon Kendra pour OneDrive

Pour configurer le connecteur Amazon Kendra, procédez comme suit :

  1. Sur la console Amazon Kendra, choisissez Créer un index.
  2. Pour Nom de l'index, entrez un nom pour l'index (par exemple, my-onedrive-index).
  3. Saisissez une description facultative.
  4. Selectionnez Créer un nouveau rôle.
  5. Pour Nom de rôle, saisissez un nom de rôle IAM.
  6. Configurer les paramètres et balises de chiffrement facultatifs
  7. Selectionnez Suivant
  8. Dans le Configurer le contrôle d'accès des utilisateurs section, sélectionnez Oui sous Contrôle d'accès paramètres.
  9.  Pour Token tapez, choisissez JSON dans le menu déroulant.
  10. Laissez les valeurs restantes comme valeurs par défaut.
  11. Selectionnez Suivant

Avant de passer à l'étape de configuration suivante, nous devons fournir à Amazon Kendra un rôle disposant des autorisations nécessaires pour se connecter au site. Celles-ci incluent l'autorisation d'obtenir et de déchiffrer le secret AWS Secrets Manager qui contient l'ID d'application et la clé secrète nécessaires pour se connecter au site OneDrive.

  1. Ouvrez un autre onglet pour le compte AWS et, sur la console IAM, accédez au rôle que vous avez créé précédemment (par exemple, AmazonKendra-us-west-2-onedrive).
  2. Selectionnez Ajouter des autorisations ainsi que Créer une politique en ligne.
  3. Pour Service, choisissez Kendra.
  4. Pour Actionschoisir Écrire et préciser BatchPutDocument.
  5. Pour Ressources, choisissez Toutes les ressources.
  6. Selectionnez Politique de révision.
  7. Pour Nom, entrez un nom (par exemple, BatchPutPolicy).
  8. Selectionnez Créer une politique.
  9. Ajoutez cette stratégie au rôle que vous avez créé.
  10. De plus, joignez le SecretsManagerReadWrite Stratégie gérée par AWS au rôle
  11. Retournez à l'onglet Amazon Kendra.
  12. Sélectionnez Édition développeur et choisissez Création.

Cela crée et propage le rôle IAM, puis crée l'index Amazon Kendra, ce qui peut prendre jusqu'à 30 minutes.

  1. Revenez à la console Amazon Kendra, choisissez Les sources de données dans le volet de navigation, puis choisissez Ajouter une source de données.
  2. Sous Connecteur OneDrive V2.0, choisissez Ajouter un connecteur.
  3. Pour Nom de la source de données, entrez un nom (par exemple, my-onedrive).
  4. Saisissez une description facultative.
  5. Selectionnez Suivant.
  6. Pour ID de locataire OneDrive, entrez l'ID de locataire que vous avez recueilli précédemment.
  7. Pour Configurer le VPC et le groupe de sécurité, laissez la valeur par défaut (Pas de VPC).
  8. XNUMX éléments à Le robot d'exploration d'identité est activé choisi. Ceci importe les informations d'identité dans l'index.
  9. Pour le rôle IAM, choisissez Créer un nouveau rôle.
  10. Entrez un nom de rôle, tel que AmazonKendra-us-west-2-onedrive, Puis choisissez Suivant.
  11. Dans le Authentification section, choisissez Créer et ajouter un secret.
  12. Créez un secret avec clientId ainsi que clientSecret comme clés.
  13. Ajoutez leurs valeurs respectives aux informations que vous avez recueillies précédemment.
  14. Selectionnez Suivant.
  15. Dans le Configurer les paramètres de synchronisation , ajoutez les utilisateurs OneDrive dont vous souhaitez indexer les documents.
  16. Sélectionnez le mode de synchronisation pour l'index. Pour ce poste, nous sélectionnons Synchronisation de contenu nouveau, modifié ou supprimé.
  17. Choisissez la fréquence d'indexation comme Fonctionne à la demande, Puis choisissez Suivant.

Les mappages de champs vous permettent de définir la possibilité de recherche et la pertinence des champs. Par exemple, le lastUpdatedAt peut trier ou améliorer le classement des documents en fonction de leur date de mise à jour récente.

  1. Conservez toutes les valeurs par défaut dans le Définir les mappages de champs section et choisissez Suivant.
  2. Sur la page de révision, choisissez Ajouter une source de données

  3. Selectionnez Synchroniser maintenant

La synchronisation peut prendre jusqu'à 30 minutes.

Testez la solution

Maintenant que vous avez indexé le contenu de OneDrive, vous pouvez le tester en interrogeant l'index.

  1. Accédez à votre index sur la console Amazon Kendra et choisissez Rechercher du contenu indexé dans le volet de navigation.
  2. Entrez un terme de recherche et appuyez sur Entrer.

Notez que sans jeton, les ACL empêchent le retour d'un résultat de recherche.

  1. Développer vous Tester la requête avec un jeton d'accès et choisissez Appliquer le jeton.
  2. Entrez le jeton approprié avec un utilisateur autorisé à lire le fichier et choisissez Appliquer.
  3. Recherchez à nouveau les informations présentes dans OneDrive.

Vous pouvez vérifier qu'Amazon Kendra présente les résultats classés comme prévu.

Félicitations, vous avez configuré Amazon Kendra pour indexer et rechercher des documents dans OneDrive et en contrôler l'accès à l'aide d'ACL.

Conclusion

Avec le connecteur Microsoft OneDrive V2 pour Amazon Kendra, les organisations peuvent puiser dans les magasins de documents d'entreprise couramment utilisés, en toute sécurité à l'aide de la recherche intelligente optimisée par Amazon Kendra. Vous pouvez améliorer l'expérience de recherche en intégrant la source de données avec la fonctionnalité Custom Document Enrichment (CDE) dans Amazon Kendra pour effectuer une logique de mappage d'attribut supplémentaire et même une transformation de contenu personnalisée lors de l'ingestion.


À propos des auteurs

Pravinchandra Varma est un architecte senior de livraison client au sein de l'équipe AWS Professional Services et est passionné par les applications des services d'apprentissage automatique et d'intelligence artificielle.

Supratim Barât est un ingénieur développeur de logiciels avec l'équipe AWS Kendra Yellowbadge et est un passionné de blockchain et de cybersécurité

spot_img

Dernières informations

spot_img