Zephyrnet-logo

Maak prognoses en vind afwijkingen uit uw gegevens met Amazon QuickSight ML Insights

Datum:

Naarmate de technologie vordert, verzamelt uw bedrijf steeds meer gegevens uit verschillende bronnen. Na het verzamelen van zoveel datapunten, is het vaak een uitdaging om de juiste inzichten te vinden om uw bedrijf te helpen groeien. Dashboards zijn geweldig in het visualiseren van uw gegevens, op basis van hoe u ze heeft gebouwd, maar niet altijd goed in het vinden van verborgen inzichten, zoals afwijkingen of uitschieters in uw gegevens. Ze helpen mensen om gegevens te vinden, maar niet om mensen te vinden. Naarmate uw gegevensverzameling schaalt, moet u van het eerste naar het latere overschakelen om te voorkomen dat het aantal mensen wordt geschaald. Uw bedrijf heeft misschien niet de tijd of middelen om meer dan trends op hoog niveau te zien, of krijgt mogelijk alleen diepgaande inzichten uit een kleine subset van gegevens.

Deze beperkingen kunnen uw vermogen belemmeren om weloverwogen zakelijke beslissingen te nemen. Amazon QuickSight heeft ingebouwde, machine learning (ML) -gestuurde anomaliedetectie, waarmee u tijd en middelen kunt besparen bij het bouwen van ML-modellen, training, afstemming van hyperparameters, inferentie en implementatietaken. U krijgt ook diepgaande inzichten uit miljoenen statistieken en miljarden datapunten op schaal.

In dit bericht wordt uitgelegd hoe u het kunt gebruiken ML-inzichten om handige visualisaties en prognoses te maken. De walkthrough maakt gebruik van de volgende AWS-services:

  • Amazon QuickSight om de ML-inzichten en visualisatie op te bouwen
  • Amazone Athene om de Amazon QuickSight-gegevensset te raadplegen voor handmatige gegevensanalyse.
  • AWS lijm de dataset crawlen en metadata voorbereiden zonder deze in de advertentie te laden. Dit verlaagt de kosten van het runnen van een dure database; u kunt visuals opslaan en uitvoeren van onbewerkte gegevensbestanden die zijn opgeslagen in een goedkope, zeer schaalbare en duurzame S3-bucket.
  • Amazon S3 om de gegevensbron op te slaan.

Uw dataset voorbereiden

Om aan de slag te gaan, moet u uw datasets verzamelen, opschonen en voorbereiden voor Amazon QuickSight. Dit bericht gebruikt Amazon S3 als gegevensbron, maar u kunt alle door Quicksight ondersteunde gegevensbronnen zoals Redshift, Athena, RDS, Aurora, MySQL, Postgres, MariaDB en meer gebruiken om uw visualisatie te doorzoeken en samen te stellen. Dit bericht gebruikt drie datasets:

De visualisaties in dit bericht zijn van na het opschonen van de gegevens, het wijzigen van het gegevenstype en het filteren van de gegevens om de dimensies weer te geven die vereist zijn voor de gegeven use-case.

Voer de volgende stappen uit om uw gegevensset voor supermarktverkopen voor te bereiden:

  1. Maak op de AWS S3-console een S3-bucket door te selecteren Maak een bucket.
  2. Geef bij Bucketnaam een ​​geschikte naam op en selecteer de regio waar u uw visualisatie wilt bouwen en selecteer Maak een bucket.
  3. Download de openbare dataset op uw lokale computer.
  4. Selecteer de S3-bucket en kies Uploaden, navigeer naar het gedownloade gegevenssetbestand op uw lokale computer.
  5. Selecteer het datasetbestand en kies Uploaden.
  6. Maak op de AWS Glue-console een crawler die op een CSV-bestand wordt uitgevoerd om de metadata voor te bereiden.
  7. Voor Crawler naam, voer een naam in voor uw crawler; bijvoorbeeld, sales-data.
  8. Kies Volgende.
  9. In het Voeg een datastore toe sectie, voor Kies een datastore, kiezen S3.
  10. Voor Crawl gegevens inselecteer Opgegeven pad in mijn account.
  11. Voor Inclusief pad, voer het pad naar uw S3-bucket in. U kunt meerdere gegevensarchieven opnemen als u deze heeft.
  12. Kies Volgende.
  13. In het Kies een IAM-rol sectie, selecteer Maak een IAM-rol.
  14. Voor IAM rol, voer de rol in die AWS Glue nodig heeft om toegang te krijgen tot Amazon S3.
  15. Kies Volgende.
  16. In het Maak een planning voor deze crawler sectie, voor Frequentie, kies wanneer u wilt dat de crawler op uw gegevens draait. Kies voor dit bericht Rennen op aanvraag.

    Dit geeft u de flexibiliteit om te beslissen hoe vaak u wilt dat de updates van de dataset reflecteren op uw metadata.
  17. In het Configureer de uitvoer van de crawler sectie, voor Database, kiest u de database die de tabel bevat die de crawler moet gebruiken.
  18. Kies Volgende.
  19. Kies nadat u de crawler heeft gemaakt Crawler uitvoerenHet kan enkele minuten duren voordat de crawler is voltooid.
  20. Op de AWS Glue-console, onder databases, kiezen Tafels.
  21. Kies de database die u heeft gemaakt.
  22. Kies Bekijk tafel.
  23. Van de Actie vervolgkeuzemenu, kies Bekijk gegevens.

    Deze stap brengt u naar de Athena-console. Athena biedt u de flexibiliteit om eenmalige query's uit te voeren om uw gegevens handmatig te analyseren wanneer u deze nodig heeft. U kunt bijvoorbeeld controleren welke leden van de productlijn het liefst kopen met een creditcard of Ewallet door de volgende code in de Athena Query Editor in te voeren:
    SELECT "product line", "unit price", "quantity", "total", "rating", "customer type", "payment"
    FROM "sales-data"."supermarket_sales_data"
    WHERE "customer type" = 'Member' AND "payment" IN ('Credit card', 'Ewallet');
    

    De volgende schermafbeelding toont de uitvoer van de query.

  24. Nadat u de database hebt gemaakt, kiest u op de Amazon QuickSight-console Nieuwe analyse.
  25. Kies Nieuwe dataset.
  26. Kies Athena als uw gegevensbron.
  27. Voor Naam gegevensbron, maak een naam; bijvoorbeeld verkoopgegevens.
  28. Kies Maak een gegevensbron.
  29. In het Kies je tafel sectie, kies uw database in Athena.
  30. Selecteer alle tabellen die u wilt visualiseren.
  31. Kies om een ​​object in uw dataset te bewerken Gegevens bewerken / bekijken.
  32. Kies kies.

    De volgende schermafbeelding laat zien hoe de gegevens eruit zien als u het gegevenstype voor het Date veld van String to Date. Dit opent een gegevensvoorbeeldgedeelte.
  33. In het Datum kies het gegevenstype DraadEr verschijnt een venster met de beschikbare datatype-opties.
  34. Kies Datum.
  35. Kies Bespaar.

Visualiseren van de gegevens

U bent nu klaar om enkele visualisaties te maken. Dit bericht maakt gebruik van datasets met betrekking tot supermarktverkopen, vluchtgegevens en woningverkopen.

Supermarkt verkoop

Dit bericht gebruikt de Supermarkt verkoop dataset van de kaggle-website. Deze dataset met tijdreeksen is perfect voor trend- en anomaliedetectie voor retailers die snel anomalieën in historische verkopen willen opsporen en sorteren op filiaal, stad, datum en tijd en klanttype.

Voer de volgende stappen uit om de totale verkoop in 2019 en de belangrijkste bijdragers aan de productverkoop te analyseren:

  1. Kies op de Amazon QuickSight-console Supermarkt_sales_data-analyse, die u eerder heeft gemaakt.
  2. Kies Toevoegen.
  3. Kies Voeg inzicht toe.
  4. Van de Computation vervolgkeuzemenu, kies Onregelmatigheidsdetectie.
  5. Kies kies.
  6. In het Veldputten sectie, voor Tijd, kiezen gegevens.
  7. Voor Values, kiezen totaal).
  8. Voor Categorieën, kiezen productlijn.

    Er wordt een nieuwe configuratiepagina geopend.
  9. Kies Bespaar.
  10. Kies Ren nu.

    Amazon QuickSight filtert de geselecteerde dimensies en vult een anomalie in de totale verkoop. Op het linkerdeel toont de Amazon QuickSight-bijdrageanalyse u de beste klanten die hebben bijgedragen aan een piek in de verkoopcyclus. Zie de volgende schermafbeelding.

Vluchtvertragingen

Anomaliedetectie is ook nuttig voor andere bedrijven; bijvoorbeeld luchtvaartmaatschappijen die vanuit meerdere locaties in het land opereren. Dit bericht gebruikt de Luchtvaartmaatschappijen vertraging dataset van de data.world-website. Deze openbare dataset maakt gebruik van gegevens van het Amerikaanse ministerie van Transport en houdt de prestaties van binnenlandse vluchten op tijd bij. Luchtvaartmaatschappijen kunnen anomalieën detecteren die bijdragen aan vertragingen bij het vertrek. U kunt dezelfde stappen volgen als in de voorgaande sectie om de anomalievisualisatie te maken. Zie de volgende schermafbeelding.

Met behulp van de autonarratieve functie

Hoewel grafieken en diagrammen meestal inzicht kunnen geven in gegevens, moet u toch begrijpen wat u van de gegevens kunt leren, zodat u kunt uitleggen wat de grafieken betekenen voor uw partners en collega's.

De functie voor automatische vertelling in Amazon QuickSight biedt duidelijke uitleg die u kunt gebruiken om u voor te bereiden op directiebesprekingen. Afhankelijk van uw gegevens en de grafieken in uw dashboard, biedt Amazon QuickSight automatisch veel inzichten en verhalen in natuurlijke taal.

Voorgestelde inzichten toevoegen

Amazon QuickSight biedt voorgestelde inzichten die u aan uw visualisaties kunt toevoegen. Dit bericht laat zien hoe u meer inzichten kunt toevoegen aan de gegevenssets voor supermarktverkopen en vluchtvertragingen.

U kunt ook aangepaste inzichten toevoegen vanuit een vooraf gebouwde set berekeningen. Zie voor meer informatie Aangepaste inzichten toevoegen aan uw analyse.

Supermarkt verkoop

Misschien wilt u de drie belangrijkste betaalmethoden weten die klanten in 2019 in winkels hebben gebruikt. U kunt de gegevensset supermarktverkopen gebruiken om gegevens uit te splitsen op productlijn en betalingstype. Voer de volgende stappen uit:

  1. Op je Supermarket_sales_data analyse, onder Visuele typen, kies de tabel pictogram.
  2. Voor Veldputten, kiezen productlijn en betaling.
  3. Onder Insights, voeg eventueel voorgestelde aanvullende inzichten toe aan uw visualisatie door de +

    De volgende schermafbeelding toont aanvullende details wanneer u uw favoriete inzichten kiest.

Vertragingen van vliegtuigverhuizers

U kunt de gegevensset van de luchtvaartmaatschappij van eerder gebruiken om de grootste vertragingen van luchtvaartmaatschappijen te analyseren in januari 2018, vergeleken met eerdere vertragingen. Gebruik dezelfde stappen als hiervoor met de gegevensset met vluchtvertragingen. Zie de volgende schermafbeelding.

Door ML aangedreven prognoses

U kunt gegevenspunten van klanttransacties verzamelen om toekomstige verkopen te voorspellen. Analytics-teams moeten vaak complexe algoritmen en ML-aangedreven oplossingen bouwen om die projecties te bouwen en te presenteren. Amazon QuickSight gebruikt ML om dit probleem te vereenvoudigen met zijn ingebouwde door ML aangedreven prognoses en wat-als-analyse. U kunt visuele projecties van uw gegevens krijgen zonder enige expertise in ML of gegevensanalyse.

Supermarkt verkoop

Om door ML aangedreven prognoses te demonstreren, gebruikt deze post de dataset van supermarktverkopen om productverkopen te voorspellen in zowel wekelijkse als driemaandelijkse trends. De verkoopdataset heeft datakorrels van meerdere datapunten. Zie voor meer informatie over de juiste gegevenspunten Datasetvereisten voor het gebruik van ML Insights met Amazon QuickSight.

Voer de volgende stappen uit om door ML aangedreven prognoses uit te voeren:

  1. Op je Supermarket_sales_data analyse, onder Visuele typen, kies de lijngrafiek
  2. Voor Veldputtenvoor X-as, kiezen gegevens.
  3. Voor Waarde, kiezen totaal).
  4. Kies op de visual in het vervolgkeuzemenu Voeg prognose toe.

    Dit creëert een lijndiagramprognose. Zie de volgende schermafbeelding.

Verkoop van huizen

Een ander populair zakelijk gebruiksscenario voor ML-prognoses is het voorspellen van huizenverkoopprijzen op basis van historische gegevens. Dit bericht gebruikt de Huisverkopen in King County, VS. dataset van de kaggle-website, die bestaat uit huisvestingsgegevens van King County, Washington.

Volg de stappen in het voorgaande gedeelte om een ​​prognose voor de gemiddelde huizenprijs te maken, gesorteerd op datum. De volgende schermafbeelding toont een lijndiagramprognose.

Conclusie

Dit bericht liet zien hoe u krachtige inzichten kunt opbouwen met Amazon QuickSight ML Insights, waarmee u afwijkingen in uw gegevens kunt opsporen, projecties kunt maken en meer. Zie voor meer informatie over het aanpassen van ML Insights Amazon QuickSight kondigt algemene beschikbaarheid van ML Insights aan.


Over de auteurs

Pranabesh-mandal is Solutions Architect bij AWS. Hij heeft meer dan tien jaar IT-ervaring in het werken met zakelijke klanten. Hij is gepassioneerd door cloudtechnologie en richt zich op Analytics. In zijn vrije tijd houdt hij ervan om samen met zijn vrouw te wandelen en de prachtige natuur en het wilde leven van de meest goddelijke nationale parken in de Verenigde Staten te verkennen.

Karthik Odaally is een Senior Solutions Architect bij AWS. Hij promoot een datagedreven cultuur binnen zijn team en is gepassioneerd om zijn werk samen met zijn klanten te delen op AWS Re: Invent-conferenties. In zijn vrije tijd bakt hij hier in de PNW koekjes en cupcakes voor familie en vrienden. Hij houdt van vintage racewagens.

Bron: https://aws.amazon.com/blogs/machine-learning/build-forecasts-and-find-anomalies-from-your-data-with-amazon-quicksight-ml-insights/

spot_img

Laatste intelligentie

spot_img