Zephyrnet-logotyp

Bygg en databerättelseapplikation med Amazon Redshift Serverless och Toucan

Datum:

Det här inlägget skrevs tillsammans med Django Bouchez, lösningsingenjör på Toucan.

Business Intelligence (BI) med instrumentpaneler, rapporter och analyser är fortfarande ett av de mest populära användningsfallen för data och analyser. Det ger affärsanalytiker och chefer en visualisering av företagets tidigare och nuvarande tillstånd, vilket hjälper ledare att fatta strategiska beslut som dikterar framtiden. Kunder fortsätter dock att efterfråga bättre sätt att berätta historier med sina data, och ökar därför användningshastigheten för sina BI-verktyg.

De flesta BI-verktyg på marknaden tillhandahåller en uttömmande uppsättning anpassningsalternativ för att bygga datavisualiseringar. Det kan verka som en bra idé, men i slutändan belastar affärsanalytiker som behöver navigera genom oändliga möjligheter innan de bygger en rapport. Analytiker är inte grafiska formgivare, och en dåligt utformad datavisualisering kan dölja den insikt den är avsedd att förmedla, eller till och med vilseleda tittaren. För att få mer värde av din data bör du fokusera på att bygga datavisualiseringar som berättar historier och som är lätta att förstå för din publik. Det är här guidad analys hjälper. Istället för att presentera obegränsade alternativ för anpassning, begränsar det avsiktligt valet genom att upprätthålla bästa praxis för design. Enkelheten i en guidad upplevelse gör det möjligt för affärsanalytiker att lägga mer tid på att generera faktiska insikter snarare än att oroa sig för hur de ska presentera dem.

Det här inlägget illustrerar konceptet med guidad analys och visar dig hur du kan bygga en databerättelseapplikation med Amazon Redshift Serverlös och Toucan, en AWS-partner. Toucan integreras naturligt med Redshift Serverless, vilket gör att du kan distribuera en skalbar datastack på några minuter utan att behöva hantera någon infrastrukturkomponent.

Amazon RedShift är en helt hanterad molndatalagertjänst som gör att du kan analysera stora mängder strukturerad och semistrukturerad data. Amazon Redshift kan skala från några gigabyte till ett petabyte-skala datalager, och AWS tillkännagav nyligen den globala tillgängligheten av Redshift Serverless, vilket gör det till ett av de bästa alternativen för att lagra data och köra ad hoc-analyser på ett skalbart och kostnadseffektivt sätt .

Med Redshift Serverless kan du få insikter om din data genom att köra fristående SQL-frågor eller genom att använda verktyg för datavisualisering som t.ex. Amazon QuickSight, Toucan eller andra tredjepartsalternativ utan att behöva hantera din datalagerinfrastruktur.

Toucan är en molnbaserad plattform för guidad analys byggd med ett mål i åtanke: minska komplexiteten i att ge företagsanvändare datainsikter. För detta ändamål tillhandahåller Toucan en kodlös och omfattande användarupplevelse i varje steg av databerättelseapplikationen, vilket inkluderar dataanslutning, uppbyggnad av visualisering och distribution på vilken enhet som helst.

Om du har bråttom och vill se vad du kan göra med denna integration, kolla in Visualisering av hajattacker med AWS & Toucan, där Redshift Serverless och Toucan hjälper till att förstå utvecklingen av hajattacker i världen.

Översikt över lösningen

Det finns många BI-verktyg på marknaden, som vart och ett ger en ständigt ökande uppsättning möjligheter och anpassningsmöjligheter för att skilja sig från konkurrenterna. Paradoxalt nog verkar detta inte öka användningen av BI-verktyg i företag. Med mer komplexa verktyg lägger dataägare tid på att bygga snygga bilder och tenderar att lägga till så mycket information som möjligt i sina instrumentpaneler istället för att ge ett tydligt och enkelt budskap till företagsanvändare.

I det här inlägget illustrerar vi konceptet med guidad analys genom att sätta oss i en dataingenjörs skor som behöver kommunicera berättelser till affärsanvändare med datavisualiseringar. Denna fiktiva dataingenjör måste skapa instrumentpaneler för att förstå hur hajattacker utvecklats under de senaste 120 åren. Efter att ha laddat hajattacker dataset i Redshift Serverless guidar vi dig i att använda Toucan för att bygga berättelser som ger en bättre förståelse för hajattacker genom tiden. Med Toucan kan du naturligt ansluta till datauppsättningar i Redshift Serverless, transformera data med ett kodfritt gränssnitt, bygga storytelling och publicera dem för företagsanvändare. De hajattacker visualisering exempel illustrerar vad du kan uppnå genom att följa instruktionerna i det här inlägget.

Dessutom har vi spelat in en video tutorial som förklarar hur du ansluter Toucan med Redshift Serverless och börjar bygga diagram.

Lösningsarkitektur

Följande diagram visar arkitekturen för vår lösning.

Arkitektur diagram

Vi använder en AWS molnformation stack för att distribuera alla resurser du behöver i ditt AWS-konto:

  • Nätverkskomponenter – Detta inkluderar en VPC, tre offentliga undernät, en internet-gateway och en säkerhetsgrupp för den Redshift Serverless-slutpunkten. I det här inlägget använder vi offentliga undernät för att underlätta dataåtkomst från externa källor såsom Toucan-instanser. I det här fallet är data i Redshift Serverless fortfarande skyddade av säkerhetsgruppen som begränsar inkommande trafik och av databasens autentiseringsuppgifter. För en produktionsbelastning rekommenderas det att hålla trafik i Amazon-nätverket. För det kan du ställa in Redshift Serverless endpoints i privata undernät och distribuera Toucan i ditt AWS-konto via AWS Marketplace.
  • Redshift Serverlösa komponenter – Detta inkluderar en Redshift Serverless namnrymd och arbetsgrupp. Redshift Serverless-arbetsytan är allmänt tillgänglig för att underlätta anslutningen från Toucan-instanser. Databasnamnet och administratörens användarnamn definieras som parametrar när CloudFormation-stacken distribueras, och administratörslösenordet skapas i AWS Secrets Manager. I det här inlägget använder vi databasuppgifter för att ansluta till Redshift Serverless, men Toucan stöder även anslutning med AWS-referenser och AWS identitets- och åtkomsthantering (JAG ÄR) profiler.
  • Anpassade resurser – CloudFormation-stacken inkluderar en anpassad resurs, som är en AWS Lambda funktion som laddar hajattackerdata automatiskt i din Redshift Serverless-databas när CloudFormation-stacken skapas.
  • IAM roller och behörighets – Slutligen inkluderar CloudFormation-stacken alla IAM-roller associerade med tjänster som tidigare nämnts för att interagera med andra AWS-resurser på ditt konto.

I följande avsnitt tillhandahåller vi alla instruktioner för att ansluta Toucan med dina data i Redshift Serverless, och guidar dig för att bygga din databerättelseapplikation.

Exempeldatauppsättning

I det här inlägget använder vi en anpassad datauppsättning som listar alla kända hajattacker i världen, med start från 1900. Du behöver inte importera datan själv; vi använder Amazon Redshift COPY kommando för att ladda data när CloudFormation-stacken distribueras. COPY-kommandot är en av de snabbaste och mest skalbara metoderna för att ladda data till Amazon Redshift. För mer information, se Använda ett COPY-kommando för att ladda data.

Datauppsättningen innehåller 4,900 XNUMX poster med följande kolumner:

  • Datum
  • År
  • Decade
  • Århundrade
  • Typ
  • Zone_Type
  • Zon
  • Land
  • Aktivitet
  • Sex
  • Ålder
  • Fatal
  • Tid
  • Arter
  • href (en PDF-länk med beskrivning av sammanhanget)
  • Ärendenummer

Förutsättningar

För denna lösning bör du ha följande förutsättningar:

Ställ in AWS-resurserna

Du kan starta CloudFormation-stacken i vilken region som helst där Redshift Serverless är tillgängligt.

  1. Välja Starta stack för att börja skapa de nödvändiga AWS-resurserna för det här inlägget:

  1. Ange databasnamnet i Redshift Serverless (standard är dev).
  2. Ange administratörens användarnamn (standard är admin).

Du behöver inte ange databasadministratörslösenordet eftersom det skapas i Secrets Manager av CloudFormation-stacken. Hemlighetens namn är AWS-Toucan-Redshift-Password. Vi använder det hemliga värdet i efterföljande steg.

Testa distributionen

CloudFormation-stacken tar några minuter att distribuera. När det är klart kan du bekräfta att resurserna skapades. För att komma åt dina data måste du skaffa Redshift Serverless-databasuppgifterna.

  1. Utgångarna fliken för CloudFormation-stacken, notera namnet på Secrets Manager-hemligheten.

BDB-2389temp

  1. På Secrets Manager-konsolen, navigera till Amazon Redshift-databasens hemlighet och välj Hämta hemligt värde för att få databasadministratörens användarnamn och lösenord.

  1. För att se till att din Redshift Serverless-databas är tillgänglig och innehåller hajattackerdataset, öppna Redshift Serverless-arbetsgruppen på Amazon Redshift-konsolen och välj Fråga data för att komma åt frågeredigeraren.
  2. Notera också Redshift Serverless endpoint, som du behöver för att ansluta till Toucan.

  1. I Amazon Redshift-frågeredigeraren, kör följande SQL-fråga för att se hajattackerdata:
SELECT * FROM "dev"."public"."shark_attacks";

Redshift Query Editor v2

Observera att du måste ändra namnet på databasen i SQL-frågan om du ändrar standardvärdet när du startar CloudFormation-stacken.

Du har konfigurerat Redshift Serverless i ditt AWS-konto och laddat upp datasetet för hajattacker. Nu är det dags att använda dessa data genom att bygga en storytelling-applikation.

Starta din gratis testversion av Toucan

Det första steget är att komma åt Toucan-plattformen via Toucan gratis provperiod.

Fyll i formuläret och slutför registreringsstegen. Du anländer sedan i Berättarstudio, i Staging-läge. Utforska gärna det som redan har skapats.

Toucan hemsida

Anslut Redshift Serverless med Toucan

För att ansluta Redshift Serverless och Toucan, utför följande steg:

  1. Välja Datalagring längst ner i Toucan Storytelling Studio.
  2. Välja kontakter.

Toucan är integrerat med Redshift Serverless med AnyConnect.

  1. Sök efter Amazon Redshift-kontakten och Fyll i formuläret med följande uppgifter:
    • Namn – Namnet på kontakten i Toucan.
    • Host – Din Redshift Serverless slutpunkt.
    • Port – Lyssningsporten för din Amazon Redshift-databas (5439).
    • Standarddatabas – Namnet på databasen att ansluta till (dev som standard, såvida den inte redigeras i CloudFormations stackparametrar).
    • Autentiseringsmetod – Autentiseringsmekanismen för att ansluta till Redshift Serverless. I det här fallet använder vi databasuppgifter.
    • Användare – Användarnamnet som ska användas för autentisering med Redshift Serverless (admin som standard, såvida det inte redigeras i CloudFormations stackparametrar).
    • Lösenord – Lösenordet som ska användas för autentisering med Redshift Serverless (du bör hämta det från Secrets Manager; hemlighetens namn är AWS-Toucan-Redshift-Password).

Tukananslutning

Skapa en livefråga

Du är nu ansluten till Redshift Serverless. Utför följande steg för att skapa en fråga:

  1. Välj på startsidan Lägg till kakel för att skapa en ny visualisering.

Toucan ny kakel

  1. Välj Live-anslutningar fliken och välj sedan Amazon Redshift-anslutningen som du skapade i föregående steg.

Toucan Live Connection

Toucan-testversionen guidar dig i att bygga din första livefråga, där du kan transformera dina data utan att skriva kod med hjälp av Toucan YouPrep modul.

Till exempel, som visas i följande skärmdump, kan du använda detta no-code-gränssnitt för att beräkna summan av dödliga hajattacker efter aktiviteter, få topp fem och beräkna procentandelen av totalen.

Toucan fråga data

Bygg ditt första diagram

När din data är klar väljer du Kakel och fyll i formuläret som hjälper dig att bygga diagram.

Du kan till exempel konfigurera en topplista med de fem farligaste aktiviteterna och lägga till en höjdpunkt för aktiviteter med fler än 100 attacker.

Välja Spara ändringar för att spara ditt arbete och gå tillbaka till startsidan.

Tukandiagrambyggare

Publicera och dela ditt arbete

Fram till detta skede har du arbetat med att arbeta i Staging läge. För att göra ditt arbete tillgängligt för alla måste du publicera det i Production.

Längst ned till höger på startsidan väljer du ögonikonen för att förhandsgranska ditt arbete genom att sätta dig i dina framtida slutanvändares skor. Du kan sedan välja Publicera att göra ditt arbete tillgängligt för alla.

Toucan publicera

Toucan erbjuder också flera inbäddningsalternativ för att göra dina sjökort lättare att komma åt för slutanvändare, som mobil och surfplatta.

Toucan multi-enheter

Efter dessa steg anslöt du till Redshift Serverless, transformerade data med Toucan no-code-gränssnittet och byggde datavisualiseringar för affärsslutanvändare. Testversionen av Toucan guidar dig i varje steg av denna process för att hjälpa dig komma igång.

Redshift Serverless och Toucan guidad analys ger ett effektivt tillvägagångssätt för att öka användningshastigheten för BI-verktyg genom att minska infrastrukturarbetet för dataingenjörer och genom att förenkla förståelsen av instrumentpanelen för affärsslutanvändare. Det här inlägget täckte bara en liten del av vad Redshift Serverless och Toucan erbjuder, så utforska gärna andra funktioner i Amazon Redshift Serverlös dokumentation och Toucan dokumentation.

Städa upp

Vissa av resurserna som distribueras i det här inlägget genom CloudFormation-mallen medför kostnader så länge de används. Se till att ta bort resurserna och rensa upp ditt arbete när du är klar för att undvika onödiga kostnader.

Välj på CloudFormation-konsolen Radera stack att ta bort alla resurser.

Slutsats

Det här inlägget visade dig hur du ställer in en end-to-end-arkitektur för guidad analys med Redshift Serverless och Toucan.

Denna lösning drar nytta av skalbarheten hos Redshift Serverless, som gör att du kan lagra, transformera och exponera data på ett kostnadseffektivt sätt och utan någon infrastruktur att hantera. Redshift Serverless integreras naturligt med Toucan, ett guidat analysverktyg designat för att användas av alla, på vilken enhet som helst.

Guidad analys fokuserar på att kommunicera berättelser genom datarapporter. Genom att sätta avsiktliga begränsningar för anpassningsalternativ gör Toucan det enkelt för dataägare att bygga meningsfulla instrumentpaneler med ett tydligt och kortfattat budskap för slutanvändare. Det fungerar för både dina interna och externa kunder, på ett obegränsat antal användningsfall.

Prova det nu med vår CloudFormation-mall och en fri Tucan rättegång!


Om författarna


Louis
Louis Hourcade
är en dataforskare i AWS Professional Services-teamet. Han arbetar med AWS-kunder i olika branscher för att påskynda deras affärsresultat med innovativ teknik. På fritiden tycker han om att springa, klättra på stora stenar och surfa på (inte så stora) vågor.


Benjamin
Benjamin Menuet
är en dataarkitekt med AWS Professional Services. Han hjälper kunder att utveckla big data och analyslösningar för att påskynda deras affärsresultat. Utanför jobbet är Benjamin en trailrunner och har klarat några mytomspunna lopp som UTMB.


Xavier
Xavier Naunay
är en dataarkitekt med AWS Professional Services. Han är en del av AWS ProServe-teamet och hjälper företagskunder att lösa komplexa problem med hjälp av AWS-tjänster. På fritiden reser han eller lär sig om teknik och andra kulturer.


Django
Django Bouchez
är lösningsingenjör på Toucan. Han arbetar tillsammans med säljteamet för att tillhandahålla support för teknisk och funktionell validering och bevis, och hjälper också FoU-demonstrationer av nya funktioner med Cloud Partners som AWS. Utanför jobbet är Django en hembryggare och utövar dykning och sportklättring.

plats_img

Senaste intelligens

plats_img