Λογότυπο Zephyrnet

Generative AI και multi-modal agents στο AWS: Το κλειδί για το ξεκλείδωμα νέας αξίας στις χρηματοπιστωτικές αγορές | Υπηρεσίες Ιστού της Amazon

Ημερομηνία:

Τα πολυτροπικά δεδομένα είναι ένα πολύτιμο στοιχείο του χρηματοπιστωτικού κλάδου, που περιλαμβάνει δεδομένα αγοράς, οικονομίας, πελατών, ειδήσεων και μέσων κοινωνικής δικτύωσης, καθώς και δεδομένα κινδύνου. Οι χρηματοπιστωτικοί οργανισμοί δημιουργούν, συλλέγουν και χρησιμοποιούν αυτά τα δεδομένα για να αποκτήσουν γνώσεις σχετικά με τις χρηματοοικονομικές λειτουργίες, να λάβουν καλύτερες αποφάσεις και να βελτιώσουν την απόδοση. Ωστόσο, υπάρχουν προκλήσεις που σχετίζονται με τα πολυτροπικά δεδομένα λόγω της πολυπλοκότητας και της έλλειψης τυποποίησης των χρηματοοικονομικών συστημάτων και των μορφών και της ποιότητας δεδομένων, καθώς και του κατακερματισμένου και μη δομημένου χαρακτήρα των δεδομένων. Οι χρηματοοικονομικοί πελάτες έχουν συχνά περιγράψει το λειτουργικό κόστος της απόκτησης οικονομικών γνώσεων από πολυτροπικά δεδομένα, κάτι που απαιτεί πολύπλοκη λογική εξαγωγής και μετασχηματισμού, που οδηγεί σε διογκωμένη προσπάθεια και κόστος. Οι τεχνικές προκλήσεις με τα πολυτροπικά δεδομένα περιλαμβάνουν περαιτέρω την πολυπλοκότητα της ενσωμάτωσης και μοντελοποίησης διαφορετικών τύπων δεδομένων, τη δυσκολία συνδυασμού δεδομένων από πολλαπλούς τρόπους (κείμενο, εικόνες, ήχος, βίντεο) και την ανάγκη για προηγμένες δεξιότητες επιστήμης υπολογιστών και εξελιγμένα εργαλεία ανάλυσης.

Ένας από τους τρόπους χειρισμού πολυτροπικών δεδομένων που κερδίζουν δημοτικότητα είναι η χρήση πολυτροπικών πρακτόρων. Οι πολυτροπικοί πράκτορες είναι συστήματα τεχνητής νοημοσύνης που μπορούν να κατανοήσουν και να αναλύσουν δεδομένα με πολλαπλούς τρόπους χρησιμοποιώντας τα σωστά εργαλεία στην εργαλειοθήκη τους. Είναι σε θέση να συνδέσουν πληροφορίες για αυτούς τους διαφορετικούς τύπους δεδομένων για να αποκτήσουν μια πιο ολοκληρωμένη κατανόηση και να δημιουργήσουν κατάλληλες απαντήσεις. Οι πολυτροπικοί πράκτορες, σε συνδυασμό με την παραγωγική τεχνητή νοημοσύνη, βρίσκουν μια ευρεία εφαρμογή στις χρηματοπιστωτικές αγορές. Ακολουθούν μερικές δημοφιλείς περιπτώσεις χρήσης:

  • Έξυπνες αναφορές και ευφυΐα αγοράς – Η τεχνητή νοημοσύνη μπορεί να αναλύσει διάφορες πηγές χρηματοοικονομικών πληροφοριών για να δημιουργήσει αναφορές πληροφοριών αγοράς, βοηθώντας τους αναλυτές, τους επενδυτές και τις εταιρείες να ενημερώνονται για τις τάσεις. Οι πολυτροπικοί πράκτορες μπορούν να συνοψίζουν μακροσκελείς οικονομικές εκθέσεις γρήγορα, εξοικονομώντας στους αναλυτές σημαντικό χρόνο και προσπάθεια.
  • Ποσοτική μοντελοποίηση και πρόβλεψη – Τα μοντέλα παραγωγής μπορούν να συνθέσουν μεγάλους όγκους οικονομικών δεδομένων για να εκπαιδεύσουν μοντέλα μηχανικής εκμάθησης (ML) για εφαρμογές όπως η πρόβλεψη τιμών μετοχών, η βελτιστοποίηση χαρτοφυλακίου, η μοντελοποίηση κινδύνου και άλλα. Τα πολυτροπικά μοντέλα που κατανοούν διαφορετικές πηγές δεδομένων μπορούν να παρέχουν πιο ισχυρές προβλέψεις.
  • Συμμόρφωση και εντοπισμός απάτης – Αυτή η λύση μπορεί να επεκταθεί ώστε να περιλαμβάνει εργαλεία παρακολούθησης που αναλύουν κανάλια επικοινωνίας, όπως κλήσεις, μηνύματα ηλεκτρονικού ταχυδρομείου, συνομιλίες, αρχεία καταγραφής πρόσβασης και άλλα, για τον εντοπισμό πιθανών συναλλαγών από εμπιστευτικές πληροφορίες ή χειραγώγησης της αγοράς. Ο εντοπισμός δόλιας συμπαιγνίας μεταξύ τύπων δεδομένων απαιτεί πολυτροπική ανάλυση.

Ένας πολυτροπικός πράκτορας με γενετική τεχνητή νοημοσύνη ενισχύει την παραγωγικότητα ενός οικονομικού αναλυτή αυτοματοποιώντας επαναλαμβανόμενες και συνηθισμένες εργασίες, ελευθερώνοντας χρόνο στους αναλυτές να επικεντρωθούν σε εργασίες υψηλής αξίας. Οι πολυτροπικοί πράκτορες μπορούν να ενισχύσουν την ικανότητα ενός αναλυτή να αποκτήσει γνώσεις βοηθώντας στην έρευνα και την ανάλυση. Οι πολυτροπικοί πράκτορες μπορούν επίσης να δημιουργήσουν βελτιωμένη ποσοτική ανάλυση και οικονομικά μοντέλα, επιτρέποντας στους αναλυτές να εργάζονται ταχύτερα και με μεγαλύτερη ακρίβεια.

Η εφαρμογή ενός multi-modal agent με AWS ενοποιεί βασικές πληροφορίες από διάφορα δομημένα και μη δομημένα δεδομένα σε μεγάλη κλίμακα. Οι πολυτροπικοί πράκτορες μπορούν εύκολα να συνδυάσουν τη δύναμη των γενετικών προσφορών AI από Θεμέλιο του Αμαζονίου και Amazon SageMaker JumpStart με τις δυνατότητες επεξεργασίας δεδομένων από τις υπηρεσίες AWS Analytics και AI/ML για την παροχή ευέλικτων λύσεων που επιτρέπουν στους οικονομικούς αναλυτές να αναλύουν αποτελεσματικά και να συλλέγουν πληροφορίες από πολυτροπικά δεδομένα με ασφαλή και επεκτάσιμο τρόπο εντός του AWS. Η Amazon προσφέρει μια σειρά από υπηρεσίες AI που επιτρέπουν την επεξεργασία φυσικής γλώσσας (NLP), την αναγνώριση ομιλίας, την εξαγωγή κειμένου και την αναζήτηση:

  • Κατανοήστε το Amazon είναι μια υπηρεσία NLP που μπορεί να αναλύσει κείμενο για φράσεις κλειδιά και να αναλύσει το συναίσθημα
  • Textract Amazon είναι μια έξυπνη υπηρεσία επεξεργασίας εγγράφων που μπορεί να εξάγει με ακρίβεια κείμενο και δεδομένα από έγγραφα
  • Μεταγραφή Amazon είναι μια υπηρεσία αυτόματης αναγνώρισης ομιλίας που μπορεί να μετατρέψει την ομιλία σε κείμενο
  • Amazon Kendra είναι μια υπηρεσία εταιρικής αναζήτησης που υποστηρίζεται από την ML για την εύρεση πληροφοριών σε μια ποικιλία πηγών δεδομένων, συμπεριλαμβανομένων εγγράφων και βάσεων γνώσεων

Σε αυτήν την ανάρτηση, παρουσιάζουμε ένα σενάριο όπου ένας οικονομικός αναλυτής αλληλεπιδρά με τα πολυτροπικά δεδομένα του οργανισμού, που βρίσκονται σε ειδικά διαμορφωμένα καταστήματα δεδομένων, για τη συλλογή οικονομικών πληροφοριών. Στην αλληλεπίδραση, δείχνουμε πώς οι πολυτροπικοί πράκτορες σχεδιάζουν και εκτελούν το ερώτημα χρήστη και ανακτούν τα αποτελέσματα από τις σχετικές πηγές δεδομένων. Όλα αυτά επιτυγχάνονται χρησιμοποιώντας υπηρεσίες AWS, αυξάνοντας έτσι την αποτελεσματικότητα του οικονομικού αναλυτή να αναλύει ολιστικά πολυτροπικά οικονομικά δεδομένα (κείμενο, ομιλία και δεδομένα πίνακα).

Το παρακάτω στιγμιότυπο οθόνης δείχνει ένα παράδειγμα της διεπαφής χρήστη.

Επισκόπηση λύσεων

Το παρακάτω διάγραμμα απεικονίζει την εννοιολογική αρχιτεκτονική για τη χρήση παραγωγικής τεχνητής νοημοσύνης με πολυτροπικά δεδομένα χρησιμοποιώντας πράκτορες. Τα βήματα που εμπλέκονται είναι τα εξής:

  1. Ο οικονομικός αναλυτής θέτει ερωτήσεις μέσω μιας πλατφόρμας όπως τα chatbots.
  2. Η πλατφόρμα χρησιμοποιεί ένα πλαίσιο για να προσδιορίσει το καταλληλότερο εργαλείο πολλαπλών μέσων για να απαντήσει στην ερώτηση.
  3. Μόλις αναγνωριστεί, η πλατφόρμα εκτελεί τον κώδικα που είναι συνδεδεμένος με το εργαλείο που είχε προσδιοριστεί προηγουμένως.
  4. Το εργαλείο δημιουργεί μια ανάλυση των οικονομικών δεδομένων όπως ζητήθηκε από τον οικονομικό αναλυτή.
  5. Συνοψίζοντας τα αποτελέσματα, μεγάλα γλωσσικά μοντέλα ανακτούν και αναφέρουν στον οικονομικό αναλυτή.

Τεχνική αρχιτεκτονική

Ο πολυτροπικός πράκτορας ενορχηστρώνει διάφορα εργαλεία βασισμένα σε προτροπές φυσικής γλώσσας από επαγγελματίες χρήστες για τη δημιουργία πληροφοριών. Για μη δομημένα δεδομένα, ο πράκτορας χρησιμοποιεί AWS Lambda λειτουργεί με υπηρεσίες τεχνητής νοημοσύνης όπως το Amazon Textract για ανάλυση εγγράφων, το Amazon Transcribe για την αναγνώριση ομιλίας, το Amazon Comprehend για NLP και το Amazon Kendra για την έξυπνη αναζήτηση. Για δομημένα δεδομένα, ο πράκτορας χρησιμοποιεί το SQL Connector και το SQLAlchemy για να αναλύσει βάσεις δεδομένων, το οποίο περιλαμβάνει Αμαζόν Αθηνά. Ο πράκτορας χρησιμοποιεί επίσης Python στο Lambda και το Amazon Sage Maker SDK για υπολογισμούς και ποσοτική μοντελοποίηση. Ο πράκτορας διαθέτει επίσης μακροπρόθεσμη μνήμη για την αποθήκευση προτροπών και αποτελεσμάτων Amazon DynamoDB. Ο πολυτροπικός πράκτορας βρίσκεται σε ένα σημειωματάριο SageMaker και συντονίζει αυτά τα εργαλεία με βάση τα αγγλικά προτροπές από επαγγελματίες χρήστες σε μια διεπαφή χρήστη Streamlit.

Τα βασικά στοιχεία της τεχνικής αρχιτεκτονικής είναι τα ακόλουθα:

  • Αποθήκευση και ανάλυση δεδομένων – Οι τριμηνιαίες εγγραφές οικονομικών κερδών ως αρχεία ήχου, οι ετήσιες οικονομικές εκθέσεις ως αρχεία PDF και τα δεδομένα μετοχών της S&P ως αρχεία CSV φιλοξενούνται στο Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3). Η εξερεύνηση δεδομένων σε δεδομένα αποθεμάτων γίνεται με χρήση του Athena.
  • Μεγάλα γλωσσικά μοντέλα – Τα μοντέλα μεγάλων γλωσσών (LLM) είναι διαθέσιμα μέσω του Amazon Bedrock, του SageMaker JumpStart ή ενός API.
  • Πράκτορες – Χρησιμοποιούμε τους πράκτορες της LangChain για μια μη προκαθορισμένη αλυσίδα κλήσεων ως είσοδο χρήστη σε LLM και άλλα εργαλεία. Σε αυτούς τους τύπους αλυσίδων, υπάρχει ένας πράκτορας που έχει πρόσβαση σε μια σειρά εργαλείων. Κάθε εργαλείο έχει κατασκευαστεί για μια συγκεκριμένη εργασία. Ανάλογα με την είσοδο του χρήστη, ο πράκτορας αποφασίζει το εργαλείο ή έναν συνδυασμό εργαλείων που θα καλέσει για να απαντήσει στην ερώτηση. Δημιουργήσαμε τα ακόλουθα ειδικά σχεδιασμένα εργαλεία αντιπροσώπων για το σενάριό μας:
    • Εργαλείο αναζήτησης μετοχών – Για αναζήτηση δεδομένων μετοχών S&P χρησιμοποιώντας το Athena και το SQLAlchemy.
    • Εργαλείο βελτιστοποίησης χαρτοφυλακίου – Δημιουργία χαρτοφυλακίου με βάση τις επιλεγμένες μετοχές.
    • Εργαλείο αναζήτησης οικονομικών πληροφοριών – Για αναζήτηση πληροφοριών οικονομικών κερδών που είναι αποθηκευμένες σε πολυσέλιδα αρχεία PDF χρησιμοποιώντας το Amazon Kendra.
    • Εργαλείο υπολογισμού Python – Για χρήση για μαθηματικούς υπολογισμούς.
    • Εργαλείο ανάλυσης συναισθήματος – Για να εντοπίσετε και να βαθμολογήσετε τα συναισθήματα για ένα θέμα χρησιμοποιώντας το Amazon Comprehend.
    • Εργαλείο ανίχνευσης φράσεων – Για να βρείτε φράσεις κλειδιά σε πρόσφατες τριμηνιαίες αναφορές χρησιμοποιώντας το Amazon Comprehend.
    • Εργαλείο εξαγωγής κειμένου – Για να μετατρέψετε τις εκδόσεις PDF των τριμηνιαίων αναφορών σε αρχεία κειμένου χρησιμοποιώντας το Amazon Textract.
    • Εργαλείο μεταγραφής ήχου – Για να μετατρέψετε ηχογραφήσεις σε αρχεία κειμένου χρησιμοποιώντας το Amazon Transcribe.

Η μνήμη agent που διατηρεί την αλυσίδα των αλληλεπιδράσεων του χρήστη με τον πράκτορα αποθηκεύεται στο DynamoDB.

Οι ακόλουθες ενότητες εξηγούν μερικά από τα κύρια βήματα με τον σχετικό κώδικα. Για να βουτήξετε βαθύτερα στη λύση και στον κώδικα για όλα τα βήματα που εμφανίζονται εδώ, ανατρέξτε στο GitHub repo.

Προϋποθέσεις

Για να εκτελέσετε αυτήν τη λύση, πρέπει να έχετε ένα κλειδί API σε ένα LLM όπως το Anthropic Claude v2 ή να έχετε πρόσβαση σε μοντέλα θεμελίωσης Amazon Bedrock.

Για να δημιουργήσετε αποκρίσεις από δομημένα και μη δομημένα δεδομένα χρησιμοποιώντας LLM και LangChain, χρειάζεστε πρόσβαση σε LLM μέσω κλειδιών Amazon Bedrock, SageMaker JumpStart ή API και να χρησιμοποιήσετε βάσεις δεδομένων που είναι συμβατές με το SQLAlchemy. Διαχείριση ταυτότητας και πρόσβασης AWS Απαιτούνται επίσης πολιτικές (IAM), τις οποίες μπορείτε να βρείτε στο αποθετήριο GitHub.

Βασικά στοιχεία ενός πολυτροπικού παράγοντα

Υπάρχουν μερικά βασικά συστατικά στοιχεία του πολυτροπικού πράκτορα:

  • Λειτουργίες που ορίζονται για εργαλεία του πολυτροπικού πράκτορα
  • Εργαλεία που ορίζονται για τον πολυτροπικό παράγοντα
  • Μακροπρόθεσμη μνήμη για τον πολυτροπικό παράγοντα
  • Πολυτροπικός πράκτορας που βασίζεται σε προγραμματιστή-εκτελεστή (που ορίζεται με εργαλεία, LLM και μνήμη)

Σε αυτήν την ενότητα, παρουσιάζουμε τα βασικά στοιχεία με τα σχετικά αποσπάσματα κώδικα.

Λειτουργίες που ορίζονται για εργαλεία του πολυτροπικού πράκτορα

Ο πολυτροπικός πράκτορας πρέπει να χρησιμοποιεί διάφορες υπηρεσίες AI για την επεξεργασία διαφορετικών τύπων δεδομένων—κείμενο, ομιλία, εικόνες και άλλα. Ορισμένες από αυτές τις λειτουργίες μπορεί να χρειαστεί να καλέσουν υπηρεσίες AWS AI όπως το Amazon Comprehend για την ανάλυση κειμένου, το Amazon Textract για την ανάλυση εικόνων και εγγράφων και το Amazon Transcribe για τη μετατροπή ομιλίας σε κείμενο. Αυτές οι συναρτήσεις μπορούν είτε να κληθούν τοπικά μέσα στον πράκτορα είτε να αναπτυχθούν ως συναρτήσεις Λάμδα που μπορεί να καλέσει ο πράκτορας. Οι λειτουργίες Lambda καλούν εσωτερικά τις σχετικές υπηρεσίες AWS AI και επιστρέφουν τα αποτελέσματα στον πράκτορα. Αυτή η προσέγγιση διαμορφώνει τη λογική και κάνει τον πράκτορα πιο διατηρήσιμο και επεκτάσιμο.

Η ακόλουθη συνάρτηση καθορίζει τον τρόπο υπολογισμού του βελτιστοποιημένου χαρτοφυλακίου με βάση τις επιλεγμένες μετοχές. Ένας τρόπος για να μετατρέψετε μια συνάρτηση που βασίζεται σε Python σε εργαλείο LLM είναι να χρησιμοποιήσετε το BaseTool περικάλυμμα.

class OptimizePortfolio(BaseTool): name = "Portfolio Optimization Tool"
description = """
use this tool when you need to build optimal portfolio or for optimization of stock price.
The stock_ls should be a list of stock symbols, such as ['WWW', 'AAA', 'GGGG']. """ def _run(self, stock_ls: List): session = boto3.Session(region_name=region_name)
athena_client = session.client('athena') database=database_name
table=table_Name
...

Ο παρακάτω είναι ο κώδικας για το Lambda που καλεί τα API της υπηρεσίας AWS AI (Amazon Comprehend, Amazon Textract, Amazon Transcribe):

def SentimentAnalysis(inputString):
print(inputString)
lambda_client = boto3.client('lambda')
lambda_payload = {"inputString:"+inputString}
response=lambda_client.invoke(FunctionName='FSI-SentimentDetecttion',
InvocationType='RequestResponse',
Payload=json.dumps(inputString))
print(response['Payload'].read())
return response

Εργαλεία που ορίζονται για τον πολυτροπικό παράγοντα

Το multi-modal agent έχει πρόσβαση σε διάφορα εργαλεία για να ενεργοποιήσει τη λειτουργικότητά του. Μπορεί να ρωτήσει μια βάση δεδομένων αποθεμάτων για να απαντήσει σε ερωτήσεις σχετικά με τις μετοχές. Μπορεί να βελτιστοποιήσει ένα χαρτοφυλάκιο χρησιμοποιώντας ένα ειδικό εργαλείο. Μπορεί να ανακτήσει πληροφορίες από το Amazon Kendra, την υπηρεσία αναζήτησης επιχειρήσεων της Amazon. Ένα εργαλείο Python REPL επιτρέπει στον πράκτορα να εκτελεί κώδικα Python. Ένα παράδειγμα της δομής των εργαλείων, συμπεριλαμβανομένων των ονομάτων και των περιγραφών τους, εμφανίζεται στον παρακάτω κώδικα. Το πραγματικό πλαίσιο εργαλείων αυτής της ανάρτησης έχει οκτώ εργαλεία: Εργαλείο ερωτημάτων μετοχών, Εργαλείο βελτιστοποίησης χαρτοφυλακίου, Εργαλείο αναζήτησης οικονομικών πληροφοριών, Εργαλείο υπολογισμού Python, Εργαλείο ανάλυσης συναισθήματος, Εργαλείο ανίχνευσης φράσεων, Εργαλείο εξαγωγής κειμένου και Εργαλείο μεταγραφής ήχου.

tools = [
Tool(
name="Financial Information Lookup Tool",
func=run_chain,
description="""
Useful for when you need to look up financial information using Kendra. """
),
Tool(
name="Sentiment Analysis Tool",
func=SentimentAnalysis,
description="""
Useful for when you need to analyze the sentiment of a topic. """
),
Tool(
name="Detect Phrases Tool",
func=DetectKeyPhrases,
description="""
Useful for when you need to detect key phrases in recent quaterly reports. """
),
...
]

Μακροπρόθεσμη μνήμη για τον πολυτροπικό παράγοντα

Ο παρακάτω κώδικας απεικονίζει τη διαμόρφωση της μακροπρόθεσμης μνήμης για τον πολυτροπικό παράγοντα. Σε αυτόν τον κώδικα, ο πίνακας DynamoDB προστίθεται ως μνήμη για την αποθήκευση προτροπών και απαντήσεων για μελλοντική αναφορά.

chat_history_table = dynamodb_table_name chat_history_memory = DynamoDBChatMessageHistory(table_name=chat_history_table, session_id=chat_session_id)
memory = ConversationBufferMemory(memory_key="chat_history",
chat_memory=chat_history_memory, return_messages=True)

Πολυτροπικός πράκτορας που βασίζεται σε σχεδιαστή-εκτελεστή

Η σχεδιαστής-εκτελεστής Η βασισμένη πολυτροπική αρχιτεκτονική πρακτόρων έχει δύο βασικά στοιχεία: έναν σχεδιαστή και έναν εκτελεστή. Ο υπεύθυνος σχεδιασμού δημιουργεί ένα σχέδιο υψηλού επιπέδου με βήματα που απαιτούνται για την εκτέλεση και την απάντηση στην άμεση ερώτηση. Στη συνέχεια, ο εκτελεστής εκτελεί αυτό το σχέδιο δημιουργώντας κατάλληλες αποκρίσεις συστήματος για κάθε βήμα σχεδίου χρησιμοποιώντας το μοντέλο γλώσσας με τα απαραίτητα εργαλεία. Δείτε τον παρακάτω κώδικα:

llm = ChatAnthropic(temperature=0, anthropic_api_key=ANTHROPIC_API_KEY, max_tokens_to_sample = 512)
model = llm planner = load_chat_planner(model) system_message_prompt = SystemMessagePromptTemplate.from_template(combo_template)
human_message_prompt = planner.llm_chain.prompt.messages[1]
planner.llm_chain.prompt = ChatPromptTemplate.from_messages([system_message_prompt, human_message_prompt]) executor = load_agent_executor(model, tools, verbose=True)
agent = PlanAndExecute(planner=planner, executor=executor, verbose=True, max_iterations=2)

Παραδείγματα σεναρίων βασισμένα σε ερωτήσεις οικονομικών αναλυτών

Σε αυτήν την ενότητα, διερευνούμε δύο παραδείγματα σεναρίων για να δείξουμε τα βήματα από άκρο σε άκρο που εκτελούνται από τον πολυτροπικό πράκτορα με βάση ερωτήσεις που θέτει ο οικονομικός αναλυτής.

Σενάριο 1: Ερωτήσεις χρηματοοικονομικού αναλυτή σχετικά με δομημένα δεδομένα

Σε αυτό το σενάριο, ο χρηματοοικονομικός αναλυτής θέτει μια ερώτηση στα αγγλικά σχετικά με τις μετοχές των εταιρειών στον multi-modal agent. Ο πολυτροπικός πράκτορας LangChain έρχεται με ένα σχέδιο πολλαπλών βημάτων και αποφασίζει ποια εργαλεία θα χρησιμοποιήσει για κάθε βήμα. Το παρακάτω διάγραμμα απεικονίζει ένα παράδειγμα ροής εργασίας με τα ακόλουθα βήματα:

  1. Ο οικονομικός αναλυτής κάνει μια οικονομική ερώτηση στα αγγλικά μέσω του UI στον πολυτροπικό πράκτορα.
  2. Ο πράκτορας προσδιορίζει ότι απαιτεί το εργαλείο βάσης δεδομένων για να απαντήσει στην ερώτηση. Δημιουργεί ένα ερώτημα SQL χρησιμοποιώντας ένα LLM που βασίζεται στην ερώτηση και υποβάλλει ερωτήματα στη βάση δεδομένων Athena.
  3. Η Athena εκτελεί το ερώτημα SQL, ανακτά το σχετικό αποτέλεσμα (χρονικές σειρές τιμών μετοχών των πέντε εταιρειών) και διαβιβάζει το αποτέλεσμα με σχετικά δεδομένα στον πράκτορα.
  4. Ο πράκτορας προσδιορίζει ότι χρειάζεται ένα δεύτερο εργαλείο για να απαντήσει στην ερώτηση. Διαβιβάζει τα ανακτημένα δεδομένα στο εργαλείο Python για βελτιστοποίηση χαρτοφυλακίου.
  5. Το εργαλείο Python υπολογίζει το απαιτούμενο βέλτιστο χαρτοφυλάκιο, συμπεριλαμβανομένων των βαρών, και μεταβιβάζει την απάντηση στο LLM εντός του πράκτορα.
  6. Ο πράκτορας συγκεντρώνει τις απαιτούμενες πληροφορίες και τους υπολογισμούς χρησιμοποιώντας το LLM και απαντά στον οικονομικό αναλυτή μέσω του UI στα αγγλικά.

Ο οικονομικός αναλυτής θέτει το εξής ερώτημα:

"Ποιες είναι οι τιμές κλεισίματος των μετοχών AAAA, WWW, DDD το έτος 2018; Μπορείτε να δημιουργήσετε ένα βελτιστοποιημένο χαρτοφυλάκιο χρησιμοποιώντας αυτές τις τρεις μετοχές;"

Ο ακόλουθος κώδικας δείχνει τα βήματα που εντόπισε ο σχεδιαστής του multi-modal agent:

steps=[Step(value='Use Stocks Querying Tool to find closing stock prices of AAAA, WWW and DDD in year 2018.'),
Step(value='Use Portfolio Optimization Tool to build an optimized portfolio using the three stocks.'),
Step(value='Provide the closing stock prices and optimized portfolio allocation.')]

Ο πράκτορας μετέφρασε την ερώτηση ερώτησης στο ακόλουθο ερώτημα SQL:

SELECT date, aaaa, www, ddd
FROM "blog-stock-prices-db"."stock_prices"
WHERE date BETWEEN '2018-01-01' AND '2018-12-31'
ORDER BY date DESC

Ο παρακάτω κώδικας δείχνει την τελική απάντηση από τον πολυτροπικό πράκτορα με βάση την ερώτηση:

The closing stock prices for AAAA, WWW and DDD in 2018 are: AAAA: $172.44
WWW: $85.91
DDD: $9.82 The optimized portfolio allocation for stocks AAAA, WWW and DDD is: AAAA: 55%
WWW: 45%
DDD: 0%'

Σενάριο 2: Ερωτήσεις χρηματοοικονομικού αναλυτή σχετικά με μη δομημένα δεδομένα

Σε αυτό το σενάριο, ένας οικονομικός αναλυτής θέτει πολλαπλές ερωτήσεις σχετικά με την οικονομική υγεία της εταιρείας στον πολυτροπικό πράκτορα. Ο πράκτορας επικαλείται δύο πράκτορες εργαλείων, τον Amazon Kendra με μη δομημένα δεδομένα και ένα υπολογιστικό εργαλείο Python, για να συγκεντρώσει πληροφορίες και να εκτελέσει τους απαραίτητους υπολογισμούς. Στη συνέχεια, ο πράκτορας συγκεντρώνει τις πληροφορίες από τα εργαλεία χρησιμοποιώντας το γλωσσικό του μοντέλο και παρέχει την πλήρη απάντηση στον αναλυτή. Το κλειδί αυτού του σεναρίου είναι ότι ο πράκτορας μπορεί να θυμάται τις ερωτήσεις και τις απαντήσεις των προηγούμενων ερωτήσεων και να ενσωματώνει το πλαίσιο στη συνομιλία. Το παρακάτω διάγραμμα απεικονίζει τη ροή εργασίας, η οποία αποτελείται από τα ακόλουθα βήματα:

  1. Ο οικονομικός αναλυτής κάνει μια οικονομική ερώτηση στα αγγλικά μέσω του UI στον πολυτροπικό πράκτορα.
  2. Ο πράκτορας προσδιορίζει ότι απαιτεί το εργαλείο Amazon Kendra για να απαντήσει στην ερώτηση και επικαλείται το εργαλείο πράκτορα Amazon Kendra.
  3. Το Amazon Kendra αναζητά το μη δομημένο σώμα δεδομένων στο Amazon S3 και ανακτά το σχετικό έγγραφο που περιέχει την απάντηση.
  4. Χρησιμοποιώντας το Retrieval Augmented Generation (RAG), το Amazon Kendra μεταβιβάζει την απάντηση από το σχετικό έγγραφο στο LLM εντός του πράκτορα.
  5. Ο πράκτορας προσδιορίζει ότι χρειάζεται ένα δεύτερο εργαλείο για να απαντήσει στο δεύτερο μέρος της ερώτησης. Διαβιβάζει πληροφορίες από το πρώτο εργαλείο στο υπολογιστικό εργαλείο Python.
  6. Το εργαλείο Python υπολογίζει την απαιτούμενη αναλογία και μεταβιβάζει την απάντηση στο LLM εντός του πράκτορα.
  7. Ο πράκτορας συγκεντρώνει τις απαιτούμενες πληροφορίες και τους υπολογισμούς χρησιμοποιώντας το LLM και απαντά στον οικονομικό αναλυτή μέσω του UI.

Ακολουθούν ερωτήσεις και απαντήσεις μεταξύ του αναλυτή και του multi-modal agent.

Ο πράκτορας απαντά στην ερώτηση "Ποια είναι η καθαρή ζημία της Amazon για το οικονομικό έτος που έληξε τον Δεκέμβριο του 2022;με το «Amazon να ανέφερε συνολικές καθαρές πωλήσεις 514.0 δισεκατομμυρίων δολαρίων και καθαρή ζημία 2.7 δισεκατομμυρίων δολαρίων για το οικονομικό έτος 2022». Η πηγή είναι η αναφορά Amazon 10K για το οικονομικό έτος που έληξε τον Δεκέμβριο του 2022, που ανακτήθηκε με τη χρήση του Retrive_Kendra Εργαλείο.

Για την ερώτηση "Ποια είναι η καθαρή απώλεια για το ίδιο έτος;Ο πράκτορας απαντά «2.7 δισεκατομμύρια δολάρια». Η πηγή είναι η αναφορά Amazon 10K για το οικονομικό έτος που έληξε τον Δεκέμβριο του 2022, που ανακτήθηκε με τη χρήση του Retrive_Kendra Εργαλείο. Σημειώστε ότι παρόλο που η ερώτηση είναι παρόμοια με τη δεύτερη ερώτηση, αυτή η ερώτηση δεν καθόριζε το όνομα της εταιρείας ή τον αριθμό έτους. Ωστόσο, ο πράκτορας μπόρεσε να χρησιμοποιήσει το σωστό όνομα εταιρείας και το σωστό έτος βάσει του περιβάλλοντος στη μνήμη συνομιλίας.

Για την ερώτηση "Ποιος είναι ο τύπος για τον δείκτη καθαρού περιθωρίου κέρδους που είναι ένας τύπος δείκτη κερδοφορίας;Ο πράκτορας απαντά: «Η Amazon ανέφερε συνολικές καθαρές πωλήσεις 514.0 δισεκατομμυρίων δολαρίων και καθαρή ζημία 2.7 δισεκατομμυρίων δολαρίων για το οικονομικό έτος 2022. Ο δείκτης καθαρού περιθωρίου κέρδους για την Amazon για το οικονομικό έτος 2022 είναι -0.5%. Η πηγή είναι Retrieve_Kendra και PythonREPLTool().

Βουτήξτε βαθύτερα στη λύση

Για να βουτήξετε βαθύτερα στη λύση και στον κώδικα που εμφανίζεται σε αυτήν την ανάρτηση, ρίξτε μια ματιά στο GitHub repo.

Στο αποθετήριο GitHub, θα μπορείτε να βρείτε ένα σημειωματάριο Python που έχει τη λύση από άκρο σε άκρο, AWS CloudFormation πρότυπο για την παροχή της υποδομής, μη δομημένα δεδομένα (αρχεία PDF αναφορές κερδών, αρχεία ήχου κλήσης κερδών) και δομημένα δεδομένα (χρονικές σειρές μετοχών).

Στο παράρτημα στο τέλος, διάφορες ερωτήσεις που έγιναν από τον χρηματοοικονομικό αναλυτή, επικαλέστηκαν τα εργαλεία πρακτόρων και η απάντηση από τον πολυτροπικό πράκτορα.

εκκαθάριση

Αφού εκτελέσετε το multi-modal agent, φροντίστε να καθαρίσετε τυχόν πόρους που δεν θα χρησιμοποιηθούν. Τερματίστε και διαγράψτε τις βάσεις δεδομένων που χρησιμοποιούνται (Αθηνά). Επιπλέον, διαγράψτε τα δεδομένα στο Amazon S3 και σταματήστε τυχόν παρουσίες φορητών υπολογιστών SageMaker Studio για να μην επιβαρυνθείτε με περαιτέρω χρεώσεις. Διαγράψτε τις συναρτήσεις Lambda και τους πίνακες DynamoDB ως μέρος της μακροπρόθεσμης μνήμης που δεν χρησιμοποιούνται. Εάν χρησιμοποιήσατε το SageMaker JumpStart για να αναπτύξετε ένα LLM ως τελικό σημείο του SageMaker σε πραγματικό χρόνο, διαγράψτε το τελικό σημείο είτε μέσω της κονσόλας SageMaker είτε μέσω του SageMaker Studio.

Συμπέρασμα

Αυτή η ανάρτηση παρουσίασε το ευρύ φάσμα υπηρεσιών αποθήκευσης AWS, AI/ML και υπολογιστικών υπηρεσιών που μπορείτε να χρησιμοποιήσετε για να δημιουργήσετε μια προηγμένη πολυτροπική λύση τεχνητής νοημοσύνης μαζί με το πλαίσιο LangChain και το γενετικό AI. Με την ενσωμάτωση των τεχνολογιών NLP, αναγνώρισης ομιλίας και ML, ο πολυτροπικός παράγοντας που αναπτύχθηκε σε αυτό το σενάριο είναι σε θέση να αναλύει ποικίλους τρόπους χρηματοοικονομικών δεδομένων (δομημένα και μη) και να ανταποκρίνεται σε προτροπές στη φυσική γλώσσα (Αγγλικά). Αυτό ενισχύει την παραγωγικότητα και την αποτελεσματικότητα των οικονομικών αναλυτών, επιτρέποντάς τους να επικεντρωθούν σε υψηλής αξίας, στρατηγική εργασία. Οι πολυτροπικές λύσεις τεχνητής νοημοσύνης που υποστηρίζονται από το AWS έχουν τη δυνατότητα να μεταμορφώσουν τις χρηματοπιστωτικές αγορές αυτοματοποιώντας επαναλαμβανόμενες εργασίες, ενισχύοντας τις ανθρώπινες ικανότητες και δημιουργώντας αποτελεσματικά πληροφορίες βάσει δεδομένων. Για δομημένα δεδομένα, μια μοντέρνα αρχιτεκτονική δεδομένων με πολλαπλές βάσεις δεδομένων μπορεί να ενσωματωθεί με το γενετικό AI και το LLM. Για περισσότερες λεπτομέρειες, ανατρέξτε στο Επανεφεύρεση της εμπειρίας δεδομένων: Χρησιμοποιήστε τεχνητή νοημοσύνη και μοντέρνα αρχιτεκτονική δεδομένων για να ξεκλειδώσετε τις πληροφορίες. Επίσης, ανατρέξτε στο Θεμέλιο του Αμαζονίου για περιπτώσεις χρήσης σε γενετική τεχνητή νοημοσύνη, βασικά μοντέλα και μεγάλα γλωσσικά μοντέλα.

Παράρτημα

Ο παρακάτω πίνακας περιέχει παραδείγματα ερωτήσεων από έναν οικονομικό αναλυτή για να ρωτήσει τον πολυτροπικό πράκτορα με βάση δομημένα και μη δομημένα δεδομένα.

Ερώτηση Σκοπός Ερώτηση που έγινε από οικονομικούς αναλυτές μέσω UI Επίκληση εργαλείων αντιπροσώπου Κύριες υπηρεσίες AWS που χρησιμοποιούνται από τα εργαλεία Agent Απάντηση από multi-modal agent
Ζητήστε από τον πράκτορα LangChain να προεπεξεργαστεί και να εξαγάγει πληροφορίες από τα δεδομένα που συλλέγονται Convert the Amazon`s recent quarters 10k and 10q files to text format 1. Εργαλείο εξαγωγής κειμένου
  1. Textract Amazon
  2. AWS Lambda
  3. Amazon S3
The text files containing Amazon's financial filings have been cleaned and are ready for analysis.
Ζητήστε από τον πράκτορα LangChain να μεταγράψει τις ηχογραφήσεις σε κείμενα Can you transcribe most recent quaterly audio recording of earnings call to text format?
  1. Εργαλείο μεταγραφής ήχου
  1. Μεταγραφή Amazon
  2. AWS Lambda
  3. Amazon S3
I have the earnings call transcripts, now I can extract key phrases.
Ζητήστε από τον πράκτορα της LangChain να αναλύσει την οικονομική υγεία και την απόδοση της εταιρείας Analyze Amazon's financial health based on the 10k report. Calculate important financial ratios. Please limit your answer to 5 sentences.
  1. Εργαλείο αναζήτησης οικονομικών πληροφοριών
  2. Εργαλείο υπολογισμού Python
  1. Amazon Kendra
  2. AWS Lambda
  3. Amazon S3
Here is a summary of Amazon’s financial health in 5 sentences:  Amazon has a low profit margin indicating low profitability relative to revenue. However, Amazon has a high return on assets indicating efficient use of assets to generate profits. Amazon has a low debt-to-equity ratio indicating low financial leverage and risk. Amazon has a high current ratio indicating good short-term liquidity position and ability to pay off short-term obligations. Overall, Amazon seems to be in a good financial position with efficient operations and low risk.
Ζητήστε από τον πράκτορα LangChain να αναλύσει την οικονομική απόδοση της εταιρείας από τις αναφορές κερδών της εταιρείας What were the main drivers of the company’s revenue growth in the quarter?  Please limit your answers to 5 sentences.
  1. Εργαλείο ανίχνευσης φράσεων
  2. Εργαλείο αναζήτησης οικονομικών πληροφοριών
  1. Κατανοήστε το Amazon
  2. Amazon Kendra
  3. AWS Lambda
  4. Amazon S3
Here is a summary of the main drivers of revenue growth in 5 sentences: Amazon's revenue grew due to an increase in subscription and support revenue from new customers. Existing customer accounts also expanded, contributing to revenue growth. Higher net sales drove increased revenue for the company. Although I could not calculate the exact revenue growth percentage, the key phrases and information extracted point to revenue growth being driven primarily by new subscriptions, existing customer expansion, and greater net sales.
Ζητήστε από τον πράκτορα της LangChain να αναλύσει τη διοικητική ομάδα της εταιρείας και τα σχέδιά της για το μέλλον από τις αναφορές κερδών της εταιρείας What are the company's top priorities for the coming year? What are the biggest risks facing the company? Please limit your answers to 5 sentences.
  1. Εργαλείο ανάλυσης συναισθήματος
  2. Εργαλείο ανίχνευσης φράσεων
  3. Εργαλείο αναζήτησης οικονομικών πληροφοριών
  1. Κατανοήστε το Amazon
  2. Amazon Kendra
  3. AWS Lambda
  4. Amazon S3
Here is a summary response in 5 sentences: Amazon's priorities are investing in growth and expanding into new markets. However, risks like changes in consumer demand and competition threaten their business. By analyzing key phrases in financial reports, their focus on fulfillment, technology, and new products emerges, as do risks around suppliers, exchange rates, and retail competition. Though facing pressures, Amazon aims to innovate, improve customer experience, and strengthen their position. Continuous progress on price, speed, and selection will drive their competitive advantage.
Ζητήστε από τον πράκτορα LangChain να αναλύσει τη στρατηγική της εταιρείας από τις αναφορές κερδών της εταιρείας What are company’s financial and business goals for upcoming financial year/quarter? Please limit your answers to 5 sentences.
  1. Εργαλείο αναζήτησης οικονομικών πληροφοριών
  2. Εργαλείο ανίχνευσης φράσεων
  1. Κατανοήστε το Amazon
  2. Amazon Kendra
  3. AWS Lambda
  4. Amazon S3
Here is a summary of Amazon's main goals in 5 sentences: Amazon seeks to grow by improving infrastructure and entering new markets.  They will invest in fulfillment and technology to enable expansion.  By moving into groceries, healthcare, and entertainment, Amazon can diversify their offerings.  Focusing on the customer through competitive pricing, selection, and innovation is key.  If Amazon achieves operational excellence and continuous progress, they will strengthen their position.
Ζητήστε από τον πράκτορα LangChain να πραγματοποιήσει ανάλυση συναισθήματος στις εγγραφές κλήσεων κερδών What is the sentiment around inflation in Amazon's earnings call?
  1. Εργαλείο ανάλυσης συναισθήματος
  1. Κατανοήστε το Amazon
  2. AWS Lambda
  3. Amazon S3
The sentiment of mentions of 'inflation' in the Amazon earnings call transcript is negative. Justification: Quote 1: "We're seeing inflationary pressures, especially in fuel and transportation costs." Quote 2: "Inflation is a concern and we're seeing cost inflation, which is an unusual thing for us.
Ζητήστε από τον πράκτορα LangChain να δημιουργήσει ένα βέλτιστο χαρτοφυλάκιο χρησιμοποιώντας τα δεδομένα που συλλέγονται What are the closing prices of stocks AAAA, WWW, DDD in year 2018? Can you build an optimized portfolio using these three stocks?
  1. Εργαλείο βελτιστοποίησης χαρτοφυλακίου
  2. Εργαλείο αναζήτησης μετοχών
  1. Amazon Sage Maker
  2. Αμαζόν Αθηνά
The closing stock prices for AAAA, WWW and DDD in 2018 are:
AAAA: $172.44
WWW: $85.91
DDD: $9.82The optimized portfolio allocation for stocks AAAA, WWW and DDD is:
AAAA: 55%
WWW: 45%
DDD: 0%'

Σχετικά με τους Συγγραφείς

Sovik Kumar Nath είναι ένας αρχιτέκτονας λύσεων AI/ML με AWS. Έχει εκτενή εμπειρία στο σχεδιασμό ολοκληρωμένων λύσεων μηχανικής μάθησης και ανάλυσης επιχειρήσεων στα οικονομικά, τις λειτουργίες, το μάρκετινγκ, την υγειονομική περίθαλψη, τη διαχείριση της εφοδιαστικής αλυσίδας και το IoT. Ο Sovik έχει δημοσιεύσει άρθρα και κατέχει δίπλωμα ευρεσιτεχνίας στην παρακολούθηση μοντέλων ML. Έχει διπλά μεταπτυχιακά από το Πανεπιστήμιο της Νότιας Φλόριντα, το Πανεπιστήμιο του Fribourg, στην Ελβετία, και πτυχίο από το Ινδικό Ινστιτούτο Τεχνολογίας, Kharagpur. Εκτός δουλειάς, ο Sovik του αρέσει να ταξιδεύει, να κάνει βόλτες με φέρι και να βλέπει ταινίες.

Μοχάν Μούστι είναι Senior Technical Account Manger με έδρα το Ντάλας. Η Mohan βοηθά τους πελάτες να αρχιτεκτονήσουν και να βελτιστοποιήσουν εφαρμογές στο AWS. Ο Mohan έχει Επιστήμη και Μηχανική Υπολογιστών από το Πανεπιστήμιο JNT της Ινδίας. Στον ελεύθερο χρόνο του, του αρέσει να περνά χρόνο με την οικογένειά του και να κατασκηνώνει.

Τζια (Βιβιαν) Λι είναι Senior Solutions Architect στο AWS, με εξειδίκευση στο AI/ML. Αυτή τη στιγμή υποστηρίζει πελάτες στον χρηματοοικονομικό κλάδο. Πριν από την ένταξή της στην AWS το 2022, είχε 7 χρόνια εμπειρίας στην υποστήριξη εταιρικών πελατών που χρησιμοποιούν το AI/ML στο cloud για την επίτευξη επιχειρηματικών αποτελεσμάτων. Η Vivian έχει πτυχίο από το Πανεπιστήμιο του Πεκίνου και διδακτορικό από το Πανεπιστήμιο της Νότιας Καλιφόρνια. Στον ελεύθερο χρόνο της, απολαμβάνει όλες τις θαλάσσιες δραστηριότητες και πεζοπορία στα όμορφα βουνά της πολιτείας της, το Κολοράντο.

Uchenna Egbe είναι ένας αρχιτέκτονας λύσεων AIML που του αρέσει να δημιουργεί επαναχρησιμοποιούμενες λύσεις AIML. Ο Uchenna έχει πτυχίο MS από το Πανεπιστήμιο της Αλάσκας Fairbanks. Περνά τον ελεύθερο χρόνο του ερευνώντας για βότανα, τσάγια, υπερτροφές και πώς να τα εντάξει στην καθημερινή του διατροφή.

Navneet Tuteja είναι Ειδικός Δεδομένων στο Amazon Web Services. Πριν ενταχθεί στο AWS, το Navneet εργάστηκε ως διευκολυντής για οργανισμούς που επιδιώκουν να εκσυγχρονίσουν τις αρχιτεκτονικές δεδομένων τους και να εφαρμόσουν ολοκληρωμένες λύσεις AI/ML. Είναι κάτοχος πτυχίου μηχανικού από το Πανεπιστήμιο Thapar, καθώς και μεταπτυχιακού τίτλου στη στατιστική από το Texas A&M University.

Praful Kava είναι Sr. Specialist Solutions Architect στο AWS. Καθοδηγεί τους πελάτες να σχεδιάσουν και να σχεδιάσουν αγωγούς Analytics κλίμακας Cloud στο AWS. Εκτός δουλειάς, του αρέσει να ταξιδεύει με την οικογένειά του και να εξερευνά νέα μονοπάτια πεζοπορίας.

spot_img

Τελευταία Νοημοσύνη

spot_img