Λογότυπο Zephyrnet

Συνέντευξη CEO: Axel Kloth της Abacus

Ημερομηνία:

Axel Kloth Abacus Semi

Εκπαιδευμένος φυσικός, ο Axel έχει συνηθίσει την ανάγκη για υπολογιστές μεγάλης κλίμακας. Ανακάλυψε πριν από περισσότερα από 30 χρόνια ότι η επεκτασιμότητα της απόδοσης του επεξεργαστή ήταν πρωταρχικής σημασίας για την επίλυση οποιουδήποτε υπολογιστικού προβλήματος. Αυτό απαιτούσε ένα νέο παράδειγμα στην αρχιτεκτονική των υπολογιστών. Στο Parimics, SSRLabs και Axiado μπόρεσε να δείξει ότι χρειαζόταν νέα σκέψη και πώς θα μπορούσαν να φαίνονται νέες πρακτικές λύσεις. Ο Axel επαναλαμβάνει τώρα αυτή την προσέγγιση με τον Abacus Semi.

Ποιο είναι το όραμα της Abacus Semiconductor Corporation;
Το Abacus Semi οραματίζεται ένα μέλλον στο οποίο οι υπερυπολογιστές μπορούν να κατασκευαστούν με δομικά στοιχεία που μοιάζουν με Lego – συνδυάζουν και συνδυάζουν οποιονδήποτε συνδυασμό επεξεργαστών, επιταχυντών και έξυπνων πολλαπλών μνημών. Πιστεύουμε ότι οι υπερυπολογιστές σήμερα δεν πληρούν τις απαιτήσεις των χρηστών. Δεν κλιμακώνονται σχεδόν γραμμικά. Συχνά, 100,000 διακομιστές που αποτελούν έναν υπερυπολογιστή μπορεί να βρεθεί ότι παρέχουν μόλις 5,000 φορές την απόδοση ενός μεμονωμένου διακομιστή. Αυτό οφείλεται σε μεγάλο βαθμό στο γεγονός ότι οι σημερινοί υπερυπολογιστές είναι στην ουσία εμπορικές συσκευές εκτός ραφιού (COTS), χωρίς να λαμβάνεται υπόψη η επικοινωνία μεταξύ αυτών των διακομιστών για οδηγίες και κοινή χρήση δεδομένων σε χαμηλά επίπεδα καθυστέρησης και υψηλό επίπεδο εύρους ζώνης. Ένα άλλο μειονέκτημα είναι ότι οι επιταχυντές για εφαρμογές ειδικού σκοπού δεν ενσωματώνονται εύκολα σε υπερυπολογιστές. Έχουμε διαφορετική άποψη για τα βασικά δομικά στοιχεία – πολύ παρόμοια με τα Lego. Εάν τα προγραμματιζόμενα στοιχεία όπως οι επεξεργαστές χρησιμοποιούνται για την ενορχήστρωση του φόρτου εργασίας, τότε οι επιταχυντές εκτελούν την εργασία και τα δεδομένα εισέρχονται και εξέρχονται μέσω αποκλειστικών κόμβων I/O, ενώ τα μεγάλης κλίμακας έξυπνα υποσυστήματα μνήμης πολλαπλών κατοικιών διατηρούν τα ενδιάμεσα δεδομένα στο χέρι ανά πάσα στιγμή.

Πώς ξεκίνησε η Abacus Semiconductor Corporation;
Ο Axel είναι φυσικός και επιστήμονας υπολογιστών από εκπαίδευση και ως εκ τούτου έχει χρησιμοποιήσει υπερυπολογιστές για δεκαετίες και απογοητεύτηκε από την πολυπλοκότητα της ανάπτυξης και χρήσης τους, από την έλλειψη γραμμικής κλιμάκωσης και από το τεράστιο κόστος που συνδέονται με αυτούς. Ως αποτέλεσμα, ξεκίνησε να διορθώσει ό,τι μπορούσε να διορθωθεί, πάντα υποθέτοντας μερικές βασικές αρχές. Ξεκίνησε σε αυτό το ταξίδι με την Parimics, μια εταιρεία επεξεργασίας οράματος το 2004, και στη συνέχεια με την Scalable Systems Research Labs, Inc (SSRLabs) το 2011, με μια σύντομη παράκαμψη σε μια ασφαλή εκκίνηση επεξεργαστή, και τώρα στην Abacus Semiconductor Corporation το 2020.

Ένας σύγχρονος υπερυπολογιστής θα πρέπει να επιτρέπει την εύκολη ενσωμάτωση επιταχυντών τόσο σε υλικό όσο και σε λογισμικό, θα πρέπει να είναι σε θέση να παρέχει πολύ μεγάλες διαμορφώσεις μνήμης τόσο σε διαμερίσματα αποκλειστικής όσο και σε κοινόχρηστη μνήμη και θα πρέπει να είναι στο ίδιο κόστος με συστήματα που βασίζονται σε COTS διατηρώντας μείωση του λειτουργικού κόστους. Ειδικά η ενσωμάτωση επιταχυντών για εντατικές αριθμητικές εφαρμογές, για μαθηματικά μήτρων και τανυστών, για Τεχνητή Νοημοσύνη (AI) και Μηχανική Μάθηση (ML), καθώς και η ανάγκη για πολύ μεγάλη συνεκτική μνήμη cache κοινής χρήσης σε πολλούς επεξεργαστές αποδεικνύεται καλή και μελλοντική- κλήσεις απόδειξης καθώς οι σημερινές απαιτήσεις για το GPT-3 και το ChatGPT απαιτούν συστοιχίες μνήμης μεγεθών που δεν υποστηρίζονται στους σημερινούς επεξεργαστές.

Ως επιστήμονας υπολογιστών, ήταν σαφές στον Axel ότι οι συσκευές σταθερής λειτουργίας παρέχουν εξαιρετικά ανώτερη απόδοση, χρησιμοποιούν λιγότερη ενέργεια και λιγότερη ακίνητη περιουσία πυριτίου από τα προγραμματιζόμενα στοιχεία, και ως εκ τούτου ένας σύγχρονος υπερυπολογιστής θα πρέπει να επιτρέπει την ενσωμάτωση όλων των ειδών επιταχυντών ενώ διατήρηση της δυνατότητας προγραμματισμού ενός επεξεργαστή για την ενορχήστρωση των φόρτων εργασίας και για την εκτέλεση των εργασιών για τις οποίες δεν υπάρχει υλικό.

Αναφέρατε ότι έχετε κάποιες πρόσφατες εξελίξεις να μοιραστείτε. Τι είναι?
Είμαστε πολύ ενθουσιασμένοι που σας ενημερώνουμε ότι έχουμε αξιολογήσει όλο τον κώδικα και τα δομικά στοιχεία που δημιουργήσαμε την τελευταία περισσότερο από μια δεκαετία και ότι οι απαιτήσεις μας πληρούνται όλες. Με το Server-on-a-Chip, τα έξυπνα υποσυστήματα μνήμης πολλαπλών εγκαταστάσεων, τους επιταχυντές μαθηματικών και βάσεων δεδομένων μας, δείξαμε σε προσομοιώσεις ότι θα επιτύχουμε πολύ καλύτερη γραμμικότητα κλιμάκωσης. Για τις περισσότερες εφαρμογές και διαμορφώσεις, φαίνεται ότι θα χτυπήσουμε έναν παράγοντα κλιμάκωσης 80%, δηλαδή ένας υπερυπολογιστής που αποτελείται από 100,000 διακομιστές θα πρέπει να παρέχει περίπου 80,000 την απόδοση ενός μόνο. Η διεπαφή μας θα παρέχει αρκετό εύρος ζώνης ανά ακίδα ώστε να επιτρέπει πάνω από 3.2 TB/s εύρους ζώνης μέσα και έξω από τους επιταχυντές και τους επεξεργαστές μας. Το έξυπνο υποσύστημα μνήμης πολλαπλών εγκαταστάσεων θα παρέχει σχεδόν 1 TB/s εύρους ζώνης μέσα και έξω από το τσιπ. Οι τομείς ασφάλειας και συνοχής μπορούν να οριστούν για κάθε υποσύστημα μνήμης. Έχουμε σημειώσει πρόοδο στην οικοδόμηση της ομάδας μας –τόσο μηχανικής όσο και διαχείρισης– και έχουμε ένα φύλλο θητείας στα χέρια μας. Εξακολουθούμε να αξιολογούμε την εγκυρότητα και την εγκυρότητα αυτού του φύλλου όρων, αλλά αυτή τη στιγμή οι συνθήκες φαίνονται καλές.

Πείτε μας για αυτές τις νέες μάρκες που κατασκευάζετε;
Όπως αναφέρθηκε προηγουμένως, πιστεύουμε ότι για να δημιουργηθεί μια νέα γενιά υπερυπολογιστών, χρειάζονται νέοι επεξεργαστές, επιταχυντές και έξυπνες μνήμες πολλαπλών κατοικιών. Θίξαμε επίσης το γεγονός ότι οι σημερινοί πυρήνες είναι απίστευτα καλοί και ότι το πρόβλημα στους υπερυπολογιστές δεν είναι οι πυρήνες των επεξεργαστών, αλλά σχεδόν τα πάντα γύρω τους. Χρησιμοποιούμε πυρήνες επεξεργαστή RISC-V που τροποποιήσαμε ως το βασικό προγραμματιζόμενο δομικό στοιχείο. Κάνοντας αυτό μας επιτρέπει να συμμετέχουμε στην ανάπτυξη του οικοσυστήματος γύρω από το RISC-V, κάτι που πιστεύω ότι δείχνει την ταχύτερη ανάπτυξη από οποιονδήποτε επεξεργαστή που έχω δει στην καριέρα μου. Καταργήσαμε όλους τους περιοριστικούς παράγοντες απόδοσης γύρω από το RISC-V, προσθέσαμε υποστήριξη υλικού για εικονικοποίηση και hypervisors, βελτιστοποιήσαμε τις διεπαφές της κρυφής μνήμης και βεβαιωθήκαμε ότι μπορεί να συνδεθεί με την εσωτερική μας λεωφόρο πληροφοριών επεξεργαστή. Χρησιμοποιούμε επίσης επιταχυντές για όλες τις διεπαφές εισόδου/εξόδου και παλαιού τύπου, και επειδή το κάνουμε με τρόπο που μοιάζει με Lego, αυτά τα μπλοκ επαναχρησιμοποιούνται στον διακομιστή μας σε ένα chip και στον επεξεργαστή βάσης δεδομένων ακεραίων και στον επεξεργαστή ενορχήστρωσης , που είναι στην πραγματικότητα το ίδιο υλικό με διαφορετικό υλικολογισμικό. Οι αρχές που μοιάζουν με Lego επεκτείνονται και στο έξυπνο υποσύστημα μνήμης πολλαπλών κατοικιών. Ως εκ τούτου, η προσπάθεια ανάπτυξής μας είναι σχετικά χαμηλή σε σύγκριση με άλλες εταιρείες που επικεντρώνονται στον σχεδιασμό επεξεργαστών και στους υπερυπολογιστές. Λόγω της φιλοσοφίας μας για παραλληλισμό, αντί να χρειάζεται να ανεβάζουμε τις συχνότητες του ρολογιού, δεν χρειάζεται να ξοδεύουμε τόνους χρημάτων στο παλιό παιχνίδι φυσικής σχεδίασης γάτας και ποντικιού με δυναμικό κλείσιμο χρονισμού που περνάει από πολλούς επαναληπτικούς γύρους για να αποσπάσουμε έναν ακόμη Hertz συχνότητας ρολογιού. Όλα αυτά απλοποιούν την επαναχρησιμοποίηση κώδικα και δομικών στοιχείων, και γι' αυτό προσπαθούμε να δημιουργήσουμε τη δική μας IP εσωτερικά και να τη διατηρήσουμε έτσι.

Ποιες είναι οι μάρκες στην οικογένεια Abacus Semi;
Τα τσιπ που σχεδιάζουμε είναι ο Server-on-a-Chip που συνδυάζει αποτελεσματικά έναν ολόκληρο διακομιστή σε έναν επεξεργαστή, το ίδιο Frontend I/O Supercomputer, έναν Orchestration Processors, έναν Integer Database Processor (και οι δύο αναπτύσσουν το ίδιο υλικό αλλά χρησιμοποιούν διαφορετικό υλικολογισμικό) και έναν επιταχυντή μαθηματικών καθώς και ένα σετ έξυπνων αναμνήσεων πολλαπλών κατοικιών.

Πώς προγραμματίζονται τα τσιπ Abacus Semi;
Εφόσον χρησιμοποιούμε έναν επεξεργαστή RISC-V ως το υποκείμενο προγραμματιζόμενο στοιχείο, μπορούμε να χρησιμοποιήσουμε το υπάρχον οικοσύστημα. Το Server-on-a-Chip, ο επεξεργαστής βάσης δεδομένων ακεραίων και ο επεξεργαστής ενορχήστρωσης είναι όλα πλήρως συμβατά με το RISC-V Instruction Set Architecture. Με άλλα λόγια, τρέχουν όλα Linux και FreeBSD, με μεταγλωττιστές GCC και LLVM/CLANG να είναι διαθέσιμοι εδώ και λίγο καιρό. Στην πραγματικότητα, ολόκληρη η στοίβα LAMP (Linux/Apache/mySQL/PHP) και FAMP (FreeBSD/Apache/mySQL/PHP) είναι διαθέσιμη για αυτούς και ως εκ τούτου, οποιαδήποτε εφαρμογή PHP και Perl εκτελείται σε αυτά αμετάβλητη. Λόγω του γεγονότος ότι χρησιμοποιούμε μια προσέγγιση DPU-plus στη δικτύωση, διαθέτουμε ένα κομμάτι υλικολογισμικού για τους επεξεργαστές μας που λειτουργεί σαν φιλτράρισμα κάρτας διεπαφής δικτύου (NIC) με δυνατότητες εκφόρτωσης και με λειτουργίες DMA και Remote DMA, καθώς και με άμεση πρόσβαση στη μνήμη στους επεξεργαστές εφαρμογών. Παρόμοια εκφόρτωση για μαζική αποθήκευση είναι διαθέσιμη και εκφορτώνει τους επεξεργαστές εφαρμογών από εργασίες μαζικής αποθήκευσης, καθιστώντας έτσι περισσότερο τον χρόνο των επεξεργαστών εφαρμογών διαθέσιμο για τις εφαρμογές των χρηστών, με ή χωρίς hypervisor. Δεδομένου ότι ο διακομιστής-σε-ένα-τσιπ διπλασιάζεται ως διεπαφή εισόδου/εξόδου για υπερυπολογιστές, ο πυρήνας υπερυπολογιστή δεν χρειάζεται να εκτελεί λειτουργίες I/O ή παλαιού τύπου διασύνδεσης. όλα αυτά υποβιβάζονται στον διακομιστή σε ένα Chip. Αυτό επιτρέπει στους χρήστες ενός υπερυπολογιστή να αναπτύξουν τον πυρήνα με γυμνό μέταλλο, εάν το επιθυμούν. Ο επιταχυντής μαθηματικών για τα μαθηματικά μήτρας και τανυστών καθώς και για μετασχηματισμούς χρησιμοποιεί το openACC και το openCL ως API με όψη προς τα έξω, αλλά έχουμε διαθέσιμο ένα επίπεδο μετάφρασης που μετατρέπει το CUDA στο εγγενές σύνολο εντολών μας.

Μπορείτε να μας πείτε περισσότερα για την τεχνολογία σας πίσω από τη βελτίωση της κλίμακας;
Πιστεύουμε ότι η επικοινωνία είναι το κλειδί για την κλιμάκωση, και το πιο σημαντικό, την επικοινωνία χαμηλής καθυστέρησης και υψηλού εύρους ζώνης. Ως αποτέλεσμα, εξετάσαμε όλα όσα είχαμε δημιουργήσει για περιττά επίπεδα ιεραρχίας επικοινωνίας μέσω γεφυρών και προσαρμογέων διασύνδεσης και μετατροπέων διασύνδεσης. Τα αφαιρέσαμε όλα όσο ήταν απαραίτητο και δυνατό. Ως αποτέλεσμα, η επικοινωνία μεταξύ οποιωνδήποτε δύο ή περισσότερων στοιχείων στην αρχιτεκτονική μας παρέχει το υψηλότερο δυνατό εύρος ζώνης, δεδομένων των περιορισμών στο πλήθος των προσκρούσεων και των σφαιρών, και της ανάγκης διέλευσης από πλακέτες τυπωμένων κυκλωμάτων (PCB), κάτι που απαιτεί σειριακούς συνδέσμους υψηλής ταχύτητας τύπου CML . Ωστόσο, χρησιμοποιούμε το συντομότερο δυνατό FLITS και ανάλογη κωδικοποίηση, τα οποία επιτρέπουν την οπτική και την ηλεκτρική επικοινωνία. Η διεπαφή που έχουμε σχεδιάσει είναι διαθέσιμη για ευρύτερη υιοθέτηση από όποιον ενδιαφέρεται να τη χρησιμοποιήσει, έναντι ονομαστικής χρέωσης άδειας χρήσης. Είναι αρκετά ευρύ για να παρέχει κορυφαίο εύρος ζώνης, ενώ επιτρέπει δυνατότητες ανθεκτικότητας και ανίχνευσης σφαλμάτων για τη διαθεσιμότητα του συστήματος στην περιοχή των έξι εννέα. Είναι επίσης μια έξυπνη διεπαφή στο ότι μπορεί να αναγνωρίσει την τοπολογία του δικτύου έως και τρία βαθιά σε ιεραρχία αυτόνομα, και έχει σχεδιαστεί για να είναι στο δικό του chiplet σε περίπτωση που βρούμε έναν συνεργάτη που το θέλει αλλά δεν μπορεί να το σχεδιάσει στο δικό του σχέδια.

Πότε θα είναι διαθέσιμα τα τσιπ Abacus Semi;
Εργαζόμαστε με πελάτες και συνεργάτες για να εξασφαλίσουμε ένα πρωτότυπο tapeout το τρίτο τρίμηνο του 3 και ένα σύνολο παραγωγής όγκου για την FCS το 2025ο τρίμηνο του 1.

Διαβάστε επίσης:

Συνέντευξη CTO: John R. Cary της Tech-X Corporation

Συνέντευξη Διευθύνοντος Συμβούλου Semiwiki: Matt Genovese του Planorama Design

Συνέντευξη CEO: Δρ. Chris Eliasmith και Peter Suma, της Applied Brain Research Inc.

Μοιραστείτε αυτήν την ανάρτηση μέσω:

spot_img

Τελευταία Νοημοσύνη

spot_img