Λογότυπο Zephyrnet

Η Gen AI Music σημείωσε ποσοστό επιτυχίας 20% σε εμπορικά σλιπ

Ημερομηνία:

Επί του παρόντος, το 20% της μουσικής που δημιουργείται από γενετική τεχνητή νοημοσύνη (gen AI) είναι ακριβές όταν πρόκειται για τη σύνταξη μουσικής για συγκεκριμένα εμπορικά σλιπ.

Μια μελέτη που διεξήχθη από την εταιρεία δοκιμών ήχου SoundOut και την εταιρεία επωνυμίας ήχου Stephen Arnold Music (SAM) υποστηρίζει αυτό. Σύμφωνα με τη μελέτη, οι άνθρωποι εξακολουθούν να μπορούν να γράφουν μουσική που είναι πιο ελκυστική και συναισθηματικά αληθινή από την τεχνητή νοημοσύνη. Ωστόσο, η τεχνητή νοημοσύνη μπορεί να βοηθήσει στο στάδιο του ιδεασμού αρκετά καλά στην τρέχουσα κατάστασή της.

Διαβάστε επίσης: Η κάμερα απογυμνώνει τους ανθρώπους για να πυροδοτήσει συζήτηση για την τεχνητή νοημοσύνη και το απόρρητο 

Οι ερευνητές έδωσαν τέσσερις συνοπτικές πληροφορίες στην πλατφόρμα gen-AI της Stable Audio: να δημιουργήσουν μουσική που ήταν τολμηρή και τολμηρή, εμπνευσμένη, αστεία και ιδιόμορφη, συναισθηματική και συμπονετική. Κάθε σύντομη ενημέρωση που εξέτασαν οι ερευνητές στη συνέχεια παρήχθη από την πλατφόρμα πέντε φορές.

Σε σύντομο σλιπ

Συνολικά, η τεχνητή νοημοσύνη απέδωσε «λογικά καλά», σύμφωνα με τους ερευνητές, και ήταν «σε μεγάλο βαθμό επιτυχημένη για τις περισσότερες συνθέσεις» όσον αφορά τη σκηνοθεσία.

Συγκεκριμένα, σύντομες, «συνεπείς» και «καλά ευθυγραμμισμένες» συνοπτικές πληροφορίες και αιτήματα για μουσική που στόχος τους να προκαλέσουν συσχετισμένα συναισθηματικά χαρακτηριστικά ήταν οι κύριοι παράγοντες που συνέβαλαν στην επιτυχία του AI. Η τεχνητή νοημοσύνη ήταν πιο πιθανό να αποτύχει όταν τους δόθηκε πιο περίπλοκα ή διακριτικά σλιπ.

Ο Διευθύνων Σύμβουλος της SoundOut, David Courtier-Dutton, δήλωσε ότι αυτή η μελέτη το αποκάλυψε AI Η «σύνθεση με αριθμούς» δεν είναι ήδη πολύ πίσω, παρόλο που οι άνθρωποι εξακολουθούν να υπερτερούν της τεχνητής νοημοσύνης στο συναισθηματικό μέτωπο. Πρόσθεσε ότι η τεχνητή νοημοσύνη δεν ήταν κατώτερη από τους ανθρώπους. απλά δεν ήταν τόσο καλό και περίμεναν ότι η τεχνητή νοημοσύνη θα μπορούσε τελικά να ταιριάξει με τους περισσότερους ανθρώπους συνθέτες με λίγη συναισθηματική λεπτομέρεια.

Ο Courtier-Dutton συνέχισε λέγοντας ότι η τεχνητή νοημοσύνη χρειάζεται μόνο να ξέρει πώς να προκαλεί συναισθήματα στους ανθρώπους. δεν χρειάζεται να κατανοήσει τα ίδια τα συναισθήματα.

Είπε,

«Το AI μπορεί να συνθέσει μουσική για να μας συγκινήσει συναισθηματικά. Τώρα μπορεί να το κάνει με αρκετή ακρίβεια για εμπορική χρήση. Απλώς χρειάζεται λίγη περισσότερη τεχνική ενσυναίσθηση».

Χρήση AI στον ήχο

Χρησιμοποιώντας την ανθρώπινη αντίληψη, ένα εργαλείο που προηγουμένως δεν χρησιμοποιήθηκε ελάχιστα, οι ερευνητές δημιούργησαν ένα νέο μοντέλο βαθιάς μάθησης που υπόσχεται να βελτιώσει σημαντικά την ποιότητα ήχου σε σενάρια πραγματικού κόσμου.

Οι ερευνητές ανακάλυψαν ότι θα μπορούσαν να βελτιώσουν την ποιότητα της ομιλίας, όπως καθορίζεται από αντικειμενικές μετρήσεις, συνδυάζοντας ένα μοντέλο βελτίωσης ομιλίας με τις υποκειμενικές εκτιμήσεις των ανθρώπων για την ποιότητα του ήχου.

Το νέο μοντέλο απέδωσε καλύτερα από άλλες συμβατικές μεθόδους στη μείωση της ποσότητας θορυβώδους ήχου—ανεπιθύμητους θορύβους που θα μπορούσαν να επηρεάσουν αυτό που προσπαθεί να ακούσει ο ακροατής. Πιο συγκεκριμένα, ανακαλύφθηκε ότι υπήρχε ισχυρή συσχέτιση μεταξύ των βαθμολογιών ποιότητας που προέβλεπε το μοντέλο και των αποφάσεων που θα έπαιρναν οι άνθρωποι. 

Ο στόχος αυτού μελέτη ήταν να ενισχύσει την ομιλία που προέρχεται από ένα μόνο κανάλι ήχου, όπως ένα μεμονωμένο μικρόφωνο ή μονοφωνική ομιλία.

Ωστόσο, η τεχνητή νοημοσύνη έχει ήδη εφαρμοστεί στο ήχου βιομηχανία. Για παράδειγμα, το Spotify παρουσίασε πρόσφατα το "AI DJs.Η τεχνητή νοημοσύνη βοηθά επίσης στην ανάπτυξη συνθετικών φωνών, υπερ-προσωποποιημένης δημιουργικότητας, εξελιγμένης στόχευσης και σε πολλούς άλλους τομείς.

Ο ιδρυτής του Colortext, Jason Brownlee, δήλωσε στο The Media Leader την περασμένη εβδομάδα ότι αν τα έξυπνα δημιουργικά ήχου μπορούν να εμφιαλώσουν τις γνώσεις τους με AI και να την κλιμακώσουν σε μια υπερ-αποδοτική, αυτοεκπαιδευόμενη και αυτοεξυπηρετούμενη πλατφόρμα παραγωγής διαφημίσεων, ο ουρανός είναι το όριο.

Προς το παρόν, η SAM και η SoundOut συμβουλεύουν την χρησιμοποίηση της τεχνητής νοημοσύνης κατά το στάδιο του ιδεασμού της ανάπτυξης επωνυμίας ήχου. 

«Όταν αναπτύσσετε μουσική έτοιμη για εμπορικούς σκοπούς για κορυφαίες επωνυμίες, υπάρχουν πρόσθετες σκέψεις για να προκαλέσετε το κατάλληλο συναίσθημα την κατάλληλη στιγμή», δήλωσε ο Chad Cook, πρόεδρος δημιουργικού και μάρκετινγκ στη SAM. 

Το ανθρώπινο άγγιγμα έχει αξιοσημείωτη επιρροή στην απόδοση, το συναισθηματικό συγχρονισμό, την ποιότητα παραγωγής, τη μίξη και το mastering, μεταξύ άλλων πτυχών.

spot_img

Τελευταία Νοημοσύνη

spot_img