Λογότυπο Zephyrnet

Γραφήματα Γνώσης 101: Η ιστορία (και τα οφέλη) πίσω από τη διαφημιστική εκστρατεία – ΔΥΝΑΤΟΤΗΤΑ ΔΕΔΟΜΕΝΩΝ

Ημερομηνία:

Τα γραφήματα γνώσης, αν και δεν είναι τόσο γνωστά όσο άλλες προσφορές διαχείρισης δεδομένων, είναι μια αποδεδειγμένη δυναμική και επεκτάσιμη λύση για την αντιμετώπιση των απαιτήσεων διαχείρισης εταιρικών δεδομένων σε πολλούς κλάδους. Ως κόμβος δεδομένων, μεταδεδομένων και περιεχομένου, παρέχουν μια ενοποιημένη, συνεπή και ξεκάθαρη προβολή των δεδομένων που είναι διάσπαρτα σε διαφορετικά συστήματα. Χρησιμοποιώντας την παγκόσμια γνώση ως πλαίσιο για την ερμηνεία και ως πηγή εμπλουτισμού, βελτιστοποιούν επίσης τις ιδιόκτητες πληροφορίες, ώστε οι οργανισμοί να μπορούν να ενισχύσουν τη λήψη αποφάσεων και να συνειδητοποιήσουν συσχετισμούς που δεν ήταν διαθέσιμοι προηγουμένως μεταξύ των στοιχείων ενεργητικού τους. 

Οι οργανισμοί γνωρίζουν ήδη ότι τα δεδομένα που πρέπει να διαχειριστούν είναι πολύ διαφορετικά, διάσπαρτα και σε όγκους ακατανόητους μόλις πριν από μια δεκαετία. Αυτό συχνά αφήνει τις επιχειρηματικές γνώσεις και ευκαιρίες να χαθούν ανάμεσα σε μια μπερδεμένη πολυπλοκότητα ανούσιων, αποσαφηνισμένων δεδομένων και περιεχομένου. Τα γραφήματα γνώσης βοηθούν να ξεπεραστούν αυτές οι προκλήσεις ενοποιώντας την πρόσβαση στα δεδομένα, παρέχοντας ευέλικτη ενοποίηση δεδομένων και αυτοματοποιώντας τη διαχείριση δεδομένων. Η χρήση γραφημάτων γνώσης έχει τεράστια επίδραση σε διάφορα συστήματα και διαδικασίες, γι' αυτό Ο Garner προβλέπει ότι έως το 2025, οι τεχνολογίες γραφημάτων θα χρησιμοποιούνται στο 80% των καινοτομιών δεδομένων και αναλυτικών στοιχείων, από 10% το 2021, διευκολύνοντας την ταχεία λήψη αποφάσεων σε ολόκληρη την επιχείρηση. 

Τα γραφήματα γνώσης που ορίζονται και γιατί η σημασιολογία (και οι οντολογίες) έχουν σημασία

Σύμφωνα με Wikipedia, ένα γράφημα γνώσης είναι μια βάση γνώσεων που χρησιμοποιεί ένα μοντέλο δεδομένων ή τοπολογία δομημένου γραφήματος για την αναπαράσταση και τη λειτουργία δεδομένων. Η καρδιά του γραφήματος γνώσης είναι ένα μοντέλο γνώσης – μια συλλογή αλληλένδετων περιγραφών εννοιών, οντοτήτων, σχέσεων και γεγονότων όπου:

  • Οι περιγραφές έχουν επίσημη σημασιολογία που επιτρέπει τόσο στους ανθρώπους όσο και στους υπολογιστές να τις επεξεργάζονται αποτελεσματικά και χωρίς αμφιβολία
  • Οι περιγραφές συνεισφέρουν η μία στην άλλη, σχηματίζοντας ένα δίκτυο, όπου κάθε οντότητα αντιπροσωπεύει μέρος της περιγραφής των οντοτήτων που σχετίζονται με αυτήν
  • Διαφορετικά δεδομένα συνδέονται και περιγράφονται με σημασιολογικά μεταδεδομένα σύμφωνα με το μοντέλο γνώσης

Δημιουργώντας μια κοινή σημασιολογική περιγραφή, ένα γράφημα γνώσης επιτρέπει ένα υψηλότερο επίπεδο αφαίρεσης που δεν βασίζεται στη φυσική υποδομή ή τη μορφή των δεδομένων. Μερικές φορές αναφέρεται ως α δομή δεδομένων, παρέχει έναν ενιαίο, φιλικό προς τον άνθρωπο και ουσιαστικό τρόπο πρόσβασης και ενσωμάτωσης εσωτερικών και εξωτερικών δεδομένων. Χρησιμοποιώντας σημασιολογικά μεταδεδομένα, τα γραφήματα γνώσης παρέχουν μια συνεπή άποψη διαφορετικών εταιρικών δεδομένων, διασυνδέοντας τη γνώση που έχει διασκορπιστεί σε διαφορετικά συστήματα και ενδιαφερόμενους φορείς. 

Με τη βοήθεια της επεξεργασίας φυσικής γλώσσας (NLP), τα έγγραφα κειμένου μπορούν επίσης να ενσωματωθούν με γραφήματα γνώσης. Δεδομένου ότι πολλοί ερευνητές λένε ότι μεταξύ 75-85% της γνώσης ενός οργανισμού είναι κλειδωμένη σε στατικά έγγραφα, χάνονται τεράστια αξία και σοφία. Οι αγωγοί NLP ωφελούνται πάρα πολύ, καθώς μπορούν να χρησιμοποιηθούν εξελιγμένες μέθοδοι ανάλυσης κειμένου όταν συνδυάζεται η μηχανική μάθηση με γραφήματα γνώσης. Τα γραφήματα γνώσης είναι επίσης απαραίτητα για κάθε σημασιολογική τεχνητή νοημοσύνη και εξηγήσιμη στρατηγική τεχνητής νοημοσύνης.

Οντολογίες είναι εξίσου σημαντικές, καθώς αντιπροσωπεύουν τη ραχοκοκαλιά της τυπικής σημασιολογίας ενός γραφήματος γνώσης. Ως σχήμα δεδομένων του γραφήματος, χρησιμεύουν ως σύμβαση μεταξύ των προγραμματιστών του γραφήματος γνώσης και των χρηστών του σχετικά με την έννοια των δεδομένων. Ένας χρήστης θα μπορούσε να είναι ένας άλλος άνθρωπος ή μια εφαρμογή λογισμικού που χρειάζεται να ερμηνεύσει τα δεδομένα με αξιόπιστο και ακριβή τρόπο. Οι οντολογίες διασφαλίζουν μια κοινή κατανόηση των δεδομένων και των σημασιών τους. Όταν η επίσημη σημασιολογία χρησιμοποιείται για την έκφραση και την ερμηνεία των δεδομένων ενός γραφήματος γνώσης, υπάρχουν πολλά όργανα αναπαράστασης και μοντελοποίησης: 

  • μαθήματα: Τις περισσότερες φορές, μια περιγραφή οντότητας περιέχει μια ταξινόμηση της οντότητας σχετικά με μια ιεραρχία κλάσης. Για παράδειγμα, όταν ασχολείστε με γενικές ειδήσεις ή επιχειρηματικές πληροφορίες, θα μπορούσαν να υπάρχουν κατηγορίες που περιλαμβάνουν Πρόσωπο, Οργανισμό και Τοποθεσία. Πρόσωπα και οργανισμοί μπορούν να έχουν έναν κοινό πράκτορα υπερ-κλάσης. Η τοποθεσία έχει συνήθως πολλές υποκατηγορίες, π.χ. Χώρα, Κατοικημένος τόπος, Πόλη κ.λπ. 
  • Σχέσεις: Οι σχέσεις μεταξύ οντοτήτων συνήθως επισημαίνονται με τύπους, οι οποίοι παρέχουν πληροφορίες σχετικά με τη φύση της σχέσης, π.χ. φίλος, συγγενής, ανταγωνιστής κ.λπ. 
  • Κατηγορίες: Μια οντότητα μπορεί να συσχετιστεί με κατηγορίες που περιγράφουν κάποια πτυχή της σημασιολογίας της, π.χ. «Σύμβουλοι Τεσσάρων Μεγάλων» ή «Συνθέτες του XIX αιώνα». Ένα βιβλίο μπορεί να ανήκει ταυτόχρονα σε όλες αυτές τις κατηγορίες: «Βιβλία για την Αφρική», «Μπεστ σέλερ», «Βιβλία Ιταλών συγγραφέων», «Βιβλία για παιδιά» κ.λπ. Συχνά οι κατηγορίες περιγράφονται και ταξινομούνται σε μια ταξινόμηση. 
  • Ελεύθερο κείμενο: Είναι δυνατή η προσθήκη "κειμένου φιλικού προς τον άνθρωπο" για να διευκρινιστούν περαιτέρω οι σχεδιαστικές προθέσεις για την οντότητα και να βελτιωθεί η αναζήτηση.

Γραφήματα γνώσης στο Πλαίσιο Περιγραφής Πόρων (RDF)

Το Πλαίσιο Περιγραφής Πόρων είναι ένα πρότυπο για την περιγραφή πόρων Ιστού και ανταλλαγής δεδομένων, που αναπτύχθηκε και τυποποιήθηκε με την Κοινοπραξία του Παγκόσμιου Ιστού (W3C). Εκτός από το RDF, το μοντέλο γραφήματος με ετικέτα ιδιοτήτων (LPG) παρέχει μια ελαφριά εισαγωγή στη διαχείριση δεδομένων γραφήματος. Τα υγραέρια κερδίζουν συχνά τις καρδιές των προγραμματιστών εάν χρειάζεται να συλλεχθούν δεδομένα ad hoc και να εκτελεστούν αναλυτικές πληροφορίες γραφημάτων κατά τη διάρκεια ενός μεμονωμένου έργου με το γράφημα να απορρίπτεται στη συνέχεια. Δυστυχώς, η στοίβα τεχνολογίας γύρω από τα υγραέρια στερείται τυποποιημένων γλωσσών σχήματος ή μοντελοποίησης και γλωσσών ερωτημάτων και δεν υπάρχουν διατάξεις για τυπικές προδιαγραφές σημασιολογίας και διαλειτουργικότητας (π.χ. χωρίς μορφές σειριοποίησης, πρωτόκολλα ομοσπονδίας κ.λπ.).

Ενώ το RDF επιτρέπει να γίνονται δηλώσεις μόνο για κόμβους, το RDF-Star επιτρέπει σε κάποιον να κάνει δηλώσεις για άλλες δηλώσεις και με αυτόν τον τρόπο να επισυνάπτει μεταδεδομένα για να περιγράψει μια άκρη σε ένα γράφημα, όπως βαθμολογίες, βάρη, χρονικές πτυχές και προέλευση. Συνολικά, τα γραφήματα γνώσης, που αντιπροσωπεύονται σε RDF, παρέχουν το καλύτερο πλαίσιο για την ενοποίηση δεδομένων, την ενοποίηση, τη σύνδεση και την επαναχρησιμοποίηση, επειδή συνδυάζουν τα ακόλουθα:

  1. Εκφραστικότητα: Τα πρότυπα στη στοίβα του Σημασιολογικού Ιστού – RDF(s) και OWL – επιτρέπουν μια ευχάριστη αναπαράσταση διαφόρων τύπων δεδομένων και περιεχομένου: σχήματα δεδομένων, ταξινομίες, λεξιλόγια, όλα τα είδη μεταδεδομένων, αναφορά και κύρια δεδομένα. Η επέκταση RDF-star διευκολύνει τη μοντελοποίηση προέλευσης και άλλων δομημένων μεταδεδομένων. 
  2. Τυπική σημασιολογία: Όλα τα πρότυπα στη στοίβα του Σημασιολογικού Ιστού συνοδεύονται από καλά καθορισμένη σημασιολογία, η οποία επιτρέπει σε ανθρώπους και υπολογιστές να ερμηνεύουν με σαφήνεια σχήματα, οντολογίες και δεδομένα. 
  3. Απόδοση: Όλες οι προδιαγραφές έχουν μελετηθεί και αποδειχθεί ότι επιτρέπουν την αποτελεσματική διαχείριση γραφημάτων δισεκατομμυρίων γεγονότων και ιδιοτήτων.
  4. Διαλειτουργικότητα: Υπάρχει μια σειρά προδιαγραφών για σειριοποίηση δεδομένων, πρόσβαση (πρωτόκολλο SPARQL για τελικά σημεία), διαχείριση (SPARQL Graph Store) και συνένωση. Η χρήση παγκόσμιων μοναδικών αναγνωριστικών διευκολύνει την ενοποίηση και τη δημοσίευση δεδομένων. 
  5. Τυποποίηση: Όλα τα παραπάνω τυποποιούνται μέσω της διαδικασίας της κοινότητας του W3C, για να διασφαλιστεί ότι ικανοποιούνται οι απαιτήσεις διαφορετικών παραγόντων –από λογικούς έως επαγγελματίες διαχείρισης δεδομένων επιχειρήσεων και ομάδες λειτουργιών συστήματος. 

Ωστόσο, είναι σημαντικό να σημειωθεί ότι δεν είναι κάθε γράφημα RDF ένα γράφημα γνώσης. Για παράδειγμα, ένα σύνολο στατιστικών δεδομένων, π.χ. τα δεδομένα ΑΕΠ για χώρες, που αντιπροσωπεύονται στο RDF δεν είναι γράφημα γνώσης. Μια γραφική αναπαράσταση δεδομένων είναι συχνά χρήσιμη, αλλά μπορεί να μην είναι απαραίτητο να συλλάβουμε τη σημασιολογική γνώση των δεδομένων. Μπορεί επίσης να είναι αρκετό για μια εφαρμογή να έχει απλώς τη συμβολοσειρά «Ιταλία» που σχετίζεται με τη συμβολοσειρά «ΑΕΠ» και τον αριθμό «1.95 τρισεκατομμύρια δολάρια» χωρίς να χρειάζεται να ορίσουμε ποιες είναι οι χώρες ή ποιο είναι το Ακαθάριστο Εγχώριο Προϊόν μιας χώρας. 

Είναι οι συνδέσεις και το γράφημα που κάνουν το γράφημα της γνώσης, όχι η γλώσσα που χρησιμοποιείται για την αναπαράσταση των δεδομένων. Ένα βασικό χαρακτηριστικό ενός γραφήματος γνώσης είναι ότι οι περιγραφές οντοτήτων πρέπει να συνδέονται μεταξύ τους. Ο ορισμός μιας οντότητας περιλαμβάνει μια άλλη οντότητα. Αυτή η σύνδεση είναι ο τρόπος με τον οποίο σχηματίζεται το γράφημα (π.χ., το A είναι B, το B είναι το C, το C έχει το D, το A έχει το D). Οι βάσεις γνώσεων χωρίς επίσημη δομή και σημασιολογία, π.χ., "βάση γνώσης" Q&A σχετικά με ένα προϊόν λογισμικού, δεν αντιπροσωπεύουν επίσης ένα γράφημα γνώσης. Είναι δυνατό να έχουμε ένα έμπειρο σύστημα που έχει μια συλλογή δεδομένων οργανωμένη σε μια μορφή που δεν είναι γραφική παράσταση, αλλά χρησιμοποιεί αυτοματοποιημένες απαγωγικές διαδικασίες, όπως ένα σύνολο κανόνων «αν-τότε» για να διευκολύνει την ανάλυση. 

Τα γραφήματα γνώσης δεν είναι επίσης λογισμικό. Μάλλον ένα γράφημα γνώσης είναι ένας τρόπος οργάνωσης και συλλογής των δεδομένων και των μεταδεδομένων ώστε να πληρούν κριτήρια και να εξυπηρετούν συγκεκριμένους σκοπούς που, με τη σειρά τους, χρησιμοποιούνται από διαφορετικό λογισμικό. Τα δεδομένα ενός γραφήματος γνώσης μπορούν να χρησιμοποιηθούν σε πολλαπλά ανεξάρτητα συστήματα για διαφορετικούς σκοπούς.

Γραφήματα γνώσης και διαχείριση δεδομένων σε πραγματικό χρόνο

Οι απαιτήσεις για τα δεδομένα μας έχουν ωθήσει τις παραδοσιακές προσεγγίσεις στη διαχείριση δεδομένων πέρα ​​από τα όριά τους. Υπάρχουν άφθονες ποσότητες δεδομένων, περισσότερα κάθε μέρα, και όλα πρέπει να υποβληθούν σε επεξεργασία, να κατανοηθούν και να γίνουν χρήσιμα. Πρέπει να είναι αξιόπιστο και να γίνεται σε πραγματικό χρόνο, ανεξάρτητα αν προέρχεται από εσωτερικές ή εξωτερικές πηγές. Εξάλλου, η αξία των δεδομένων εξαρτάται εξ ολοκλήρου από την ικανότητα αξιοποίησης της χρήσης τους. Αυτό είναι ένα μάθημα που οι οργανισμοί μαθαίνουν γρήγορα καθώς επιδιώκουν να μειώσουν το κόστος ανάπτυξης και συντήρησης και εκτιμούν τα πλεονεκτήματα και τα έσοδα που θα αποκομιστούν από την έξυπνη διαχείριση των οργανωτικών δεδομένων. Τα σημερινά οικοσυστήματα δεδομένων είναι επίσης παγκόσμια. 

Τα γραφήματα γνώσης μπορούν να αντιμετωπίσουν τη διαφορετικότητά τους και την έλλειψη κεντρικού ελέγχου, επειδή είναι ένα παράδειγμα που ταιριάζει στο παγκόσμιο οικοσύστημα δεδομένων που περιλαμβάνει κάθε οργανισμό. Ακόμα καλύτερα, καθώς αλλάζουν οι πληροφορίες και η κατανόηση και οι ανάγκες ενός οργανισμού από αυτές τις πληροφορίες, το ίδιο αλλάζει και το γράφημα γνώσης. Τα δεδομένα που αντιπροσωπεύονται από ένα γράφημα γνώσης έχουν μια αυστηρή επίσημη σημασία που μπορούν να ερμηνεύσουν τόσο οι άνθρωποι όσο και οι μηχανές. Αυτό το νόημα το καθιστά χρησιμοποιήσιμο σε έναν άνθρωπο, αλλά επιτρέπει επίσης στον αυτοματοποιημένο συλλογισμό να επιτρέψει στους υπολογιστές να ελαφρύνουν μέρος του φόρτου. Με τα γραφήματα γνώσης, οι οργανισμοί μπορούν να αλλάξουν, να κλαδέψουν και να προσαρμόσουν το σχήμα, διατηρώντας παράλληλα τα δεδομένα ίδια και επαναχρησιμοποιώντας τα για να αποκτήσουν ακόμη περισσότερες πληροφορίες.

Πριν από χρόνια, απομακρυνθήκαμε από το τσιτάτο των Big Data στα Έξυπνα Δεδομένα. Έχοντας πρωτοφανείς ποσότητες δεδομένων ώθησε την ανάγκη να έχουμε ένα μοντέλο δεδομένων που αντικατοπτρίζει την περίπλοκη κατανόηση των πληροφοριών μας. Για να γίνουν τα δεδομένα έξυπνα, οι μηχανές δεν θα μπορούσαν πλέον να δεσμεύονται από άκαμπτα και εύθραυστα σχήματα δεδομένων. Χρειάζονταν αποθήκες δεδομένων που θα μπορούσαν να αντιπροσωπεύουν τον πραγματικό κόσμο και τις μπερδεμένες σχέσεις που συνεπάγεται. Όλα αυτά έπρεπε να γίνουν με τρόπο αναγνώσιμο από μηχανής με επίσημη σημασιολογία για να καταστεί δυνατή η αυτοματοποιημένη συλλογιστική που συμπλήρωνε και διευκόλυνε την ανθρώπινη εξειδίκευση και τη λήψη αποφάσεων. 

Τα γραφήματα γνώσης που εκφράζονται σε RDF παρέχουν αυτό, καθώς και πολυάριθμες εφαρμογές σε υπηρεσίες δεδομένων και πληροφοριών. Τα παραδείγματα περιλαμβάνουν έξυπνο περιεχόμενο, συσκευασία και επαναχρησιμοποίηση. ανταποκρινόμενη και ενημερωμένη σύσταση περιεχομένου· αυτοματοποιημένη ανακάλυψη γνώσης. σημασιολογική αναζήτηση? και ευφυείς πράκτορες. Μπορεί επίσης να υποστηρίξει πράγματα όπως το προφίλ και την κατάταξη της εταιρείας. ανακάλυψη πληροφοριών σε κανονιστικά έγγραφα· και παρακολούθηση της βιβλιογραφίας φαρμακοεπαγρύπνησης. 

Με απλά λόγια, τα γραφήματα γνώσης βοηθούν τις επιχειρήσεις να λαμβάνουν κρίσιμες αποφάσεις βάσει εναρμονισμένων μοντέλων γνώσης και δεδομένων που προέρχονται από συστήματα πηγών απορριμμάτων. Παρέχουν επίσης εγγενή επεκτασιμότητα και σημασιολογία που επιτρέπουν μια αποτελεσματική, συγκεκριμένη και ανταποκρινόμενη προσέγγιση στα δεδομένα, συμπεριλαμβανομένης της ασφάλειας και της διακυβέρνησης, της διαχείρισης ιδιοκτησίας και της προέλευσης. 

spot_img

Τελευταία Νοημοσύνη

spot_img