โลโก้เซเฟอร์เน็ต

กราฟความรู้ 101: เรื่องราว (และคุณประโยชน์) ที่อยู่เบื้องหลังกระแสฮือฮา – DATAVERSITY

วันที่:

กราฟความรู้แม้จะไม่เป็นที่รู้จักเท่าข้อเสนอการจัดการข้อมูลอื่นๆ แต่เป็นโซลูชันแบบไดนามิกและปรับขนาดได้ที่ได้รับการพิสูจน์แล้ว เพื่อตอบสนองความต้องการการจัดการข้อมูลขององค์กรในแนวดิ่งหลายประเภท ในฐานะศูนย์กลางสำหรับข้อมูล เมตาดาต้า และเนื้อหา สิ่งเหล่านี้ให้มุมมองข้อมูลที่กระจัดกระจายไปตามระบบต่างๆ ที่เป็นหนึ่งเดียว สอดคล้องกัน และไม่คลุมเครือ การใช้ความรู้ระดับโลกเป็นบริบทสำหรับการตีความและเป็นแหล่งที่มาสำหรับการเพิ่มคุณค่า ยังเพิ่มประสิทธิภาพข้อมูลที่เป็นกรรมสิทธิ์เพื่อให้องค์กรต่างๆ สามารถปรับปรุงการตัดสินใจและตระหนักถึงความสัมพันธ์ที่ไม่เคยมีมาก่อนระหว่างสินทรัพย์ข้อมูลของตน 

องค์กรต่างๆ รู้อยู่แล้วว่าข้อมูลที่จำเป็นต้องจัดการนั้นมีความหลากหลาย กระจายตัวมากเกินไป และมีปริมาณมากจนไม่อาจหยั่งถึงได้เมื่อทศวรรษที่แล้วเท่านั้น สิ่งนี้มักจะทำให้ข้อมูลเชิงลึกทางธุรกิจและโอกาสหายไปท่ามกลางความซับซ้อนที่ยุ่งเหยิงของข้อมูลและเนื้อหาที่แยกออกมาอย่างไร้ความหมาย กราฟความรู้ช่วยเอาชนะความท้าทายเหล่านี้ด้วยการรวมการเข้าถึงข้อมูลเข้าด้วยกัน ให้การบูรณาการข้อมูลที่ยืดหยุ่น และทำให้การจัดการข้อมูลเป็นแบบอัตโนมัติ การใช้กราฟความรู้มีผลกระทบอย่างมากต่อระบบและกระบวนการต่างๆ ซึ่งเป็นเหตุผลว่าทำไม การ์เนอร์ทำนาย ว่าภายในปี 2025 เทคโนโลยีกราฟจะถูกนำไปใช้ในนวัตกรรมข้อมูลและการวิเคราะห์ 80% เพิ่มขึ้นจาก 10% ในปี 2021 ช่วยอำนวยความสะดวกในการตัดสินใจอย่างรวดเร็วทั่วทั้งองค์กร 

กราฟความรู้ถูกกำหนดไว้และเหตุใดความหมาย (และอภิปรัชญา) จึงมีความสำคัญ

ตามที่ วิกิพีเดียกราฟความรู้คือฐานความรู้ที่ใช้โมเดลข้อมูลที่มีโครงสร้างกราฟหรือโทโพโลยีเพื่อแสดงและดำเนินการกับข้อมูล หัวใจของกราฟความรู้คือแบบจำลองความรู้ ซึ่งเป็นชุดของคำอธิบายที่เชื่อมโยงกันของแนวคิด เอนทิตี ความสัมพันธ์ และเหตุการณ์ โดยที่:

  • คำอธิบายมีความหมายอย่างเป็นทางการซึ่งช่วยให้ทั้งผู้คนและคอมพิวเตอร์สามารถประมวลผลได้อย่างมีประสิทธิภาพและไม่คลุมเครือ
  • คำอธิบายมีส่วนสนับสนุนซึ่งกันและกัน โดยสร้างเครือข่าย โดยที่แต่ละเอนทิตีเป็นตัวแทนส่วนหนึ่งของคำอธิบายของเอนทิตีที่เกี่ยวข้อง
  • ข้อมูลที่หลากหลายเชื่อมโยงและอธิบายด้วยเมตาดาต้าเชิงความหมายตามแบบจำลองความรู้

ด้วยการสร้างคำอธิบายเชิงความหมายทั่วไป กราฟความรู้จะทำให้มีนามธรรมในระดับที่สูงขึ้น ซึ่งไม่ต้องอาศัยโครงสร้างพื้นฐานทางกายภาพหรือรูปแบบของข้อมูล บางครั้งเรียกว่าก ผ้าข้อมูลโดยมอบวิธีการเข้าถึงและบูรณาการข้อมูลภายในและภายนอกที่เป็นหนึ่งเดียว เป็นมิตรต่อมนุษย์ และมีความหมาย การใช้เมทาดาทาเชิงความหมาย กราฟความรู้ให้มุมมองที่สอดคล้องกันของข้อมูลองค์กรที่หลากหลาย เชื่อมโยงความรู้ที่กระจัดกระจายไปตามระบบต่างๆ และผู้มีส่วนได้ส่วนเสีย 

ด้วยความช่วยเหลือของการประมวลผลภาษาธรรมชาติ (NLP) เอกสารข้อความจึงสามารถรวมเข้ากับกราฟความรู้ได้ เนื่องจากนักวิจัยหลายคนกล่าวว่าความรู้ขององค์กรระหว่าง 75-85% ถูกขังอยู่ในเอกสารคงที่ คุณค่าและภูมิปัญญาอันมหาศาลจึงถูกมองข้ามไป ไปป์ไลน์ NLP ได้รับประโยชน์อย่างมาก เนื่องจากสามารถใช้วิธีวิเคราะห์ข้อความที่ซับซ้อนเมื่อรวมการเรียนรู้ของเครื่องเข้ากับกราฟความรู้ กราฟความรู้ยังจำเป็นสำหรับ AI เชิงความหมายและกลยุทธ์ AI ที่สามารถอธิบายได้

อภิปรัชญา มีความสำคัญเท่าเทียมกัน เนื่องจากแสดงถึงกระดูกสันหลังของความหมายที่เป็นทางการของกราฟความรู้ ในฐานะที่เป็นสคีมาข้อมูลของกราฟ กราฟเหล่านี้ทำหน้าที่เป็นสัญญาระหว่างนักพัฒนากราฟความรู้และผู้ใช้เกี่ยวกับความหมายของข้อมูล ผู้ใช้อาจเป็นมนุษย์อีกคนหรือแอปพลิเคชันซอฟต์แวร์ที่ต้องตีความข้อมูลด้วยวิธีที่เชื่อถือได้และแม่นยำ Ontology ช่วยให้เกิดความเข้าใจร่วมกันเกี่ยวกับข้อมูลและความหมายของข้อมูล เมื่อใช้ความหมายที่เป็นทางการในการแสดงและตีความข้อมูลของกราฟความรู้ มีเครื่องมือในการแสดงและการสร้างแบบจำลองหลายอย่าง: 

  • ชั้นเรียน: บ่อยครั้งที่คำอธิบายเอนทิตีมีการจำแนกประเภทของเอนทิตีที่เกี่ยวข้องกับลำดับชั้นของคลาส ตัวอย่างเช่น เมื่อต้องรับมือกับข่าวทั่วไปหรือข้อมูลทางธุรกิจ อาจมีคลาสที่ประกอบด้วยบุคคล องค์กร และสถานที่ตั้ง บุคคลและองค์กรสามารถมีตัวแทนระดับซุปเปอร์คลาสร่วมกันได้ สถานที่ตั้งมักจะมีคลาสย่อยจำนวนมาก เช่น ประเทศ สถานที่ที่มีประชากร เมือง ฯลฯ 
  • ความสัมพันธ์: ความสัมพันธ์ระหว่างเอนทิตีมักจะติดแท็กด้วยประเภท ซึ่งให้ข้อมูลเกี่ยวกับลักษณะของความสัมพันธ์ เช่น เพื่อน ญาติ คู่แข่ง ฯลฯ 
  • หมวดหมู่: เอนทิตีสามารถเชื่อมโยงกับหมวดหมู่ที่อธิบายบางแง่มุมของความหมาย เช่น "ที่ปรึกษา Big Four" หรือ "ผู้แต่งเพลงแห่งศตวรรษที่ XIX" หนังสือสามารถจัดอยู่ในหมวดหมู่เหล่านี้ทั้งหมดพร้อมกันได้: "หนังสือเกี่ยวกับแอฟริกา" "หนังสือขายดี" "หนังสือโดยนักเขียนชาวอิตาลี" "หนังสือสำหรับเด็ก" ฯลฯ บ่อยครั้งมีการอธิบายและจัดหมวดหมู่หมวดหมู่ต่างๆ ให้เป็นอนุกรมวิธาน 
  • ข้อความฟรี: คุณสามารถเพิ่ม "ข้อความที่เป็นมิตรต่อมนุษย์" เพื่อชี้แจงความตั้งใจในการออกแบบสำหรับเอนทิตีและปรับปรุงการค้นหาได้

กราฟความรู้ในกรอบคำอธิบายทรัพยากร (มูลนิธิ กศน.)

Resource Description Framework เป็นมาตรฐานสำหรับการอธิบายทรัพยากรบนเว็บและการแลกเปลี่ยนข้อมูล ซึ่งพัฒนาและเป็นมาตรฐานกับ World Wide Web Consortium (W3C) นอกเหนือจาก RDF แล้ว โมเดลกราฟคุณสมบัติที่มีป้ายกำกับ (LPG) ยังให้ข้อมูลแนะนำเบื้องต้นเกี่ยวกับการจัดการข้อมูลกราฟอีกด้วย LPG มักจะชนะใจนักพัฒนาหากจำเป็นต้องรวบรวมข้อมูลเฉพาะกิจและการวิเคราะห์กราฟจะดำเนินการในโครงการเดียว โดยกราฟจะถูกละทิ้งในภายหลัง น่าเสียดายที่กลุ่มเทคโนโลยีที่เกี่ยวข้องกับ LPGs ขาดสคีมามาตรฐานหรือภาษาการสร้างแบบจำลองและภาษาคิวรี และไม่มีข้อกำหนดสำหรับความหมายที่เป็นทางการและข้อกำหนดความสามารถในการทำงานร่วมกัน (เช่น ไม่มีรูปแบบการทำให้เป็นอนุกรม โปรโตคอลรวมศูนย์ ฯลฯ)

แม้ว่า RDF อนุญาตให้สร้างข้อความเกี่ยวกับโหนดเท่านั้น แต่ RDF-Star อนุญาตให้สร้างข้อความเกี่ยวกับข้อความอื่นๆ และด้วยวิธีนี้จะแนบข้อมูลเมตาเพื่ออธิบายขอบในกราฟ เช่น คะแนน น้ำหนัก ลักษณะทางโลก และที่มา โดยรวมแล้ว กราฟความรู้ที่แสดงใน RDF มอบเฟรมเวิร์กที่ดีที่สุดสำหรับการรวมข้อมูล การรวม การเชื่อมโยง และการนำกลับมาใช้ใหม่ เนื่องจากกราฟเหล่านี้รวมสิ่งต่อไปนี้:

  1. การแสดงออก: มาตรฐานใน Semantic Web stack – RDF และ OWL – ช่วยให้สามารถแสดงข้อมูลและเนื้อหาประเภทต่างๆ ได้อย่างคล่องแคล่ว: สคีมาข้อมูล อนุกรมวิธาน คำศัพท์ เมตาดาต้าทุกประเภท ข้อมูลอ้างอิง และข้อมูลหลัก ส่วนขยายดาว RDF ทำให้ง่ายต่อการจำลองแหล่งที่มาและข้อมูลเมตาที่มีโครงสร้างอื่นๆ 
  2. ความหมายที่เป็นทางการ: มาตรฐานทั้งหมดใน Semantic Web Stack มาพร้อมกับซีแมนทิกส์ที่มีการระบุอย่างดี ซึ่งช่วยให้มนุษย์และคอมพิวเตอร์สามารถตีความสคีมา ออนโทโลจี และข้อมูลได้อย่างไม่คลุมเครือ 
  3. ประสิทธิภาพ: ข้อกำหนดทั้งหมดได้รับการพิจารณาและพิสูจน์แล้วว่าช่วยให้สามารถจัดการกราฟข้อเท็จจริงและคุณสมบัตินับพันล้านได้อย่างมีประสิทธิภาพ
  4. ความสามารถในการทำงานร่วมกัน: มีข้อกำหนดหลายประการสำหรับการจัดลำดับข้อมูล การเข้าถึง (SPARQL Protocol สำหรับจุดสิ้นสุด) การจัดการ (SPARQL Graph Store) และการรวมศูนย์ การใช้ตัวระบุที่ไม่ซ้ำกันทั่วโลกช่วยอำนวยความสะดวกในการรวมและการเผยแพร่ข้อมูล 
  5. มาตรฐาน: สิ่งที่กล่าวมาทั้งหมดได้รับการกำหนดมาตรฐานผ่านกระบวนการชุมชน W3C เพื่อให้แน่ใจว่าความต้องการของผู้มีบทบาทที่แตกต่างกันได้รับการตอบสนอง ตั้งแต่นักตรรกศาสตร์ไปจนถึงผู้เชี่ยวชาญด้านการจัดการข้อมูลระดับองค์กรและทีมปฏิบัติการระบบ 

อย่างไรก็ตาม สิ่งสำคัญที่ควรทราบคือไม่ใช่กราฟ RDF ทุกกราฟที่จะเป็นกราฟความรู้ ตัวอย่างเช่น ชุดข้อมูลทางสถิติ เช่น ข้อมูล GDP สำหรับประเทศต่างๆ ที่แสดงใน RDF ไม่ใช่กราฟความรู้ การแสดงข้อมูลแบบกราฟมักมีประโยชน์ แต่อาจไม่จำเป็นในการจับความรู้เชิงความหมายของข้อมูล นอกจากนี้ยังอาจเพียงพอสำหรับแอปพลิเคชันที่จะมีสตริง "อิตาลี" เชื่อมโยงกับสตริง "GDP" และตัวเลข "1.95 ล้านล้านดอลลาร์" โดยไม่ต้องระบุว่าประเทศใดคือประเทศใดหรือผลิตภัณฑ์มวลรวมภายในประเทศของประเทศหนึ่งๆ คืออะไร 

ความเชื่อมโยงและกราฟคือสิ่งที่สร้างกราฟความรู้ ไม่ใช่ภาษาที่ใช้แทนข้อมูล คุณลักษณะสำคัญของกราฟความรู้คือคำอธิบายเอนทิตีควรเชื่อมโยงถึงกัน คำจำกัดความของเอนทิตีหนึ่งรวมถึงเอนทิตีอื่นด้วย การเชื่อมโยงนี้เป็นลักษณะของกราฟ (เช่น A คือ B; B คือ C; C มี D; A มี D) ฐานความรู้ที่ไม่มีโครงสร้างและความหมายที่เป็นทางการ เช่น Q&A “ฐานความรู้” เกี่ยวกับผลิตภัณฑ์ซอฟต์แวร์ก็ไม่ได้แสดงถึงกราฟความรู้เช่นกัน เป็นไปได้ที่จะมีระบบผู้เชี่ยวชาญที่มีการรวบรวมข้อมูลที่จัดอยู่ในรูปแบบที่ไม่ใช่กราฟ แต่ใช้กระบวนการนิรนัยอัตโนมัติ เช่น ชุดกฎ "ถ้า-แล้ว" เพื่ออำนวยความสะดวกในการวิเคราะห์ 

กราฟความรู้ไม่ใช่ซอฟต์แวร์เช่นกัน กราฟความรู้เป็นวิธีจัดระเบียบและรวบรวมข้อมูลและข้อมูลเมตาเพื่อให้เป็นไปตามเกณฑ์และตอบสนองวัตถุประสงค์เฉพาะซึ่งในทางกลับกันจะถูกใช้โดยซอฟต์แวร์ต่างๆ ข้อมูลของกราฟความรู้เดียวสามารถนำไปใช้ในระบบอิสระหลายระบบเพื่อวัตถุประสงค์ที่แตกต่างกัน

กราฟความรู้และการจัดการข้อมูลแบบเรียลไทม์

ความต้องการข้อมูลของเราได้ผลักดันแนวทางดั้งเดิมในการจัดการข้อมูลให้เกินขีดจำกัด มีข้อมูลจำนวนมาก มากขึ้นทุกวัน และทั้งหมดนี้จำเป็นต้องได้รับการประมวลผล ทำความเข้าใจ และทำให้มีประโยชน์ จะต้องมีความน่าเชื่อถือและดำเนินการแบบเรียลไทม์ไม่ว่าจะมาจากแหล่งภายในหรือภายนอกก็ตาม ท้ายที่สุดแล้ว มูลค่าของข้อมูลขึ้นอยู่กับความสามารถในการใช้ประโยชน์จากข้อมูลนั้นทั้งหมด นี่คือบทเรียนที่องค์กรต่างๆ กำลังเรียนรู้อย่างรวดเร็วในขณะที่พวกเขาต้องการลดต้นทุนการพัฒนาและการบำรุงรักษา และชื่นชมข้อดีและรายได้ที่จะได้รับจากการจัดการข้อมูลองค์กรอย่างชาญฉลาด ระบบนิเวศของข้อมูลในปัจจุบันก็มีอยู่ในระดับโลกเช่นกัน 

กราฟความรู้สามารถจัดการกับความหลากหลายและการขาดการควบคุมแบบรวมศูนย์ได้ เนื่องจากเป็นกระบวนทัศน์ที่เหมาะสมกับระบบนิเวศข้อมูลระดับโลกซึ่งรวมถึงทุกองค์กร ยังดีกว่าเมื่อข้อมูลและความเข้าใจและความต้องการขององค์กรจากข้อมูลนั้นเปลี่ยนแปลงไป กราฟความรู้ก็เปลี่ยนแปลงไปด้วย ข้อมูลที่แสดงโดยกราฟความรู้มีความหมายอย่างเป็นทางการที่เข้มงวดซึ่งทั้งมนุษย์และเครื่องจักรสามารถตีความได้ ความหมายนั้นทำให้มนุษย์สามารถใช้งานได้ แต่ยังช่วยให้การใช้เหตุผลอัตโนมัติช่วยให้คอมพิวเตอร์สามารถแบ่งเบาภาระบางส่วนได้ ด้วยกราฟความรู้ องค์กรสามารถเปลี่ยนแปลง ตัด และปรับใช้สคีมาในขณะเดียวกันก็รักษาข้อมูลให้เหมือนเดิม และนำกลับมาใช้ใหม่เพื่อขับเคลื่อนข้อมูลเชิงลึกมากยิ่งขึ้น

หลายปีก่อน เราย้ายจากคำศัพท์ยอดนิยมของ Big Data ไปสู่ ​​Smart Data การมีข้อมูลจำนวนมากอย่างไม่เคยมีมาก่อนได้ผลักดันความจำเป็นที่จะต้องมีแบบจำลองข้อมูลที่สะท้อนความเข้าใจที่ซับซ้อนของเราในข้อมูล เพื่อให้ข้อมูลมีความชาญฉลาด เครื่องจักรจะไม่ถูกผูกมัดด้วยแผนข้อมูลที่ไม่ยืดหยุ่นและเปราะบางอีกต่อไป พวกเขาต้องการพื้นที่เก็บข้อมูลที่สามารถเป็นตัวแทนของโลกแห่งความเป็นจริงและความสัมพันธ์ที่ยุ่งเหยิงที่เกิดขึ้นได้ ทั้งหมดนี้จำเป็นต้องทำในลักษณะที่เครื่องอ่านได้พร้อมความหมายที่เป็นทางการ เพื่อให้สามารถให้เหตุผลแบบอัตโนมัติที่เสริมและอำนวยความสะดวกในความเชี่ยวชาญและการตัดสินใจของมนุษย์ 

กราฟความรู้ที่แสดงใน RDF ให้สิ่งนี้ตลอดจนการใช้งานข้อมูลและบริการที่มีข้อมูลจำนวนมาก ตัวอย่างได้แก่ เนื้อหาอัจฉริยะ บรรจุภัณฑ์ และการนำกลับมาใช้ใหม่ การแนะนำเนื้อหาที่ตอบสนองและรับรู้ตามบริบท การค้นพบความรู้อัตโนมัติ การค้นหาความหมาย และตัวแทนที่ชาญฉลาด นอกจากนี้ยังสามารถรองรับสิ่งต่างๆ เช่น การทำโปรไฟล์และการจัดอันดับบริษัท การค้นพบข้อมูลในเอกสารกำกับดูแล และการติดตามวรรณกรรมการเฝ้าระวังเรื่องเภสัชกรรม 

พูดง่ายๆ ก็คือ กราฟความรู้ช่วยให้ธุรกิจต่างๆ ตัดสินใจได้อย่างมีวิจารณญาณโดยอาศัยโมเดลความรู้ที่ประสานกันและข้อมูลที่ได้จากระบบแหล่งที่มาแบบแยกส่วน นอกจากนี้ยังมอบความสามารถในการปรับขนาดและความหมายดั้งเดิมที่ช่วยให้เข้าถึงข้อมูลได้อย่างมีประสิทธิภาพ เฉพาะเจาะจง และตอบสนอง รวมถึงความปลอดภัยและการกำกับดูแล การจัดการความเป็นเจ้าของ และที่มา 

จุด_img

ข่าวกรองล่าสุด

จุด_img