Logo Zephyrnet

Dữ liệu chủ so với dữ liệu tham chiếu – DỮ LIỆU

Ngày:

yelosmiley / Shutterstock

Thuật ngữ “dữ liệu gốc” và “dữ liệu tham chiếu” có thể khá dễ bị nhầm lẫn. Cả hai đều cung cấp dữ liệu chỉ thỉnh thoảng thay đổi theo thời gian và cung cấp dữ liệu được thiết kế chính xác và cập nhật. 

Dữ liệu gốc cung cấp thông tin chính xác cần thiết cho các giao dịch kinh doanh quan trọng đối với hoạt động kinh doanh – thông tin thường trực/bán cố định về khách hàng, nhân viên và nhà cung cấp cũng như các sản phẩm và tài sản của tổ chức. 

Mặt khác, dữ liệu tham chiếu thường dài hạn (nhưng không phải luôn luôn) và được sử dụng để xác định và phân loại dữ liệu “khác”.

Sự nhầm lẫn càng tăng lên khi các bài đánh giá nền tảng phần mềm có tiêu đề tập trung vào dữ liệu tham chiếu, nhưng sau đó chuyển sang nền tảng quản lý dữ liệu chính (MDM) mô tả, chỉ có một hoặc hai nền tảng hỗ trợ dữ liệu tham chiếu.

Không có một định nghĩa chuẩn hóa cho dữ liệu tham khảo. (Để hiểu rõ hơn về dữ liệu tham khảo, hãy nghĩ đến phần tham khảo trong thư viện công cộng của bạn.) Dữ liệu dài hạn “Khác” bao gồm nhiều nhu cầu và ngành khác nhau. Ví dụ: trong ngành tài chính, dữ liệu tham khảo là một thuật ngữ tổng hợp để chỉ thông tin chi tiết được sử dụng trong các giao dịch – sử dụng dữ liệu tham chiếu động. Dữ liệu tham chiếu về sự tăng trưởng của trẻ em do Tổ chức Y tế Thế giới phát triển cung cấp một ví dụ khác – sử dụng dữ liệu tham chiếu tĩnh. Một mẫu nhỏ của nhiều loại dữ liệu tham chiếu bao gồm:

Dữ liệu chủ cung cấp thông tin cơ bản cần thiết cho các giao dịch kinh doanh và có thể yêu cầu quyền truy cập hạn chế vì lý do bảo mật. Dữ liệu tham khảo cung cấp thông tin bổ sung giúp doanh nghiệp hoạt động hiệu quả hơn và thường được tất cả nhân viên dễ dàng truy cập.

Dữ liệu tham khảo và dữ liệu chủ được yêu cầu phải chính xác và cập nhật.  

Các tổ chức có thể lưu trữ dữ liệu tham khảo ở một số vị trí. Nếu phần mềm hỗ trợ, dữ liệu tham chiếu có thể được lưu trong danh mục dữ liệu, phần mềm quản trị dữ liệu và nền tảng quản lý dữ liệu chính. Ngoài ra, có một số chương trình phần mềm dành riêng cho dữ liệu tham khảo. Trong một số trường hợp, chẳng hạn như khi sử dụng kho dữ liệu, dữ liệu tham chiếu có thể được thiết lập dưới dạng phân mục của dữ liệu chính. 

Những gì là Dữ liệu tham khảo?

Dữ liệu tham khảo đến từ nhiều nguồn khác nhau và phải được quản lý để hỗ trợ đồng bộ hóa hệ thống của doanh nghiệp. Một phương pháp hiệu quả để thực hiện việc này là sử dụng nền tảng quản trị dữ liệu bao gồm phần mềm tham chiếu dữ liệu. Nếu không có kiểu quản lý này, dữ liệu tham khảo có thể bạc màu trong một tổ chức bộ phận. Nó cũng có thể được xác định và quản lý khác nhau nếu các bộ phận khác nhau sử dụng chiến thuật riêng của họ để thu thập và lưu trữ dữ liệu tham khảo. Ví dụ về dữ liệu tham chiếu thường được sử dụng bao gồm:

  • Mã giao dịch
  • Nhiệm vụ và quy trình kinh doanh
  • Hệ thống phân cấp tài chính
  • Phân khúc khách hàng
  • Thông tin tiền tệ
  • Mã tiểu bang hoặc quốc gia
  • Các loại đơn vị tổ chức
  • Mã ngôn ngữ
  • Trung tâm chi phí

Dữ liệu tham khảo có thể được lấy từ cả nguồn công cộng và nguồn tư nhân, đồng thời cung cấp thông tin cho các lĩnh vực khác nhau. Do các kết nối phức tạp giữa các miền và ứng dụng hỗ trợ dữ liệu tham chiếu nên việc quản lý nó có thể gặp một số thách thức. Việc quản lý dữ liệu tham chiếu không nên thực hiện thủ công. Dữ liệu tham chiếu thường được mọi bộ phận trong tổ chức sử dụng để giúp cung cấp bối cảnh cho dữ liệu của họ. Nó hỗ trợ chất lượng dữ liệu và khả năng sử dụng dữ liệu. 

Dữ liệu tham chiếu cung cấp nền tảng cho quá trình diễn giải dữ liệu được sử dụng trên nhiều ứng dụng, hệ thống và quy trình khác nhau.

Mục đích chính của dữ liệu tham chiếu là thiết lập các định nghĩa, phân loại và mối quan hệ chung cho các thành phần dữ liệu. Nó cũng sử dụng các mã và giá trị được xác định trước. Bằng cách này, dữ liệu tham chiếu sẽ nâng cao chất lượng của dữ liệu và hợp lý hóa quy trình tích hợp dữ liệu. Điều này, đến lượt nó, đơn giản hóa việc chia sẻ dữ liệu.

Ví dụ: ngành tài chính sử dụng các mã định danh bảo mật, chẳng hạn như Số nhận dạng chứng khoán quốc tế (ISIN) hoặc biểu tượng mã truyền đạt dữ liệu tham chiếu xác định các công cụ tài chính - trái phiếu, cổ phiếu và các công cụ phái sinh. Trong thương mại điện tử, việc sử dụng mã sản phẩm và phân loại có thể giúp việc quản lý hàng tồn kho và định giá được chuẩn hóa dễ dàng hơn nhiều. Trong chăm sóc sức khỏe, hệ thống mã hóa y tế giúp phân loại và lập hóa đơn chính xác cho các dịch vụ y tế.

Dữ liệu chủ và quản lý dữ liệu chủ Giải thích

Hai loại quản lý dữ liệu chủ đã được phát triển: phân tích và vận hành. Quản lý dữ liệu tổng thể hoạt động mô tả dữ liệu cốt lõi mà tổ chức sử dụng để kinh doanh. Dữ liệu này phải chính xác và đáng tin cậy để ngăn chặn các trở ngại trong giao dịch và giao hàng, đồng thời hỗ trợ hoạt động kinh doanh diễn ra suôn sẻ.

Hệ thống quản lý dữ liệu chủ phân tích sử dụng dữ liệu chủ để tránh các vấn đề phát sinh từ thông tin xung đột và dư thừa. Nếu không sử dụng dữ liệu chính, các phòng ban khác nhau sẽ phát triển các phiên bản dữ liệu chính của riêng họ, dẫn đến nhiều danh sách và có nhiều lỗi xuất hiện.

Để hiểu rõ hơn về dữ liệu chủ, hãy xem xét dữ liệu chủ không phải là gì. 

  • Đây không phải là dữ liệu giao dịch: Dữ liệu giao dịch được tạo ra bởi các ứng dụng khác nhau hỗ trợ quy trình mua và bán hàng ngày của doanh nghiệp. Mặc dù thông tin này được ghi lại và lưu trữ nhưng dữ liệu giao dịch không được sử dụng thường xuyên.
  • Đây không phải là dữ liệu phi cấu trúc: Dạng tự do hoặc dữ liệu phi cấu trúc không được tổ chức cũng như không được định dạng. Dữ liệu dạng tự do bao gồm văn bản, số, ngày tháng không có cấu trúc và về cơ bản là bất kỳ dữ liệu nào không được định dạng/chuyển đổi để hoạt động với hệ thống của tổ chức. Dữ liệu phi cấu trúc có thể bao gồm nội dung bằng văn bản của các trang web hoặc tài liệu, email, khảo sát, bài báo, nghiên cứu tiếp thị, v.v.

Với phần mềm thích hợp, quản lý dữ liệu chủ có thể cung cấp nhiều loại dịch vụ, chẳng hạn như làm sạch dữ liệu, chuyển đổi dữ liệu và quy trình tích hợp dữ liệu. Khi các nguồn dữ liệu mới được thêm vào, phần mềm quản lý dữ liệu chủ có thể xác định, thu thập, chuyển đổi và tích hợp dữ liệu mới vào hệ thống dữ liệu chính. 

Ví dụ về dữ liệu chủ thường được sử dụng được liệt kê dưới đây:

  • Dữ liệu khách hàng: Thường được coi là dạng dữ liệu chính được sử dụng phổ biến nhất, dữ liệu khách hàng cơ bản bao gồm địa chỉ thanh toán, địa chỉ email và số điện thoại nhưng đã phát triển để bao gồm các tùy chọn mua sắm cá nhân dựa trên các lần mua hàng trước đó.
  • Dữ liệu sản phẩm: Loại dữ liệu này liệt kê tất cả thông tin cần thiết để hỗ trợ việc thiết kế, sản xuất, giao hàng và bảo trì sản phẩm của doanh nghiệp. Dữ liệu sản phẩm bao gồm các thông số kỹ thuật, bản vẽ, bộ phận và cụm lắp ráp. Nó cũng có thể bao gồm các hóa đơn nguyên vật liệu, hướng dẫn công việc và các nhà cung cấp được phê duyệt.
  • Dữ liệu nhân viên: Dữ liệu này không được cung cấp cho tất cả nhân viên mà chỉ một số ít được chọn. Nó thường bao gồm số an sinh xã hội của nhân viên và tài khoản tiền gửi trực tiếp, cần được giữ kín. Thông tin như địa chỉ nhà, số điện thoại, người thân của họ cũng có thể được liệt kê.
  • Mua hàng: Dữ liệu liên quan đến các giao dịch mua lớn và giao dịch chứng khoán cụ thể có thể được liệt kê dưới dạng dữ liệu chính.
  • Dữ liệu vị trí chi nhánh: Vị trí của các chi nhánh, cửa hàng, cơ sở và cơ sở nhượng quyền là thông tin cố định/bán cố định và được sử dụng thường xuyên.

Dữ liệu chủ, kết hợp với quản lý dữ liệu chủ, có thể được sử dụng để hỗ trợ phân tích dữ liệu. Dữ liệu chính thường được sử dụng cùng với phân tích, một phần vì nó đáng tin cậy, nhất quán và đáng tin cậy. Ví dụ: một doanh nghiệp sử dụng nhiều hệ thống để lưu trữ dữ liệu khách hàng của họ sẽ gặp rủi ro khi mỗi hệ thống hoạt động với các phiên bản khác nhau của dữ liệu đó và làm hỏng phân tích kết hợp dữ liệu của hệ thống khác nhau.

Một số tổ chức thích truy cập giới hạn chuyển dữ liệu gốc cho một số ít nhân viên thích hợp – vì lý do bảo mật – đồng thời cung cấp dữ liệu tham chiếu cho mọi người trong tổ chức.

Kho dữ liệu, dữ liệu chủ và dữ liệu tham chiếu

Kho dữ liệu là một hình thức quản lý và lưu trữ dữ liệu được thiết kế để hỗ trợ phân tích và phát triển kinh doanh thông minh. Ngoài ra, nó có thể được sử dụng để lưu trữ cả dữ liệu chủ và dữ liệu tham chiếu. Kho dữ liệu có khả năng mở rộng và có thể mở rộng dễ dàng. Khi doanh nghiệp phát triển, nhu cầu lưu trữ dữ liệu của doanh nghiệp sẽ tăng lên, bao gồm nhu cầu về lượng dữ liệu chính và dữ liệu tham chiếu ngày càng tăng. Kho dữ liệu cho phép sự tăng trưởng này.

Kho dữ liệu có thể thực hiện nhiều nhiệm vụ khác nhau, bao gồm phát triển trí tuệ kinh doanh và chúng đặc biệt hữu ích để phân tích lượng dữ liệu đáng kể trong thời gian dài.

Quản lý dữ liệu tổng thể phân tích có thể phối hợp với kho dữ liệu nơi nó tập trung và hợp nhất dữ liệu. Dữ liệu chảy vào kho dữ liệu từ nhiều nguồn khác nhau, bao gồm dữ liệu được thu thập từ các trang web bên ngoài, dữ liệu giao dịch nội bộ, dữ liệu chính về vận hành và dữ liệu tham chiếu. Quá trình này cho phép các tổ chức thu được những hiểu biết có giá trị từ dữ liệu của họ.

Dữ liệu tham chiếu có thể được lưu trữ trong kho dữ liệu, thường là một phần nhỏ của dữ liệu chính. Kho dữ liệu thường tổ chức dữ liệu bằng cách sử dụng lược đồ hình sao hoặc bông tuyết, với bảng “thực tế” trung tâm chứa dữ liệu chính và các bảng “thứ nguyên” bổ sung chứa dữ liệu tham chiếu liên quan đến dữ liệu chính. Ví dụ: trong kho dữ liệu ngân hàng, bảng thực tế của nó có thể chứa dữ liệu ngân hàng, chẳng hạn như số tiền vay, ngày khoản vay được thực hiện và khách hàng đã nhận khoản vay, trong khi các bảng thứ nguyên (dữ liệu tham chiếu) có thể chứa thông tin về thông tin sản phẩm, nhân khẩu học của khách hàng và dữ liệu vị trí.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img