Logo Zephyrnet

Dự đoán quản lý dữ liệu cho năm 2024: Năm xu hướng mới nổi – DATAVERSITY

Ngày:

Khi chúng ta sắp kết thúc năm 2023, các nhà lãnh đạo Quản lý dữ liệu bắt buộc phải nhìn vào gương chiếu hậu của họ để đánh giá và, nếu cần, tinh chỉnh các chiến lược Quản lý dữ liệu của họ. Một điều rõ ràng; nếu các tổ chức tập trung vào dữ liệu muốn thành công vào năm 2024, họ sẽ cần chuẩn bị cho một môi trường trong đó dữ liệu được phân phối ngày càng nhiều.

Với suy nghĩ này, chúng tôi thấy năm xu hướng Quản lý dữ liệu quan trọng sẽ xuất hiện vào năm 2024: Dữ liệu phản trọng lực sẽ chiếm ưu thế; tầm quan trọng của các sản phẩm dữ liệu sẽ tăng lên; các tổ chức sẽ học cách áp dụng GenAI (Generative AI) và tận dụng nó một cách thành công; các tổ chức sẽ quản lý chi phí đám mây hiệu quả hơn; và việc quản trị cũng như bảo mật dữ liệu sẽ được đơn giản hóa.  

Chúng ta hãy xem xét kỹ hơn lần lượt từng xu hướng này:

Dữ liệu phản trọng lực sẽ chiếm ưu thế

Khái niệm về trọng lực dữ liệu, tương tự như bản chất của dữ liệu và khả năng thu hút các ứng dụng và dịch vụ bổ sung, không còn tồn tại. Mỗi tổ chức có môi trường hiện đại Chiến lược dữ liệu cần một kho dữ liệu bên cạnh một hồ dữ liệu, nếu không muốn nói là nhiều kho dữ liệu, để đáp ứng nhu cầu kinh doanh của họ. Trong hai thập kỷ qua, kho dữ liệu và hồ dữ liệu đã trở nên phổ biến để giải quyết các vấn đề về kho dữ liệu của doanh nghiệp, tuy nhiên những gì chúng tạo ra thậm chí còn là những vấn đề lớn hơn. Điều này là do kho dữ liệu và hồ dữ liệu bao gồm cả hệ thống tại chỗ và đám mây và chúng thường phân tán về mặt địa lý. Ngoài ra, mặc dù mọi nhà cung cấp dịch vụ đám mây đều cố gắng giải quyết nhiều vấn đề về dữ liệu và phân tích một cách độc lập, nhưng hầu hết các tổ chức đều chạy dữ liệu và phân tích của họ trong môi trường nhiều đám mây, chọn lọc các sản phẩm và dịch vụ từ hai hoặc nhiều nhà cung cấp dịch vụ đám mây. 

Đây là lý do tại sao dữ liệu phản trọng lực, nơi dữ liệu và ứng dụng vẫn được phân phối khắp các ranh giới khu vực và đám mây, sẽ trở thành tiêu chuẩn mới vào năm 2024 và hơn thế nữa. Các yếu tố khác góp phần vào tình trạng phản trọng lực của dữ liệu sẽ là chi phí sao chép dữ liệu ngày càng tăng, chủ quyền dữ liệu, luật và quy định về Quản trị dữ liệu địa phương cũng như yêu cầu tăng tốc độ hiểu biết sâu sắc. Khi xu hướng phản trọng lực của dữ liệu vẫn tiếp tục, các nhà lãnh đạo Quản lý dữ liệu nên đầu tư vào các công nghệ được xây dựng trên tiền đề Quản lý dữ liệu phân tán.

Sản phẩm dữ liệu sẽ tăng tầm quan trọng

Năm 2024 sẽ là năm bản lề cho sự phát triển của lưới dữ liệu, bao trùm bản chất phân tán vốn có của dữ liệu. Ngược lại với các mô hình tập trung, truyền thống trong đó dữ liệu được lưu trữ và quản lý bởi nhóm dữ liệu trung tâm cung cấp dự án dữ liệu cho người dùng doanh nghiệp, lưới dữ liệu được tổ chức xung quanh nhiều miền dữ liệu, mỗi miền được quản lý bởi người tiêu dùng chính của dữ liệu đó. Trong lưới dữ liệu, vai trò của CNTT chuyển sang cung cấp nền tảng cho các miền dữ liệu thực hiện công việc của chúng, tức là tạo và phân phối các sản phẩm dữ liệu trong toàn doanh nghiệp.   

Bước ngoặt sẽ là việc nhận ra rằng các sản phẩm dữ liệu phải được xử lý ở mức độ quan trọng như bất kỳ sản phẩm nào khác được cung cấp. Lấy ví dụ, một viên nang Tylenol: Giá trị của nó không chỉ nằm ở bản thân viên nang mà còn ở bao bì toàn diện giúp tạo được lòng tin của người tiêu dùng — từ mô tả và mục đích sử dụng cho đến danh sách thành phần và các biện pháp an toàn. Tương tự, danh mục dữ liệu đóng vai trò là “đóng gói” quan trọng giúp biến dữ liệu thô thành tài sản tiêu dùng, đáng tin cậy.

Trong thời đại lấy dữ liệu làm trung tâm này, việc chỉ đóng gói dữ liệu một cách hấp dẫn là chưa đủ; các tổ chức cần nâng cao toàn bộ trải nghiệm của người dùng cuối. Bắt chước các phương pháp hay nhất của những gã khổng lồ thương mại điện tử, nền tảng dữ liệu hiện đại phải cung cấp các tính năng như đề xuất được cá nhân hóa và các điểm nổi bật về sản phẩm phổ biến, đồng thời xây dựng niềm tin thông qua xác nhận của người dùng và khả năng hiển thị dòng dữ liệu. Hơn nữa, các nền tảng này sẽ tạo điều kiện thuận lợi cho các truy vấn thời gian thực trực tiếp từ danh mục dữ liệu và duy trì vòng phản hồi tương tác cho các câu hỏi, yêu cầu dữ liệu và sửa đổi của người dùng. Giống như việc giao hàng kịp thời là điều cần thiết trong thương mại điện tử, việc truy cập dữ liệu nhanh chóng và đáng tin cậy đang trở nên không thể thiếu đối với các tổ chức.

Các tổ chức sẽ đấu tranh để vừa áp dụng GenAI vừa tận dụng nó một cách thành công

Các tổ chức đang gặp phải nhiều thách thức khi cố gắng triển khai GenAI và các mô hình ngôn ngữ lớn (LLM), bao gồm các vấn đề về chất lượng dữ liệu, quản trị, tuân thủ đạo đức và quản lý chi phí. Mỗi trở ngại đều có mối quan hệ trực tiếp hoặc gián tiếp với chiến lược quản lý dữ liệu tổng thể của tổ chức, ảnh hưởng đến khả năng của tổ chức trong việc đảm bảo tính toàn vẹn của dữ liệu được đưa vào mô hình AI, tuân thủ các nguyên tắc quy định phức tạp hoặc tạo điều kiện thuận lợi cho việc tích hợp mô hình vào các hệ thống hiện có.

Các tổ chức sẽ cần quản lý chi phí đám mây hiệu quả hơn

Khi các doanh nghiệp tiếp tục chuyển hoạt động dữ liệu sang đám mây, họ phải đối mặt với một trở ngại đáng kể: chi phí dữ liệu đám mây tăng không ngừng và không bền vững. Trong năm tới, nhiệm vụ không chỉ là kiềm chế những chi phí gia tăng này mà còn phải làm như vậy trong khi vẫn duy trì được dịch vụ chất lượng cao và hiệu quả cạnh tranh. Chi phí lưu trữ đám mây và Quản lý dữ liệu tăng cao đang cản trở các công ty dự báo và lập ngân sách một cách hiệu quả, đồng thời các chi phí đáng tin cậy trước đây cho việc lưu trữ dữ liệu tại chỗ đã bị lu mờ bởi cấu trúc giá không ổn định của đám mây.

Giải quyết căng thẳng tài chính này đòi hỏi các doanh nghiệp phải phân tích kỹ lưỡng chi phí đám mây và tìm kiếm sự hiệu quả mà không làm giảm hiệu suất. Điều này bao gồm việc kiểm tra chi tiết các kiểu sử dụng dữ liệu, xác định chính xác các khu vực kém hiệu quả và xem xét các tùy chọn lưu trữ hiệu quả hơn về mặt chi phí. Để quản lý chi phí dữ liệu đám mây một cách hiệu quả, các công ty cần tập trung vào tính toán được sử dụng bởi các truy vấn và khối lượng dữ liệu đi ra liên quan, lập bảng việc sử dụng bộ dữ liệu và tối ưu hóa các giải pháp lưu trữ. Những nỗ lực này được tăng cường bằng cách áp dụng các nguyên tắc hoạt động tài chính (FinOps), kết hợp trách nhiệm giải trình tài chính với mô hình chi tiêu linh hoạt của đám mây. 

Bằng cách thường xuyên theo dõi chi tiêu, dự báo chi phí và triển khai các phương pháp tài chính tốt nhất trong quản lý đám mây, các tổ chức có thể cân bằng giữa việc tiết kiệm chi phí và hiệu quả hoạt động, đảm bảo rằng chiến lược dữ liệu của họ mạnh mẽ về mặt kinh tế và chức năng. Vào năm 2024, chúng ta sẽ chứng kiến ​​sự gia tăng đáng kể trong việc sử dụng bảng thông tin FinOps để quản lý tốt hơn phí dữ liệu đám mây.

Bảo mật và quản trị dữ liệu sẽ cần được đơn giản hóa

Dữ liệu tích hợp kém tác động đến tính linh hoạt của một tổ chức ở nhiều cấp độ, nhưng tác động này có lẽ được cảm nhận mạnh mẽ nhất ở vấn đề quản trị và bảo mật dữ liệu. Bởi vì cần có thời gian để cập nhật vô số hệ thống riêng lẻ nên không thể bảo mật hoặc quản lý tất cả các hệ thống doanh nghiệp cùng một lúc. 

Để đáp ứng thách thức này, các tổ chức đang tận dụng các chính sách toàn cầu về quản trị và bảo mật dữ liệu. Các chính sách bảo mật dữ liệu toàn cầu không chỉ dựa trên vai trò của người dùng mà còn dựa trên vị trí, do đó một người đang đi nghỉ có thể không truy cập được dữ liệu từ văn phòng chính. Các chính sách quản trị dữ liệu toàn cầu cũng có thể tự động chuẩn hóa cách viết của một số từ nhất định trên các hệ thống khác nhau trong công ty. 

Tuy nhiên, để đồng bộ hóa việc áp dụng các chính sách toàn cầu trong thời gian thực, việc triển khai quản trị và bảo mật dữ liệu như vậy đòi hỏi nền tảng của một cách tiếp cận hợp lý để quản lý dữ liệu và cách tiếp cận đó sẽ được đề cập trong phần tiếp theo. 

Tương lai là hợp lý

Để vượt qua những thách thức vốn có của từng xu hướng trong số XNUMX xu hướng này, các tổ chức sẽ cần có khả năng tận dụng các chiến lược Quản lý dữ liệu được thiết kế ngay từ đầu để hỗ trợ dữ liệu phân tán. Các phương pháp Quản lý dữ liệu truyền thống dựa vào việc sao chép vật lý dữ liệu từ nhiều hệ thống vào kho lưu trữ trung tâm, như kho dữ liệu hoặc hồ dữ liệu, nhưng các phương pháp đó, theo định nghĩa và cả trong thực tế, không hỗ trợ dữ liệu được phân phối vốn có. Ngược lại, các phương pháp Quản lý dữ liệu logic cho phép kết nối thời gian thực với dữ liệu khác nhau mà không cần sao chép, để hỗ trợ dữ liệu được phân phối vốn có. 

Do đó, Quản lý dữ liệu logic sẽ tiếp tục tồn tại cho đến năm 2024 và hơn thế nữa, vì nó cho phép mọi tổ chức quản lý dữ liệu phân tán theo cách hiệu quả và tiết kiệm chi phí nhất có thể.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img