Zephyrnet Logosu

Veri Sınıflandırmanın Temelleri – DATAVERSITY

Tarih:

veri sınıflandırmasıveri sınıflandırması
Crevis / Shutterstock

Veri sınıflandırma süreci, genel olarak, verilerin ilgili kategorilere göre düzenlenmesi ve bu verilere daha verimli bir şekilde erişilmesinin ve korunmasının sağlanması olarak tanımlanabilir. En basit ifadeyle veri sınıflandırma süreci, verileri güvenlik ihtiyaçlarına göre sıralar ve verilerin bulunmasını ve alınmasını kolaylaştırır. Sınıflandırma özellikle büyük miktarda veri depolayan kuruluşlar için faydalıdır.  

Veri sınıflandırması birden fazla amaç için kullanılabilir: veri güvenliği girişimleri, mevzuat uyumluluğunun sürdürülmesi ve diğer iş hedeflerinin karşılanması. Bazı durumlarda, verilerin belirli zaman dilimleri içerisinde aranabilir ve geri alınabilir olmasını talep eden devlet kurumlarının kullanımına sunulmasıyla birlikte veri sınıflandırması düzenleyici bir gereklilik haline geldi. Veri sınıflandırma, kolay ve etkili aramaları ve veri toplamayı desteklediğinden, veri analizi daha verimli bir süreç haline gelir.

Toronto Üniversitesi direktörü Julia Duncan, açıkladı

“Veriler her yerdedir. Veri sınıflandırması, onu işlemenin ve korumanın en uygun yollarını anlamamıza yardımcı olur - onu kim görebilir veya kullanabilir, nerede ve ne kadar süreyle saklayabilir, paylaşılıp paylaşılamayacağı ve hangi koruyucu önlemlerin en uygun olduğu. İster bir araştırma projesi olsun, ister veri toplamanın bir parçası olsun, ister akademik ve idari amaçlarla günlük veri kullanımı ve paylaşımı olsun, veri güvenliğini güçlendirmeye devam ettiğimiz için veri sınıflandırma çok önemli bir adımdır."

Veri sınıflandırma süreci aynı zamanda verilerin tekrarlanmasını da ortadan kaldırır ve bu da verilerin doğruluğunu artırır (veri kalitesi ve veri bütünlüğü). 

Veri sınıflandırma işlemi sırasında veri etiketleme uygulanır. Veri sınıflandırmasında önemli bir adım olarak kabul edilir. Bu etiketler verileri tanımlamak için kullanılır ve güvenlik amacıyla gizlilik/hassasiyet düzeyini ve veri kalitesi düzeyini iletebilir. Verilerin hassasiyeti güvenlik derecesini belirler.

Veri Etiketleme

Veri etiketleme, etiketi meta verilere dahil ederek verileri tanımlar. "Etiket", bir veri dosyasına atanan bir anahtar kelime, sayı veya terimdir. Bir işletmede çalışan kimliği, bireysel çalışanları tanımlamanın benzersiz bir yolunu sağlayabilir. Çalışan numarası girildiğinde arama motoru, ortak bir anahtar kelimeyi paylaşan birden fazla çalışan yerine tek bir çalışanı sunar. 

Benzer şekilde, bir futbol maçında, bir koltuğun belirli bir bilete tahsisini iletmek ve geçici sahiplik oluşturmak için bir koltuk numarası kullanılabilir. Meta verilerdeki etiketleme sistemi, bir veri dosyasının hızlı ve kolay bir şekilde bulunmasını ve bu dosyaya erişilmesini sağlar ve koltuğun "sahibinin" kim olduğu konusundaki kafa karışıklığını ortadan kaldırabilir.

Veri etiketleme, benzersiz bir tanımlama süreci sağlamak ve verimliliği artırmak için meta verileri kullanır.

Verilerin etiketlenmesi, veri sınıflandırma sürecinde önemli bir adımdır. Etiketler verinin türünü, hassasiyet düzeyini ve verinin türünü iletmek için kullanılır. veri kalitesi düzeyi. Hassasiyet normalde verilerin önemine veya gizliliğine dayanır ve ihtiyaç duyulan uygun güvenlik önlemleriyle uyumludur. 

Yaygın Veri Türleri

Veri sınıflandırması, kuruluşun verilerinin hem daha iyi anlaşılmasını hem de erişilebilirliğini sağlayabilir. Bu durum veri analizinin kullanımını ve veri güvenliğinin iyileştirilmesini teşvik etmektedir. Veri sınıflandırmanın etkili kullanımı, büyük miktarda depolanmış veriye sahip bir kuruluşun daha verimli çalışmasına yardımcı olabilir. 

Veri sınıflandırmanın nasıl çalıştığını daha iyi anlamak için aşağıda listelenen en yaygın veri türlerini anlamak önemlidir:

  • Herkese açık veriler: Halkın okuması, araştırması ve saklaması için ücretsiz olarak erişilebilen bilgiler sağlar. Genellikle minimum miktarlarda destekler veri güvenliği, çünkü kolayca paylaşılır ve bireylere veya genel kamuya zarar verme riski çok azdır. Kamuya açık verilere örnek olarak kişilerin adları, haberler ve eğitici makaleler ile bazı devlet web siteleri gösterilebilir.
  • Özel veriler: Kamuyla paylaşılmaması gereken bilgiler içerir. Bu tür bilgilerin (şifreler, tarama/araştırma geçmişi, kredi kartı numaraları (pin numaraları ve son kullanma tarihleri ​​olmadan) paylaşılması, bir kişi veya kuruluş için küçük bir risk oluşturabilir ve genellikle hızlı bir şekilde düzeltilebilir.
  • Dahili veriler: Normalde bu, özellikle bir kuruluş içinde kullanılan verileri tanımlar ve bir kuruluşun iç işlevleriyle ilgilidir. Dahili verilere örnek olarak iş planları, çalışanların kişisel bilgileri, e-postalar ve notlar verilebilir. Dahili veriler genellikle farklı güvenlik düzeylerine yayılır.
  • Gizli veriler: Gizli verilere (bazen "hassas veriler" olarak da anılır) kuruluş içinde yalnızca sınırlı sayıda kişi erişebilir. Gizli veri erişimi, içeriği görüntülemek için özel şifreler veya retina taramaları gerektirebilir. Gizli verilere örnek olarak sosyal güvenlik numaraları, tıbbi kayıtlar, pin numaraları ve son kullanma tarihleriyle birlikte kredi kartı numaraları verilebilir.
  • Kısıtlanmış veriler: Bu, ele geçirildiği takdirde büyük yasal para cezalarına veya cezai yaptırımlara yol açabilecek verilerdir. Verilere erişimi sınırlamak için genellikle çok sıkı güvenlik kontrolleri vardır ve sıklıkla bir tür veri şifrelemesi kullanır. Kötü niyetli kişiler tarafından erişilirse, bir kuruluşun özel bilgileri fidye talebiyle kopyalanabilir veya erişilemez hale getirilebilir. Kısıtlanmış veriler aynı zamanda genel halkın sağlığını riske atma potansiyeline de sahip olabilir. Kısıtlanmış verilere örnek olarak fikri mülkiyet, korunan sağlık bilgileri ve bazı federal sözleşmeler verilebilir. 

Veri Sınıflandırma Yöntemleri

Veri sınıflandırma süreci normalde veri türünü, buna karşılık gelen güvenlik düzeyini ve veri kalitesini iletmek için etiketlemeyi içerir. 

Temel olarak üç tür veri sınıflandırması geliştirilmiştir: 

  • İçerik bazlı veri sınıflandırması: Bu genellikle hassas bilgilere (finansal kayıtlar, kişisel olarak tanımlanabilir bilgiler) odaklanır ve hassas bilgileri ararken dosyaları incelemek ve yorumlamak için yazılım kullanır.
  • Bağlama dayalı veri sınıflandırması: Depolama konumunu belirlemek için uygulama, kaynak konumu veya oluşturucu gibi bağlama dayalı bilgilere odaklanan yazılım kullanır. 
  • Kullanıcı bazlı veri sınıflandırması: Görevi gerçekleştiren kişinin veri sınıflandırması konusunda bilgi sahibi olmasını gerektiren manuel bir süreç. Bu veri sınıflandırma biçimi, yazılım kullanan içerik ve bağlam tabanlı veri sınıflandırma sistemlerine göre önemli ölçüde daha yavaştır ve hataya çok daha açıktır.

Datamation sınıflandırmaya ilişkin bir inceleme yayınladı yazılım araçları 2024 için.

Uyumluluk Standartları ve Veri Sınıflandırması

Giderek artan sayıda ülke ve ABD'deki bazı eyaletler, işletmelerin ve kuruluşların bir veri sınıflandırma sistemi kurmasını gerektiren düzenlemeler ve uyumluluk standartları oluşturmuştur. Gereksinimler ülkeye, kuruluşa ve kullandığı veri türlerine bağlı olarak değişebilir. Aşağıda, uyumluluğun neden endişe verici olabileceğine dair bazı örnekler listelenmiştir.

  • Genel Veri Koruma Yönetmeliği (GDPR): Avrupa'nın vatandaşlarının mahremiyetini koruma çabaları, işletmelerin toplanan tüm verileri sınıflandırmasını gerektiren düzenlemelerle sonuçlandı. GSYİH ırk, sağlık hizmetleri, siyasi görüşler, etnik köken ve biyometri kullanımına ilişkin verilerle ilgilidir. (Çok miktarda veri depolamayan işletmeler oldukça basit bir sınıflandırma sistemi kullanabilir; amaç, talep edilen verileri AB yetkililerine hızlı ve verimli bir şekilde sağlamaktır.)
  • Ödeme Kartı Endüstrisi Veri Güvenliği Standardı (PCI DSS): Kredi kartı sektörü tarafından oluşturulan Gereksinim 9.6.1, işletmelerin ve kuruluşların "verilerin hassasiyetinin belirlenebilmesi için verileri sınıflandırması" gerektiğini şart koşuyor. Bu bir kanun değil, ama yasal bir anlaşma.
  • Sağlık Sigortası Taşınabilirlik ve Hesap Verebilirlik Yasası (HIPAA): Bu bir ABD federal yasasıdır. dikkate alır kişisel sağlık bilgilerinin (PHI) gizli bilgi olması ve tıbbi tesislerin bireylerin tıbbi kayıtlarını korumasını gerektirir. HIPAA Gizlilik Kuralı, kişisel sağlık bilgilerinin kullanımını ve ifşa edilmesini kısıtlar ve tıbbi tesislerin ve onların ortaklarının bir veri sınıflandırma sistemi geliştirmesini gerektirir.
  • Kaliforniya Tüketici Gizliliği Yasası (CCPA): The CCPA “Veri sınıflandırması, hangi veri türlerinin satıldığını, üçüncü taraflarla paylaşıldığını veya pazarlama amacıyla kullanıldığını tanımlamalıdır. Belirli veri türlerine yönelik hak talepleri de CCPA uyumlu olduğunuzun kanıtı olarak veri envanterine kaydedilmelidir."

Organizasyonlar için önemli olan Yasal kaygıları araştırmakveya internet üzerinden iş yaparken uzman tavsiyesine başvurun. 

Verileri Sınıflandırmanın Zorlukları

Veri sınıflandırma işlemi güvenlik ve veri alımı açısından oldukça faydalıdır. Ancak gelişebilecek bazı sorunlar var. Yaygın zorluklardan bazıları şunlardır:

  • Yanlış pozitifler: Bu, aynı veriler farklı bağlamlarda ve farklı formatlarda göründüğünde ve yazılım bunu kopya olarak tanımadığında meydana gelir. Verinin bağlamını ve formatını incelemeyen sınıflandırma yazılımlarının yanlış sınıflandırma üretme olasılığı daha yüksektir. Normalde sınıflandırma projelerinde büyük miktarda veri kullanıldığından, son derece küçük hatalı pozitif oranlar bile sınıflandırma sürecini bozabilir.
  • Yanlış negatifler: Bunlar bağlamla ilgili kafa karışıklığının bir sonucu olarak ortaya çıkar. Örneğin, bir ad normalde hassas bilgi olarak değerlendirilmez. Ancak tıbbi kayıtların bir parçası olduğunda bu isim hassas bilgi haline gelir. Verilerin bağlamı anlaşılmadan sınıflandırılması, verilerin yanlış sınıflandırılmasına neden olabilir.
  • Ücret: Veri sınıflandırma araçlarının uygulanması ve işletilmesinin fiyatı, oluşturulan kontrollerin sayısına ve işlenen veri miktarına bağlı olacaktır. Veri sınıflandırması oldukça pahalı ve hantal olabilir. Büyük miktarlardaki verileri sınıflandırmaya yönelik manuel çabalar son derece pahalı olabilir; daha büyük miktardaki veriler ise daha maliyetli olabilir.

ChatGPT, verileri sınıflandırmak için bir araç olarak deneniyor ancak sistemin performansıyla ilgili endişeler var. Güvenlik eksikliği.

spot_img

En Son İstihbarat

spot_img