Logo Zephyrnet

Jenis Machine Learning dan Aplikasinya – DATAVERSITY

Tanggal:

jenis pembelajaran mesinjenis pembelajaran mesin

Komputer telah menjadi sangat umum sehingga hampir setiap aspek kehidupan kita berputar di sekitar penggunaannya, namun mesin tidak kehilangan kemampuannya untuk membuat kita takjub. Teknologi terbaru yang mencengangkan adalah kemampuan komputer untuk mempelajari sendiri keterampilan baru dengan menganalisis data dalam jumlah besar. Berbagai jenis pembelajaran mesin berjanji untuk membuat rumah dan tempat kerja kita lebih aman, akses kita ke informasi lebih mudah, dan hidup kita lebih sehat.

Pembelajaran mesin menerapkan algoritme canggih ke kumpulan data masif dengan tujuan memungkinkan komputer "belajar tanpa diprogram secara eksplisit", sebagai pelopor kecerdasan buatan Arthur Samuel dijelaskan pada tahun 1950-an. Data melatih model pembelajaran yang dipilih pengembang sistem untuk melakukan tugas tertentu, seperti mengidentifikasi pola atau memprediksi masa depan. Pengembang menyesuaikan model pembelajaran untuk membuat pencocokan pola atau ramalannya lebih akurat.

Jika Anda telah menggunakan sistem ucapan-ke-teks, berinteraksi dengan chatbot, atau mengikuti rekomendasi yang dibuat oleh Amazon atau Netflix, Anda telah pengalaman tangan pertama dengan pembelajaran mesin (ML). Namun, aplikasi ini hanyalah bayangan dari kekuatan dan janji ML untuk meningkatkan kehidupan dan penghidupan kita. Berikut adalah tampilan berbagai jenis pembelajaran mesin, bagaimana kita dapat menggunakannya, dan apa yang akan terjadi di masa depan untuk masing-masingnya.

Pembelajaran Mesin yang Diawasi

In pembelajaran mesin yang diawasi, model dilatih dengan menerapkan kumpulan data berlabel, yang dianotasi sebelumnya untuk mengidentifikasi karakteristik data mentah, seperti gambar, teks, atau video, serta untuk menjelaskan konteks data. Model menyesuaikan bobotnya secara otomatis saat menerima lebih banyak data untuk meningkatkan akurasi analisis dan prediksinya.

Kumpulan data yang digunakan untuk melatih model memasok input dan output yang benar, yang memungkinkan model untuk mendekati output yang diinginkan lebih dekat dengan setiap iterasi. Akurasi ditentukan oleh algoritma fungsi kerugian, yang menunjukkan akurasi prediksi tinggi ketika fungsi kerugian rendah. Dua jenis operasi dalam pembelajaran mesin yang diawasi adalah klasifikasi dan regresi:

  • Klasifikasi mengkategorikan data uji dengan mengidentifikasi dan melabeli entitas kumpulan data. Algoritme klasifikasi umum termasuk pengklasifikasi linier, mesin vektor dukungan (SVM), pohon keputusan, tetangga terdekat k, dan hutan acak, yang menerapkan beberapa pohon keputusan.
  • Regresi meneliti hubungan antara variabel dependen dan independen sebagai cara untuk meramalkan hasil masa depan, seperti memproyeksikan pendapatan penjualan perusahaan. Di antara algoritma regresi yang paling banyak digunakan adalah regresi linier, regresi logistik, dan regresi polinomial.

Selain memprediksi penjualan bisnis, ML yang diawasi juga digunakan untuk perkiraan ayunan di pasar saham, mengidentifikasi pasien yang paling berisiko mengalami gagal jantung, membedakan sel kanker dari yang sehat, meramalkan cuaca, mendeteksi spam, dan mengenali wajah.

Pembelajaran Mesin Tanpa Pengawasan

Kumpulan data yang digunakan untuk melatih model pembelajaran mesin tanpa pengawasan tidak perlu diberi label terlebih dahulu. Algoritma ML jenis ini dapat menentukan perbedaan dan kesamaan data tanpa ada preprocessing oleh manusia. Tiga fungsi utama pembelajaran mesin tanpa pengawasan adalah pengelompokan, aturan asosiasi, dan pengurangan dimensi.

  • Kekelompokan menempatkan data yang tidak berlabel dalam kelompok dengan mengidentifikasi atribut yang mirip atau berbeda dalam struktur atau polanya. Misalnya, pengelompokan eksklusif membuat grup yang berisi satu jenis data, sementara pengelompokan yang tumpang tindih memungkinkan tipe data tertentu ada di beberapa grup sekaligus. Dua jenis pengelompokan lainnya adalah pengelompokan hierarki, yang menggabungkan kelompok data yang terpisah ke dalam satu kluster secara iteratif, dan pengelompokan probabilistik, yang mengelompokkan titik data berdasarkan kemungkinan bahwa mereka adalah anggota dari distribusi probabilitas tertentu.
  • Aturan asosiasi mengidentifikasi hubungan antara variabel dalam kumpulan data dengan menerapkan seperangkat aturan, seperti bagaimana produk dalam keranjang pasar berhubungan satu sama lain. Hal ini memungkinkan perusahaan untuk lebih memahami bagaimana berbagai produknya terkait, sehingga mereka dapat memperoleh wawasan tentang perilaku konsumen. Salah satu contoh analisis aturan asosiasi adalah algoritma apriori, yang mengidentifikasi kemungkinan konsumen memilih satu produk segera setelah memilih yang lain.
  • Pengurangan dimensi membantu meningkatkan akurasi algoritme pembelajaran mesin tanpa pengawasan dengan mengurangi jumlah fitur dalam set data. Ini mengatasi hilangnya akurasi karena masuknya terlalu banyak fitur data, atau dimensi, di set. Teknik ini berupaya menjaga integritas dataset sambil mengekstrak input data yang tidak perlu. Jenis reduksi dimensi meliputi analisis komponen utama (PCA), yang memampatkan kumpulan data dengan menghapus redudansi; dekomposisi nilai singular (SVD), yang mengekstrak noise dari file gambar dan data lainnya; Dan autoencoder, yang menerapkan jaringan saraf untuk membuat versi baru yang lebih kecil dari kumpulan data asli.

Umum aplikasi untuk pembelajaran mesin tanpa pengawasan memprediksi kapan dan di mana serangan siber kemungkinan akan terjadi, merampingkan produksi di lingkungan manufaktur, sistem penghindaran kecelakaan pada kendaraan bermotor, dan mempersonalisasi pengalaman berbelanja untuk pelanggan pengecer.

Pembelajaran Mesin Semi-Diawasi

Jenis pembelajaran mesin ini menggunakan data berlabel dan tidak berlabel, sehingga ini berfungsi sebagai metode perantara ketika pembelajaran terawasi atau tidak terawasi adalah pilihan terbaik untuk aplikasi tertentu. Pembelajaran mesin semi-diawasi algoritme merespons titik data tertentu secara berbeda berdasarkan apakah titik tersebut diberi label atau tidak:

  • Untuk data berlabel, bobot model disesuaikan dengan menggunakan anotasi yang diterapkan pada tahap prapemrosesan, sama seperti saat menggunakan pendekatan terawasi.
  • Untuk data yang tidak berlabel, model mendasarkan koreksinya pada pola yang diidentifikasi dalam kumpulan data pelatihan yang serupa.

Dengan menggunakan beberapa kumpulan data tak berlabel selain data berlabel, pembelajaran semi-diawasi mengurangi jumlah anotasi manual yang diperlukan sistem, yang memangkas biaya dan mempersingkat waktu pengembangan tanpa mengurangi keakuratan algoritme. Teknik ini membuat beberapa asumsi tentang hubungan antar objek dalam dataset model:

  • Asumsi kontinuitas menyiratkan bahwa objek yang berdekatan satu sama lain lebih mungkin untuk berbagi label atau kelompok yang sama, sebuah asumsi bahwa pembelajaran yang diawasi juga dibuat dengan menambahkan batas keputusan. Perbedaannya adalah bahwa pembelajaran semi-diawasi menambahkan batasan keputusan dengan asumsi kelancaran dalam batasan kepadatan rendah.
  • Asumsi gugus membagi dataset menjadi cluster diskrit dan menerapkan label keluaran yang sama ke semua titik data dalam cluster.
  • Asumsi yang bermacam-macam didasarkan pada jarak dan kepadatan dalam dataset. Metode mengubah distribusi data berdimensi tinggi menjadi ruang berdimensi rendah yang disebut manifold. Misalnya, ruang tiga dimensi direduksi menjadi bidang koordinat dua dimensi, yang memungkinkan model untuk belajar tanpa memerlukan banyak data atau pemrosesan.

Pembelajaran semi-diawasi seringkali merupakan pendekatan optimal saat algoritme memproses sejumlah besar data, dan saat mengidentifikasi fitur yang relevan menjadi tantangan. Gunakan kasus yang termasuk dalam kategori ini meliputi pengolahan citra medis, pengenalan ucapan, klasifikasi konten web, dan kategorisasi dokumen teks.

Pembelajaran Penguatan

Grafik penguatan pengetahuan teknik untuk pembelajaran mesin menggunakan coba-coba untuk menghargai hasil positif dan menghukum yang negatif. Sistem ini bekerja dengan memberikan nilai positif pada tindakan atau perilaku target dan nilai negatif pada semua respons lainnya. Agen pembelajaran penguatan diprogram untuk menemukan rute ke nilai jangka panjang maksimum. Metode ini berlaku kapan pun hadiah dapat diidentifikasi, seperti dalam permainan dan saat membuat rekomendasi yang dipersonalisasi.

Penerapan pembelajaran penguatan telah dibatasi hingga saat ini oleh kebutuhan untuk mempertahankan peta perubahan lingkungan yang akurat. Setiap perubahan pada parameter model yang diketahui mengharuskannya menjalankan rutinitas trial-and-error untuk menentukan opsi dengan nilai tertinggi. Melakukannya berulang kali membutuhkan banyak waktu dan komputasi, terutama di lingkungan dunia nyata yang kompleks. Tiga jenis algoritme pembelajaran penguatan adalah Q-learning, deep Q-networks, dan state-action-reward-state-action (SARSA):

  • Q-belajar ("Q" adalah singkatan dari "kualitas") mencoba untuk menentukan seberapa berguna suatu tindakan tertentu dalam mewujudkan hadiah target, atau nilai-Q. Itu disebut sebuah algoritma di luar kebijakan karena belajar dari operasi yang bukan bagian dari kebijakan saat ini. Contohnya adalah kemampuan algoritme untuk mengambil tindakan acak yang tidak memerlukan kebijakan yang ada.
  • Jaringan Q yang dalam adalah jaringan saraf dilatih oleh algoritma Q-learning yang mendalam dengan tujuan mengatasi kebutuhan sumber daya yang tinggi dari teknik Q-learning. Neural network mendekati nilai Q untuk setiap pasangan state-action. Jaringan mengubah input status menjadi nilai-Q untuk semua tindakan potensial.
  • SARS adalah bentuk Q-learning yang menghitung hadiah untuk suatu tindakan dengan menambahkan tindakan kedua selain hadiah tindakan awal. Tindakan kedua didasarkan pada kebijakan yang telah dipelajari oleh algoritme, jadi hadiah untuk pasangan tindakan-status pertama diatur ulang sesuai dengan hasil yang baru.

Diantara aplikasi untuk pembelajaran penguatan adalah kendaraan tanpa pengemudi, otomasi industri, keuangan dan perdagangan saham, pemrosesan bahasa alami, perencanaan perawatan kesehatan, rekomendasi berita, penawaran waktu nyata untuk iklan online, dan robot industri.

Apa yang ada di masa depan?

Berbagai jenis pembelajaran mesin dan bentuk kecerdasan buatan lainnya mengubah caranya organisasi memanfaatkan teknologi data untuk mencapai tujuan strategis mereka dan mendapatkan keunggulan kompetitif. Kemajuan ini memungkinkan perusahaan untuk mengotomatiskan lebih banyak proses bisnis mereka dan mewujudkan pengembalian yang lebih besar atas investasi mereka dalam platform intelijen bisnis. Melanjutkan penyempurnaan metode AI diharapkan dapat mengarah pada pembelajaran mesin jenis baru yang akan membuat operasi bisnis lebih cepat, lebih gesit, dan lebih efisien. 

Gambar yang digunakan di bawah lisensi dari Shutterstock.com

tempat_img

Kafe VC

Kafe VC

Intelijen Terbaru

tempat_img