Apa itu machine learning?
Machine learning adalah ilmu pengembangan algoritme dan model secara statistik yang di gunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit, mengandalkan pola dan inferensi sebagai gantinya. Sistem komputer menggunakan algoritme machine learning untuk memproses data historis berjumlah besar dan mengidentifikasi pola data. Hal ini memungkinkannya untuk memprediksi hasil yang lebih akurat dari set data input yang di berikan. Misalnya, ilmuwan data dapat melatih aplikasi medis untuk mendiagnosis kanker dari citra sinar-x dengan cara menyimpan jutaan citra pindaian dan diagnosis yang sesuai.
Mengapa machine learning itu penting?
Seperti yang kita ketahui Machine learning membantu bisnis dengan cara mendorong pertumbuhan, membuka aliran pendapatan baru, dan menyelesaikan masalah-masalah yang menantang. Data adalah penggerak yang penting di balik pengambilan keputusan bisnis, tetapi secara tradisional, perusahaan telah menggunakan data dari berbagai sumber, seperti umpan balik pelanggan, karyawan, dan keuangan. Penelitian machine learning mengotomatiskan dan mengoptimalkan proses ini. Dengan menggunakan perangkat lunak yang menganalisis data bervolume besar dengan kecepatan tinggi, bisnis akan dapat mencapai hasil secara lebih cepat.
Di mana machine learning digunakan?
Mari perhatikan aplikasi machine learning di beberapa industri kunci:
Manufaktur
Teknologi Machine learning dapat mendukung pemeliharaan prediktif, kontrol kualitas, dan riset inovatif dalam sektor manufaktur. Teknologi machine learning juga membantu perusahaan meningkatkan solusi logistik, termasuk aset, rantai pasokan, dan manajemen inventaris. Misalnya, raksasa manufaktur 3M menggunakan AWS Machine Learning untuk menginovasi ampelas. Algoritme machine learning memungkinkan para peneliti 3M untuk menganalisis cara perubahan kecil dalam bentuk, ukuran, dan orientasi dapat meningkatkan sifat abrasif serta daya tahan. Saran-saran tersebut menginformasikan proses manufaktur.
Pemeliharaan kesehatan dan ilmu hayat
Perkembangan sensor dan perangkat sandangan telah menghasilkan volume data kesehatan yang signifikan. Program machine learning dapat menganalisis informasi ini dan mendukung para dokter mendiagnosis serta merawat secara waktu nyata. Para peneliti machine learning sedang mengembangkan solusi yang mendeteksi tumor kanker dan mendiagnosis penyakit mata, yang memengaruhi hasil kondisi kesehatan manusia secara signifikan. Misalnya, Cambia Health Solutions menggunakan AWS Machine Learning untuk mendukung perusahaan rintisan pemeliharaan kesehatan tempat mereka dapat mengotomatiskan dan menyesuaikan perawatan untuk wanita hamil.
Layanan keuangan
Proyek machine learning keuangan meningkatkan analitik dan regulasi risiko. Teknologi machine learning dapat memungkinkan para investor untuk mengidentifikasi peluang baru dengan cara menganalisis pergerakan pasar saham, mengevaluasi pengelola investasi global, atau melakukan kalibrasi portofolio keuangan. Selain itu, teknologi machine learning dapat membantu mengidentifikasi klien pinjaman berisiko tinggi dan mengurangi tanda-tanda penipuan. Perangkat lunak keuangan terkemuka Intuit menggunakan sistem AWS Machine Learning, Amazon Textract, untuk membuat manajemen keuangan yang lebih terpersonalisasi dan membantu pengguna akhir meningkatkan kondisi keuangan mereka.
Retail
Retail dapat menggunakan machine learning untuk meningkatkan layanan pelanggan, manajemen stok, pemasaran upselling dan lintas saluran. Misalnya,Amazon Fulfillment (AFT) dapat memotong biaya infrastruktur hingga 40 persen menggunakan model machine learning untuk mengidentifikasi inventaris yang salah tempat. Hal ini membantu mereka, sesuai janji Amazon, untuk memastikan bahwa item akan tersedia bagi para pelanggan dan tiba tepat waktu, kendati mereka perlu memproses jutaan pengiriman global setiap tahun.
Media dan hiburan
Perusahaan hiburan beralih ke machine learning untuk lebih memahami audiens target mereka dan memberikan konten yang imersif, terpersonalisasi, dan sesuai permintaan. Algoritme machine learning dilakukan deployment untuk mendesain trailer serta iklan lainnya, memberikan rekomendasi konten yang di personalisasi kepada konsumen, dan bahkan menyederhanakan produksi.
Misalnya, Disney menggunakan AWS Deep Learning untuk mengarsipkan pustaka media mereka. Alat machine learning AWS secara otomatis menandai, mendeskripsikan, dan menyortir konten media, sehingga memungkinkan penulis dan animator Disney untuk mencari dan membiasakan diri dengan karakter Disney secara cepat.
Bagaimana cara kerja machine learning?
Gagasan utama di balik machine learning adalah hubungan matematis yang ada antara semua kombinasi data input dan output. Model machine learning tidak mengetahui hubungan ini sebelumnya, tetapi dapat menerka jika di berikan set data yang cukup. Hal ini berarti setiap algoritme machine learning di bangun di seputar fungsi matematika yang dapat di modifikasi. Prinsip yang mendasarinya dapat di pahami seperti ini:
- Kami “melatih” algoritme tersebut dengan memberinya kombinasi input/output (i,o) berikut – (2,10), (5,19), dan (9,31)
- Algoritme tersebut mengomputasi hubungan antara input dan output menjadi: o=3*i+4
- Selanjutnya, kami memberinya input 7 dan memintanya untuk memprediksi output. Algoritme tersebut dapat secara otomatis menentukan output-nya menjadi 25.
Meskipun ini adalah pemahaman dasar, machine learning berfokus pada prinsip bahwa semua poin data kompleks dapat di hubungkan secara matematis oleh sistem komputer selama sistem komputer tersebut memiliki data dan daya komputasi yang cukup untuk memproses data tersebut. Oleh karena itu, keakuratan output tersebut secara langsung berkorelasi dengan besarnya input yang di berikan.
Apa saja tipe algoritme machine learning?
Algoritme dapat di kelompokkan berdasarkan empat gaya belajar yang berbeda tergantung pada output yang di perkirakan dan tipe input.
- Machine learning yang di awasi
- Machine learning yang tidak di awasi
- Pembelajaran yang semi-di awasi
- Machine learning penguatan
1. Machine learning yang diawasi
Ilmuwan data memasok algoritme dengan data pelatihan yang di beri label dan di tentukan untuk menilai korelasi. Sampel data menentukan baik input maupun output algoritme. Misalnya, gambar angka tulisan tangan diberi anotasi untuk menunjukkan angka yang sesuai. Sistem pembelajaran yang di awasi dapat mengenali klaster piksel dan bentuk yang terkait dengan setiap angka, jika di berikan contoh yang cukup. Sistem pembelajaran tersebut pada akhirnya akan mengenali angka tulisan tangan, yang dengan reliabel membedakan antara angka 9 dan 4 atau 6 dan 8.
Kekuatan pembelajaran yang di awasi adalah kesederhananaan dan kemudahan desainnya. Sistem pembelajaran ini sangat berguna saat memprediksi kemungkinan set hasil yang terbatas, membagi data ke dalam kategori, atau mengombinasikan hasil dari dua algoritme machine learning lainnya. Namun, melabeli jutaan set data tidak berlabel adalah hal yang menantang. Mari lihat lebih dekat hal berikut:
Apa itu pelabelan data?
Pelabelan data adalah proses menggolongkan data input dengan nilai output di tentukan yang terkait. Data pelatihan berlabel di perlukan untuk pembelajaran yang diawasi. Misalnya, jutaan gambar apel dan pisang perlu di tandai dengan kata “apel” atau “pisang.” Kemudian, aplikasi machine learning dapat menggunakan data pelatihan ini untuk menerka nama buah saat diberi sebuah gambar buah. Namun, melabeli jutaan data yang baru mungkin menjadi tugas yang memakan waktu dan menantang. Layanan crowd-working seperti Amazon Mechanical Turk dapat mengatasi keterbatasan algoritme pembelajaran yang di awasi ini sampai batas tertentu. Layanan ini menyediakan akses ke kolam besar tenaga kerja terjangkau yang tersebar di seluruh dunia, sehingga dapat mengurangi kesulitan dalam akuisisi data.
2. Machine learning yang tidak diawasi
Algoritme pembelajaran yang tidak di awasi melatih data tidak berlabel dan memindai melalui data baru, yang berupaya membangun hubungan penting antara input dan output yang telah di tentukan. Algoritme ini dapat menemukan pola dan menggolongkan data. Misalnya, algoritme yang tidak di awasi dapat mengelompokkan artikel berita dari situs berita yang berbeda ke dalam kategori umum seperti olahraga, kriminal, dll. Algoritme ini dapat menggunakan pemrosesan bahasa alami untuk memahami makna dan emosi dalam artikel tersebut. Dalam retail, pembelajaran yang tidak di awasi dapat menemukan pola dalam pembelian pelanggan dan memberikan hasil analisis data seperti — pelanggan kemungkinan besar akan membeli roti jika membeli mentega juga.
Pembelajaran yang tidak di awasi berguna untuk rekognisi pola, deteksi anomali, dan mengelompokkan data secara otomatis ke dalam beberapa kategori. Karena data pelatihan tidak memerlukan pelabelan, pengaturannya menjadi mudah. Algoritme ini juga dapat di gunakan untuk membersihkan dan memproses data untuk pemodelan lebih lanjut secara otomatis. Keterbatasan metode ini adalah tidak dapat memberikan prediksi yang presisi. Selain itu, metode ini tidak dapat memilih hasil data tipe tertentu secara independen.
3. Pembelajaran yang semi-diawasi
Seperti namanya, metode ini menggabungkan pembelajaran yang di awasi dan yang tidak di awasi. Teknik ini mengandalkan penggunaan sejumlah kecil data berlabel dan sejumlah besar data tidak berlabel untuk melatih sistem. Pertama, data berlabel di gunakan untuk melatih algoritme machine-learning secara parsial. Setelah itu, algoritme yang di latih secara parsial itu sendiri melabeli data yang tidak berlabel. Proses ini di sebut pelabelan semu. Model tersebut kemudian di latih kembali pada campuran data yang di hasilkan tanpa di program secara eksplisit.
Keuntungan metode ini adalah Anda tidak memerlukan data berlabel dalam jumlah besar. Metode ini berguna saat mengerjakan data seperti dokumen panjang yang akan terlalu memakan waktu dalam pembacaan dan pelabelan bagi manusia.
4. Pembelajaran penguatan
Pembelajaran penguatan adalah metode yang memiliki nilai penghargaan tersemat pada langkah-langkah berbeda yang harus di lalui oleh algoritme. Jadi, tujuan model ini adalah untuk mengakumulasi poin penghargaan sebanyak mungkin dan pada akhirnya mencapai tujuan akhir. Sebagian besar aplikasi praktis pembelajaran penguatan dalam dekade terakhir adalah berada di ranah gim video. Algoritme pembelajaran penguatan yang canggih telah mencapai hasil yang mengesankan dalam gim-gim klasik dan modern, yang sering kali secara signifikan mengalahkan pasangan manusia mereka.
Meskipun metode ini paling baik bekerja dalam lingkungan data yang tidak pasti dan kompleks, metode ini jarang diterapkan dalam konteks bisnis. Metode ini tidak efisien untuk tugas yang terdefinisi dengan baik, dan bias developer dapat memengaruhi hasil. Karena ilmuwan data mendesain penghargaan, mereka dapat memengaruhi hasilnya.
Apakah model machine learning bersifat deterministik?
Jika sebuah output sistem dapat di prediksi, maka output sistem ini dapat di katakan deterministik. Sebagian besar aplikasi perangkat lunak merespons tindakan pengguna dengan cara yang dapat di prediksi, sehingga Anda dapat berkata: “Jika pengguna melakukan ini, maka dia akan mendapatkan itu.” Namun, algoritme machine learning belajar melalui pengamatan beserta dengan pengalaman. Oleh karena itu, algoritme ini bersifat probabilistik. Pernyataan sekarang berubah menjadi: “Jika pengguna melakukan ini, ada kemungkinan X% hal itu terjadi.”
Dalam machine learning, determinisme adalah strategi yang di gunakan saat menerapkan metode pembelajaran yang di jelaskan di atas. Salah satu metode pelatihan yang diawasi, tidak di awasi, dan metode pelatihan lainnya dapat di buat deterministik tergantung pada hasil yang di inginkan bisnis. Rumusan masalah, pengambilan data, struktur, dan keputusan penyimpanan akan menentukan apakah strategi deterministik atau non-deterministik diadopsi.
Pendekatan deterministik vs. probabilistik
Pendekatan deterministik berfokus pada akurasi dan jumlah data yang di kumpulkan, sehingga efisiensi lebih di prioritaskan daripada ketidakpastian. Di sisi lain, proses non-deterministik (atau probabilistik) di desain untuk mengelola faktor peluang. Alat bawaan terintegrasi ke dalam algoritme machine learning untuk membantu menghitung, mengidentifikasi, serta mengukur ketidakpastian selama pembelajaran dan observasi.
Apa itu deep learning?
Deep learning adalah tipe teknik machine learning yang di modelkan pada otak manusia. Algoritme deep learning menganalisis data dengan struktur logika yang mirip dengan yang di gunakan oleh manusia. Deep learning menggunakan sistem cerdas yang di sebut jaringan neural buatan untuk memproses informasi yang berlapis-lapis. Data mengalir dari lapisan input melalui beberapa lapisan jaringan neural tersembunyi yang “dalam” sebelum muncul ke lapisan output. Lapisan tersembunyi tambahan mendukung pembelajaran yang jauh lebih mampu di bandingkan model machine learning standar.
Apa itu jaringan neural buatan?
Lapisan deep learning adalah simpul jaringan neural buatan (ANN) yang beroperasi seperti neuron otak manusia. Simpul dapat berupa kombinasi perangkat keras dan perangkat lunak. Setiap lapisan dalam algoritme deep learning di buat dari simpul ANN. Setiap simpul, atau neuron buatan, saling terhubung dengan yang lainnya dan memiliki angka nilai terkait dan nilai ambang batas. Sebuah simpul mengirimkan angka nilainya sebagai sebuah input ke simpul lapisan berikutnya saat di aktifkan. Simpul ini di aktifkan hanya jika output-nya di atas nilai ambang batas yang di tentukan. Jika tidak, tidak ada data yang akan di teruskan.
Apa itu penglihatan komputer?
Penglihatan komputer adalah aplikasi deep learning di dunia nyata. Seperti halnya kecerdasan buatan yang memungkinkan komputer untuk berpikir — penglihatan komputer memungkinkan komputer untuk melihat, mengamati, dan merespons. Mobilotonom menggunakan penglihatan komputer untuk “membaca” rambu-rambu jalan. Kamera mobil menangkap foto rambu-rambu tersebut. Foto tersebut dikirim ke algoritme deep learning dalam mobil. Lapisan tersembunyi yang pertama mendeteksitepian, lapisan selanjutnya membedakan warna, sedangkan lapisan yang ketiga mengidentifikasi detail alfabet pada rambu-rambu. Algoritme memprediksi bahwa rambu-rambu terbaca STOP, dan mobil merespons dengan memicu mekanisme rem.
Apakah machine learning dan deep learning itu sama?
Pengertian Deep learning adalah sub-kumpulan machine learning. Algoritme deep learning dapat di anggap sebagai evolusi algoritme machine learning yang canggih maupun kompleks secara matematis.
Apakah machine learning dan kecerdasan buatan itu sama?
Jawaban singkatnya adalah tidak. Meskipun istilah Machine learning dan Kecerdasan Buatan (AI) dapat di gunakan secara bergantian, keduanya tidaklah sama. Kecerdasan Buatan adalah istilah payung untuk strategi dan teknik yang berbeda, yang di gunakan untuk membuat mesin menjadi lebih mirip manusia. AI mencakup semua hal mulai dari asisten cerdas seperti Alexa hingga penyedot debu robotik dan mobil otonom. Machine learning adalah satu di antara banyak cabang Kecerdasan Buatan lainnya. Walaupun machine learning adalah AI, semua aktivitas AI tidak dapat disebut machine learning.
Apakah machine learning dan ilmu data itu sama?
Tidak, machine learning dan ilmu data tidaklah sama. Ilmu data adalah bidang studi yang menggunakan pendekatan ilmiah untuk mengekstraksi makna dan wawasan dari data. Ilmuwan data menggunakan berbagai alat untuk analisis data, dan machine learning adalah salah satu alat tersebut. Ilmuwan data memahami gambaran yang lebih besar seputar data seperti model bisnis, domain, dan pengumpulan data, sedangkan machine learning adalah proses komputasi yang hanya menangani data mentah.
Apa saja keuntungan dan kerugian machine learning?
Mari lihat beberapa hal yang dapat di lakukan dan yang tidak dapat di lakukan oleh machine learning:
Keuntungan model machine learning:
- Dapat mengidentifikasi tren dan pola data yang mungkin di lewatkan manusia.
- Dapat bekerja tanpa intervensi manusia setelah di siapkan. Misalnya, machine learning di perangkat lunak keamanan siber dapat memantau dan mengidentifikasi penyimpangan di lalu lintas jaringan tanpa input administrator.
- Hasil dapat menjadi lebih akurat dari waktu ke waktu.
- Dapat menangani berbagai format data dalam lingkungan data yang dinamis, bervolume tinggi, dan kompleks.
Kerugian model machine learning:
- Pelatihan awal merupakan proses yang mahal dan memakan waktu. Mungkin sulit di implementasikan jika tidak tersedia cukup data.
- Ini adalah proses komputasi intensif yang membutuhkan investasi awal yang besar jika perangkat keras di siapkan di rumah.
- Mungkin sulit untuk menginterpretasikan hasil dengan benar dan mengeliminasi ketidakpastian tanpa bantuan ahli.
Editor : Muhamad Rhedy Kustanto