Machine learning (pembelajaran mesin) merupakan cabang ilmu Artificial Intelligence yang membuat komputer diberi sebuah kemampuan untuk belajar mengenai sesuatu berdasarkan data.
Jenis - Jenis Machine Learning
Supervised Learning
Supervised learning merupakan jenis machine learning yang menggunakan dataset yang sudah ada labelnya. Contohnya pada data buah yang memiliki karakteristik berbulu, kulitnya merah, berbuah putih. Karakteristik tersebut merupakan sebuah fitur yang digunakan dalam machine learning dan dapat diketahui bahwa label berdasarkan fitur tersebut adalah buah rambutan. Contoh lainnya yaitu klasifikasi spam dan bukan spam pada email.
Unsupervised Learning
Unsupervised learning merupakan kebalikan dari supervised learning. Jika pada supervised learning dataset yang digunakannya sudah terdapat labelnya, maka pada unsupervised learning dataset yang digunakan tidak terdapat label. Jenis machine learning ini biasanya digunakan dalam metode clustering, mengelompokkan data berdasarkan ciri - cirinya.
Semi Supervised Learning
Semi supervised learning merupakan penggabungan dari supervised learning dan unsupervised learning. Dataset yang digunakan sebagian memiliki label dan sebagian tidak memiliki label. Pada contoh kasus ini adalah Google Photo. Google Photo memiliki fitur pemberian tag terhadap foto yang ada, jika nantinya pengguna memasukkan foto dengan objek yang sama maka Google Photo akan memberi tag secara otomatis.
Reinforcement Learning
Reinforcement learning merupakan jenis machine learning yang mempelajari sesuatu hal berdasarkan suatu tindakan tertentu dan melihat hasilnya (belajar berdasarkan pengalaman). Contoh dari reinforcement adalah AlphaGo. AlphaGo merupakan program komputer permainan papan go yang dikembangkan oleh Google Deepmind. Program tersebut dapat memenangkan permainan melawan pemain profesional sekalipun.
Machine Learning Workflow
Exploratory Data Analysis
Exploratory data analysis (EDA) bertujuan untuk mengetahui karakteristik sebuah data, bagaimana kualitas data tersebut. EDA merupakan tahap analisis terhadapa data yang akan diolah
Data Preprocessing and Data Cleaning
Data perprocessing and data cleaning merupakan tahap untuk mengolah suatu data sehingga siap digunakan.
Model Selection
Model selection merupakan tahap pemilihan model yang akan digunakan dalam machine learning. Model yang digunakan harus sesuai dan pemilihan parameter - parameternya juga, hal tersebut untuk mendapatkan skor yang bagus.
Model Evaluation
Setelah pemilihan model sudah selesai, maka dilakukan evaluasi terhadap model tersebut. Dengan melihat performanya, dan tingkat keakuratannya terhadap data test.
Deployment
Sesudahnya model dievaluasi dan memiliki performa yang baik, maka tahap selanjutnya adalah tahap produksi atau deployment
Monitoring
Monitoring dilakukan untuk menjaga kualitas model yang sudah pada tahap produksi. Pada tahap produksi bisa saja model menemukan data yang tidak dikenal sehingga menurunkan kualitas machine learning tersebut, maka hal inilah monitoring itu penting.