Data yang digunakan adalah data tentang kanker kulit ganas vs kanker kulit jinak
Team details : Muhammad AL Reza Fahlopy Dharma (201810370311059) & Ansyari Aqshal Raditya JS (201810370311055)
Sprint Details : https://docs.google.com/spreadsheets/d/1JOXVMhuzVY2nOBc6XGCMeqNBSZgCfCripRGhLK6X6No/edit?usp=sharing
Link Dataset : https://www.kaggle.com/fanconic/skin-cancer-malignant-vs-benign/code
LINK source code deployment : https://github.com/MrezaFd/Deployments_Testt2 LINK source code model terbaik : https://github.com/MrezaFd/Tugas-Besar-ML-059-055-/blob/main/Model_Terbaik_deploy.ipynb
Link Heroku : (Deploy melalu local gambar hasil deploy dapat dilihat dibawah ini )
Data yang digunakan berupa data yang sudah ada dari kaggle, setelah mendownload data dari kaggle menggunakan API token, lalu dilakukan extra dan pengecekan jumlah data yang terdapat dalam dataset
Pada bagian prepocessing data dilakukan mainpulasi gambar menggunakan beberapa fungsi dari library OpenCV seperti membaca gambar(cv2,imread) dan mengubah ukuran gambar(cv2.resize). Setelah melakukan manipulasi gambar, proses selanjutnya adalah mengubah data menjadi array, lalu dilakukan pengecekan terhadap shapenya. Setelah itu melakukan normalisasi data, normalisasi data yang dilakukan adalah mengubah tipe data menjadi float agar bisa di train. Sebelum melakukan train data, data harus melalui proses penerapan label encoder yaitu merubah label data menjadi 0 dan 1
Model yang dibuat menggunakan tensorflow.kers dengan menggunakan 1 input layer, 1 hidden layer dan 1 output layer. setelah input layer, dilakukan proses mengubah matriks 150x150x3 menjadi vektor sebelum masuk ke bagian hidden layer, pada hidden layer fungsi activation yang digunakan adalah 'relu' dan pada output layer funsgi yang digunakan adalah 'softmax'. Setelah membuat model, maka proses selanjutnya adalah training model yang sudah dibuat menggunakan optimizer Adam dengan learning rate = 0.0001, dengan batch size 32, dan iterasi sebanyak 60x.
Pada bagian ini, dilakukan evaluasi terhadap model yang sudah ditraining sebelumnya menggunakan visualisasi grafik ggplot terhadap tingkat accuracy dan tingkat loss. selain menggunakan visualisasi hasil training, dilakukan juga evaluasi menggunakan classification_report untuk mengetahui tingkat accuracy dengan lebih pasti.