Klasifikasi Aktivitas Manusia Berbasis Data Sensor Spasial dan Sudut
Repositori ini menyajikan proyek komprehensif dan approach optimal dalam Human Activity Recognition (HAR), yang berfokus pada klasifikasi aktivitas manusia melalui data sensor. Implementasi ini memanfaatkan data akselerometer dan giroskop untuk mengidentifikasi dan mengklasifikasikan berbagai aktivitas fisik.
Tujuan utama proyek ini adalah mengklasifikasikan aktivitas manusia ke dalam empat kategori spesifik:
- Melambai (Arm Waving)
- Melompat (Jumping)
- Aktivitas Olahraga (Sports Action)
- Berjalan (Walking)
Evaluasi kinerja model dilakukan menggunakan F1-Score (Macro), yang memastikan penilaian komprehensif terhadap akurasi klasifikasi di seluruh kelas aktivitas.
Dataset yang digunakan bersumber dari simulasi sensor, didistribusikan dalam tiga berkas CSV: train.csv
, validation.csv
, dan test.csv
. Setiap entri data mencakup pembacaan sensor akselerometer (Accel_X/Y/Z
) dan giroskop (Gyro_X/Y/Z
), disertai Timestamp
dan ID
unik. Kolom Activity_Type
tersedia pada set pelatihan dan validasi sebagai label target.
Catatan Penting Dataset:
- Data telah dibersihkan; tidak ditemukan nilai yang hilang atau duplikasi.
- Setiap
Timestamp
berasosiasi dengan sensor yang berbeda. - Tidak terdapat tumpang tindih
Timestamp
signifikan antar set data (pelatihan, validasi, pengujian), menjamin independensi data untuk evaluasi. - Prediksi dilakukan per
ID
, mengindikasikan bahwa setiapID
unik akan memiliki satu hasil prediksi aktivitas.
Analisis awal data menghasilkan temuan sebagai berikut:
- Distribusi Kelas Seimbang: Kategori aktivitas terdistribusi secara merata, meminimalisir potensi bias model.
- Konsistensi ID Pengguna: Jumlah sampel per
ID
pengguna menunjukkan konsistensi yang tinggi. - Pola Sensor: Nilai sensor akselerometer dan giroskop cenderung terpusat di sekitar nol. Identifikasi aktivitas sangat bergantung pada pola time series dan fitur agregat dari data sensor, bukan pada nilai instan tunggal.
- Korelasi: Korelasi linear yang kuat antar fitur sensor tidak terdeteksi secara dominan. Model berbasis pohon diharapkan mampu menangani hubungan non-linear yang mungkin ada.
Alur kerja proyek ini meliputi tahapan berikut:
- Pra-pemrosesan Data: Persiapan data untuk analisis dan pemodelan.
- Rekayasa Fitur: Ekstraksi dan pembentukan fitur informatif dari data sensor time series.
- Pengembangan Model: Konstruksi model machine learning.
- Evaluasi Model: Penilaian performa model menggunakan metrik yang relevan.
- Prediksi & Pengiriman: Generasi hasil prediksi pada set data uji.
Untuk memastikan konsistensi hasil, nilai random seed telah diatur menjadi 42
di seluruh proses implementasi.
This project is for academic purposes. Please cite appropriately if you use or adapt any part of this work. The project itself imported from Suika's team kaggle cloud notebook.
Name | GitHub Profile |
---|---|
Rahardi Salim | @RahardiSalim |
Christian Yudistira Hermawan | @Nadekoooo |
Vincent Davis Leonard Tjoeng | @Vincent-Davis |