Project ini bertujuan melakukan preprocessing gambar Kartu Tanda Penduduk (KTP) untuk meningkatkan akurasi ekstraksi teks menggunakan Tesseract OCR. Setelah proses Optical Character Recognition (OCR) selesai, hasil yang didapat akan divalidasi dengan data ground truth melalui perhitungan akurasi, confusion matrix, dan rata-rata persentase huruf yang terbaca benar.
Proyek ini dikembangkan menggunakan bahasa pemrograman Python 3 di lingkungan Google Colab, serta memanfaatkan beberapa library utama:
- Python 3: Bahasa pemrograman utama.
- Google Colab: Lingkungan pengembangan berbasis cloud.
- OpenCV (
cv2
): Untuk berbagai operasi pemrosesan gambar (Image Processing). - Tesseract OCR: Mesin OCR utama yang digunakan (dengan dukungan Bahasa Indonesia).
- Pytesseract: Wrapper Python untuk Tesseract OCR.
- Scikit-learn (
sklearn
): Digunakan untuk perhitungan confusion matrix, precision, recall, dan F1-score. - Pandas: Untuk pembuatan laporan tabel yang terstruktur dan analisis data.
- Matplotlib: Untuk visualisasi gambar dan hasil preprocessing.
Proyek ini mencakup fitur-fitur penting dalam alur kerja OCR:
- Grayscale: Konversi gambar ke skala abu-abu untuk menyederhanakan data piksel.
- Thresholding (Binary): Transformasi gambar menjadi hitam-putih untuk memisahkan teks dari latar belakang.
- Denoising (
fastNlMeansDenoisingColored
): Pengurangan noise pada gambar berwarna untuk meningkatkan kualitas input OCR. - CLAHE (Contrast Limited Adaptive Histogram Equalization): Peningkatan kontras gambar secara adaptif untuk menonjolkan detail teks di area yang berbeda.
- Melakukan ekstraksi teks menggunakan Tesseract OCR dengan konfigurasi khusus untuk Bahasa Indonesia.
- Perbandingan Hasil OCR vs Ground Truth: Melihat perbedaan langsung antara teks yang diekstraksi dan data sebenarnya.
- Confusion Matrix: Analisis detail performa klasifikasi karakter.
- Precision, Recall, F1-Score, Akurasi: Metrik standar untuk mengukur kinerja OCR secara keseluruhan.
- Rata-rata huruf terbaca benar: Perhitungan persentase akurasi pada level karakter.
Ikuti langkah-langkah mudah berikut untuk menjalankan proyek ini di Google Colab:
- Upload Gambar KTP: Siapkan gambar KTP Anda (dalam format
.jpg
atau.png
) dan unggah ke lingkungan Google Colab. - Jalankan Kode: Eksekusi seluruh sel kode dalam notebook Google Colab dari atas ke bawah secara berurutan.
Proses yang akan berjalan:
- Sistem akan menampilkan visualisasi gambar KTP setelah melalui setiap tahap preprocessing.
- Teks hasil ekstraksi OCR akan ditampilkan.
- Laporan validasi hasil OCR akan disajikan dalam bentuk tabel dan metrik evaluasi yang komprehensif.