Skip to content

initialgr/preprocessing-ocr

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

2 Commits
Β 
Β 
Β 
Β 

Repository files navigation

πŸ“„ OCR KTP Preprocessing & Validation (Google Colab)

πŸ“Œ Deskripsi Project

Project ini bertujuan melakukan preprocessing gambar Kartu Tanda Penduduk (KTP) untuk meningkatkan akurasi ekstraksi teks menggunakan Tesseract OCR. Setelah proses Optical Character Recognition (OCR) selesai, hasil yang didapat akan divalidasi dengan data ground truth melalui perhitungan akurasi, confusion matrix, dan rata-rata persentase huruf yang terbaca benar.

πŸ› οΈ Tools & Library

Proyek ini dikembangkan menggunakan bahasa pemrograman Python 3 di lingkungan Google Colab, serta memanfaatkan beberapa library utama:

  • Python 3: Bahasa pemrograman utama.
  • Google Colab: Lingkungan pengembangan berbasis cloud.
  • OpenCV (cv2): Untuk berbagai operasi pemrosesan gambar (Image Processing).
  • Tesseract OCR: Mesin OCR utama yang digunakan (dengan dukungan Bahasa Indonesia).
  • Pytesseract: Wrapper Python untuk Tesseract OCR.
  • Scikit-learn (sklearn): Digunakan untuk perhitungan confusion matrix, precision, recall, dan F1-score.
  • Pandas: Untuk pembuatan laporan tabel yang terstruktur dan analisis data.
  • Matplotlib: Untuk visualisasi gambar dan hasil preprocessing.

πŸ”§ Fitur Project

Proyek ini mencakup fitur-fitur penting dalam alur kerja OCR:

Preprocessing Gambar

  • Grayscale: Konversi gambar ke skala abu-abu untuk menyederhanakan data piksel.
  • Thresholding (Binary): Transformasi gambar menjadi hitam-putih untuk memisahkan teks dari latar belakang.
  • Denoising (fastNlMeansDenoisingColored): Pengurangan noise pada gambar berwarna untuk meningkatkan kualitas input OCR.
  • CLAHE (Contrast Limited Adaptive Histogram Equalization): Peningkatan kontras gambar secara adaptif untuk menonjolkan detail teks di area yang berbeda.

Ekstraksi OCR

  • Melakukan ekstraksi teks menggunakan Tesseract OCR dengan konfigurasi khusus untuk Bahasa Indonesia.

Evaluasi Hasil

  • Perbandingan Hasil OCR vs Ground Truth: Melihat perbedaan langsung antara teks yang diekstraksi dan data sebenarnya.
  • Confusion Matrix: Analisis detail performa klasifikasi karakter.
  • Precision, Recall, F1-Score, Akurasi: Metrik standar untuk mengukur kinerja OCR secara keseluruhan.
  • Rata-rata huruf terbaca benar: Perhitungan persentase akurasi pada level karakter.

πŸš€ Cara Menjalankan (Google Colab)

Ikuti langkah-langkah mudah berikut untuk menjalankan proyek ini di Google Colab:

  1. Upload Gambar KTP: Siapkan gambar KTP Anda (dalam format .jpg atau .png) dan unggah ke lingkungan Google Colab.
  2. Jalankan Kode: Eksekusi seluruh sel kode dalam notebook Google Colab dari atas ke bawah secara berurutan.

Proses yang akan berjalan:

  • Sistem akan menampilkan visualisasi gambar KTP setelah melalui setiap tahap preprocessing.
  • Teks hasil ekstraksi OCR akan ditampilkan.
  • Laporan validasi hasil OCR akan disajikan dalam bentuk tabel dan metrik evaluasi yang komprehensif.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published