Name	Name	Last commit message	Last commit date
parent directory ..
Annales	Annales
Cours	Cours
Ressources	Ressources
TDs-TPs	TDs-TPs
README.md	README.md

Sommaire

Informations
- Examens
- Ressources
Analyse d'une image
- Representation mathématiques des images
- Distance entre deux pixels
- Connexité
- Histrogramme
Traitement ↺
- Explication au tableau pour TP3
- Suite du cours en pdf
- Système visuel humain
- Erosion, dilatation, ouverture, fermeture
- Filtrage d'images
- Colorimetrie
- Filtres passe haut (Détection de contours)
Opérateurs dérivatifs du second ordre
- a) Laplacien sous forme discrète
- b) Filtres dérivatifs (1er ordre, 2eme ordre)
- Projet
Mémo
Seuillage
Histogramme
Etirement d'histogramme
Egalisation d'histogramme
Specification d'histogramme
Opérations morphologiques
- Dilatation
- Erosion
- Fermeture
- Ouverture
Convolution
- Application
- Traitement des bords
Courbe ROC
Segmentation
- Methode de segmentation
Split and merge
- Division
- Fusion
Inpainting
Image mosaique
Eigenface
Detection de points caracteristiques
Image 3D
Colorimetrie

Informations

Examens

Note final : 60% Exam + 40% TP
- Controle continu
  - Compte rendu de TP (pdf avec resultat des TPs) (CR_TP1_NOM.pdf)
  - TP à deux
- Examen
  - Question sur un article à lire
  - Question de calcul de distance selon repère (0, 0) en haut à gauche
  - Nouveauté : Même type d'exam avec en plus feuille mémo recto verso + question sur les presentations des autres

Ressources

Analyse d'une image

2 branches différentes en images
- Analyse et traitement : à partir de capteurs on recupère les données de l'image
- Informatique graphique : à partir de modèles et synthèses on créée l'image

Image spatiotemporel : capteur recupère des informations qui varie en fonction du temps (images sismiques, )

Etape en images
- Traitement/Prétraitement
  - Compression : réduction du volume de l'image
  - Restauration : correction des défauts dus à une source de dégradation
  - Amélioration : modification de l'image dans le but de la rendre plus agréable à l'oeil
- Analyse
  - Approche de segmentation
    - Ressemblance : segmentation par région (en regardant les pixel d'une zone qui se ressemblent)
    - Dissemblance : segmentation par contours (en regardant les fortes variation d'une images avec des dérivé)
- Interprétation : passage de la description structurelle à la description sémantique en regard à certains objectifs
Les dix commandements de la vision par ordinateur dans le domaine industrielle
1. on respecte les lois de la physique
2. on s'inquite de ce qu'on mesure avant de calculer
3. on utilise des grandeurs reproductibles
4. on se soucie de la qualité des données plutot que la vitesse des calculs
5. l'algorithme et plus important que le code
6. on ce soucie de l'aval et de l'amont de la reconnaissance des images
7. on effectue les essais sur plusieurs pièces sans tricher sur l'eclairage
8. on mes des chiffres sur les defauts (seuil de tolérances)
9. la simplicité est un idéal
10. on ne doit pas seulement utiliser des caméra vidéos (ils existent d'autres capteur)

Representation mathématiques des images

Image : discrétisation d'un phénomène continu. - Image binaire : (p, M) = (1, 1) - Image en niveaux de gris : p = 1 et M = 255 - Image en couleur : p = 3 et M = 255

Avec p le nombre de dimension et M le nombre max d'intensité l'umineuse.

Pixel : "Picture element" en anglais - Position dans une image - Intensité lumineuse

Maillage : arrangement géométrique des pixels dans l'image - Maillage carré : pixel rectangulaire capteur CCD arrangement des pixels les uns par rapport aux autres - Maillage hexagonal : pixel hexagonaux chaque pixels on 6 voisins avec un coté commun (permet un meilleure calcul des distances comme chaque voinsins sont à equidistances) - Maillage triangulaire : pixel en triangles

Distance entre deux pixels

distance entre deux pixels P(xp, yp) et Q(xq, yq)

Distance de Manathan : d(P, Q) = |xp - xq| + |yp - yq| (nombre de pixel qu'on utilise pour faire un chemin a chaque point)
Distance euclidienne : d(P, Q) = sqrt((xp - xq)² + (yp - yq)²)
Distance échiquier : d(P, Q) = max(|xp - xq|, |yp - yq|)

Connexité

Ordres de connexité dans une image
- 2D
  - Connexité 4 (degré 1) : pixel à 4 voisins (distance de manhantan)
  - Connexité 8 (degré 2) : pixel à 8 voisins (distance de l'échiquier)
- 3D
  - Connexité 6 (Degré 1) : voxel qui ont une face commune
  - Connexité 12 + 6 (Degré 2) : voxel qui ont une arête commune
  - Connexité 8 + 12 + 6 (Degré 3) : voxel qui ont un sommet

Histrogramme

l'histogramme H de l'image I calcul l'occurence des pixels dont l'intensité est x

H(x) = Card{P : I(P) = x}

Traitement ↺

Histrogramme : à partir d'une image on calcul les occurences des niveaux de gris.
- Permet de trouver les grands pics (Qui ont une forte chance de representer des objet de l'image)
- Permet de faire de la segmentation
- Permet de faire de la recherche/indexation
- Permet de faire de la normalisation (ramener une image sur une autre echelle, une autre norme)

Explication au tableau pour TP3

a) Modification d'histogramme

Elle va nous permettre d'ameliorer le contenu d'une image à l'aide d'une transformation sur chaque pixels (transformation ponctuelle de l'intensité)

Image I -> pixel p(i), i ∈ [0, N-1]

p(i) -> p'(i)

ne doit pas modifier les régions
doit respecter la relation d'ordre

p(i) < p(t) : p'(i) <= p'(j)

(dessin histogramme random avec un amin à 1/4 et un amax à 3/4)

avant amin aucune valeur n'atteint, après amax, aucune valeur n'atteint amax ce qui veut dire qu'on peut remettre à l'echelle l'histogramme

avec amin à 0 et amax à 255

$ p'(i) = T(p(i)) = α + βp(i) $ $ p(i) = a_{min} → p'(i) = 0 $ $ p(i) = a_{max} → p'(i) = 255 $

si on veut rester sur une extension dynamique, il nous faudra supprimer les bruits (pixel avant et après amin) en les mettant à amin amax cepandant cela à pour effet de creer un pic d'intensité sur les valeurs limites

a_1) extensioni dynamique d'histogramme

Objectif : rendre le plus plat possible un histogramme. et renforcer les contrastes sur les détails de l'image.

recherche et indexation :

Image de référene Ir

Image I → spécification par rapport à Ir

a_2) egalisation d'histogramme

a_3) spécialisation d'histogramme

Suite du cours en pdf

Système visuel humain

Composants de l'oeil
- Cornée : filtre
- Iris : diaphragme (varie en fonciton de l'intensité lumineuse)
- Cristalin : optique + focus (lentille à focal variable)
- Rétine : couche photo-sensible (120 millions de récepteurs : cones et battonnets)
- Macula : zone centrale qui contient la plus grande quantité de cellule photo-sensible
- Nerf optique : transporte et traite l'information pour les neuronnes

Cônes : peu sensible (6 à 7 millions de 3 types : RVB) detecte les couleurs, utiles dans la journées. Bâtonnets : tres sensible (120 millions) utile de nuits, saturé dans la journées.

Erosion, dilatation, ouverture, fermeture

fond de l'image en blanc et objet en noir

erosion : si j'ai blanc voinsin blanc

dilatation : si j'ai objet tous les voisin deviennent noir

ouverture (ED) : erosion en premier puis dilatation sur le resultat
- supprime les point d'objet isolé
fermeture (DE): dilatation en premier puis erosion sur le resultat
- supprime les point du fond isolé dans l'objet

Filtrage d'images

Pretraitement d'images

Supprimer le bruit

Filtre moyenneur

$ h(x, y) = {1 \over t^2} $

Filtre gaussien

$ h(x, y) = { {1 \over 2πθ^2} e^{-{x^2 + y^2 \over 2θ^2}} } $

avec θ taille de masque h.

Filtre exponentiel

$ h(x, y) = {{β \over 4} e^{-β(|x|+|y|)}} $

Remarque : 3 filtres doux

preserve les couleurs moyennes
supprime les hautes fréquences

Filtre passe bas : FPB supprime les bruits (basse fréquences)

Filtre gaussien 3x3

$ h(m, n) = { {1 \over 16} \begin{bmatrix} 1 & 2 & 1\ 2 & 4 & 2\ 1 & 2 & 1 \end{bmatrix} } $

Filtre non linaires

filtre homomorphiques
filtre adaptatif
filtre morphologique

Filtre median

Trier les valeurs des pixels voinsins à p(i, j)

$ p_1(i,j) <= p_2(i, j) <= ... <= p_n(i, j) $

$ h(m, n) = { {1 si p_5(i,j)} 0 sinon } $

Colorimetrie

Trichromie : couleur perçue par un humain → 3 couleurs de base avec un spectre éloigné Trivariance : couleur Cx fonction de λ et des luminances de Cλ et de Cb Synthèse soustractive : en partant du blanc, on soustrait de couleurs jusqu'à atteindre le noir. Synthèse additive : inverse de la synthèse soustractive.

Y = 0.3 * R + 0.6 * G + 0.1 * B Luminance Y = 0.299 * R + 0.587 * G + 0.114 * B

RGB to YUV

Y = ... U = 0.492 (B - Y) + 128 V = 0.877 (R - Y) + 128

YUV to RGB

R = ((Cr - 128) / 0.877) + Y / 0.587 G = (Y - O.299 * R - 0.114 * B) B = ((Cb - 128) / 0.877) + Y

RGB to YCrCb

Y = ... Cb = (B - Y) / (2 - 2 * 0.114 * B) + 128 (Cb = a * (B - Y)) Cb = (R - Y) / (2 - 2 * 0.229 * R) + 128 (Cr = b * (R - Y))

RGB to YCrCb

Y = 0.299 * R + 0.587 * G + 0.114 * B ...

Filtres passe haut (Détection de contours)

1) Interpretation

Detection de formes avec les profils de ligne

Aucune variation
marche
rampe
pic
toit

Example avec une courbe rampe, en uttilisant

une dérivé on aura une valeurs max sur le points d'inflexion
une dérivé seconde on cherche le passage par zero

2) Gradiant d'une image

Image : I(x, y) → gradiant vertical

$ I_x(x, y) = { dI(x, y) \over dx } $

$ I_y(x, y) = { dI(x, y) \over dy } $

Module du gradiant

$ G = \sqrt{ I_x^2 + I_y^2 } = max(I_x, I_y) $

Phase du gradiant

$ ϕ = \arctan{I_y \over I_x} $

Discretisation

$ { dI(x, y) \over dx } = { δI[i, j] \over δj } = I_j[i, j] = I[i, j+1] - I[i, j] $

$ { dI(x, y) \over dy } = I_i[i, j] = I[i+1, j] - I[i, j] $

$ G = \sqrt{I_i[i, j]^2 + I_j[i, j]^2} $

3) Utilisation du gradient

Filtrage de l'image
Calcul l'image du gradient
Recherche des maximums locaux dans l'image du gradiant dans la direction de la phase
Seuillage par hystéresis (analogie chauffage)

si p(i,j) > T_h
	alors maximum local
si p(i,j) < T_b
	alors non retenu
2eme passe

si T_b < p(i,j) < T_h et au moins N(p(i,j))
	alors p(i,j) Maximum local

Algo \ Verité	Positif	Négatif
Positif	True positif	False positif
Negatif	False negative	True negative

filter({1/9, 1/9, 1/9, 1/9, 1/9, 1/9, 1/9, 1/9, 1/9});

Opérateurs dérivatifs du second ordre

dérivé premiere → valeur maximale dérivé seconde → valeur du point d'inflexion

a) Laplacien sous forme discrète

$ \begin{bmatrix} 0 & -1 & 0\ -1 & 4 & -1\ 0 & -1 & 0 \end{bmatrix} $

Utilisation :

Filtrage de l'image : FPB
Pour chaque point : gradient → Norme, Phase
Calcul la carte du laplacien
Carte du laplacien :
- Rechercher les passages par zéro dans la direction de la phase du gradient
- Affectation de la norme du gradiant au passage par zéro
Seuillage par hysérésis

b) Filtres dérivatifs (1er ordre, 2eme ordre)

1) Filtre de dérivation double passe (Sobel, hewit)

$ I_j[i,j] = h_j[i,j] * I[i,j] $

$ I_i[i,j] = h_i[i,j] * I[i,j] $

$ h_j = { \begin{bmatrix} 1 & 0 & -1\ C & 0 & -C\ 1 & 0 & -1 \end{bmatrix} } $

$ h_i = { \begin{bmatrix} 1 & C & 1\ 0 & 0 & 0\ -1 & -C & -1 \end{bmatrix} } $

si C = 1 filtre de sobel, si c = 2 filtre de hewit

2) Approximation du gradient

$ \begin{bmatrix} -1 & 1 \end{bmatrix} $ $ \begin{bmatrix} -1 & 2 & -1 \end{bmatrix} $ $ \begin{bmatrix} -1 & 0 & 1 \end{bmatrix} $

$ \begin{bmatrix} -1 \ 1 \end{bmatrix} $ $ \begin{bmatrix} -1 \ 2 \ -1 \end{bmatrix} $ $ \begin{bmatrix} -1 \ 0 \ 1 \end{bmatrix} $

$ \begin{bmatrix} 0 & 1 & 0\ 1 & 0 & -1\ 0 & -1 & 0 \end{bmatrix} $

3) Filtre de renforcement

FPB : ∑ coefs = 1

$ \begin{bmatrix} 0 & -1 & 0\ -1 & 5 & -1\ 0 & -1 & 0 \end{bmatrix} $

4) Filtre pass haut

FPH : ∑ coefs = 0

$ \begin{bmatrix} -1 & -1 & -1\ -1 & 8 & -1\ -1 & -1 & -1 \end{bmatrix} $

ecart type → 0

$ p(x) = { { 1 \over \sqrt{2π}θ } e^{- (x-m)^2 \over 2θ^2 } } $

m : valeur moyenne → 0

$ p(x) = { { 1 \over \sqrt{2π}θ } e^{- x^2 \over 2θ^2 } } $

Projet

avoir demarche recherche

expliquer les choix

pourquoi ça marche ou pas

ne pas ce contenter du sujet donné

Split and merge
Inpainting
Mosaïque
biometrie / Eigenfaces
Extraction de points caractériqtiques
Bibliothèque de traitement d'image
Fx (filtre un peu marrant)

01/03 : lancement
05/04 : point d'avancement
26/04 : présentation (~10 min + question)

implementation d'un detecteur de points
correspondance de points
- detecter les points interressent (FAST, HARRIS(variation rapide d'intensité))
- les mettres en relation
Comparaison d'image
- test avec des spécification
essayer de reconstruire une image en 3D avec plusieurs image 2D
- tester avec 2 images différentes
- puis une multitudes

Mémo

Seuillage

Transforme une image en niveaux de gris en image binaire (Blanc/Noir), pour cela on compare chaque pixel à une seuil prédéfinie, si l'intensité du pixel est inférieur au seuil on met l'intensité du pixel à la valeur minimal (Noir) sinon on met la valeur du pixel à la valeur maximal (Blanc).

Peux servir à detecter les différents objets dans une image
On peut le determiné automatiquement selon plusieurs methode (moyenne, pics dans l'histogramme etc...)

Histogramme

Outils pratique d'analyse d'image, compte les occurences de chaques intensité des pixels.

Les pics de l'histogramme correspondent souvent à des objets de l'images

Etirement d'histogramme

Dans le cas ou une image est trop sombre ou trop claire avec beaucoup d'intensité nulles, la normalisation de l'image permet de mieux repartir les couleurs de l'image on obtient ainsi un histogramme étiré de l'image.

Methode
- Calcul du min et max de l'intensité d'une image
- $Norm(i, j) = (image(i, j) - min) × 255 / (max - min)$ (simple produit en croix)

Egalisation d'histogramme

Dans le cas ou une image est trop sombre ou trop claire même avec un étirement d'histogramme la cause provient d'une répartition des pixels non uniforme, l'egalisation nous permettra de mieux répartir les couleurs dans l'image.

Méthode
- Calcul de la répartition des pixels de l'image
- $Egal(i, j) = repartition[Egal(i, j)] × 255$

Specification d'histogramme

La spécification d'histogramme permet de generer une image ayant un forme d'histogramme déterminée (provenant possiblement d'une image de réference), cela peut permettre d'obtenir une bonne répartition des couelurs dans l'image.

Methode
- Calcul de l'egalisation de l'image que l'on veut spécifier
- Calcul de l'egalisation inverse de l'image de réference
- Transformation de l'image spécifié en utilisant la répartition inverse de l'image de référence

Opérations morphologiques

On applique ici les operations morphologiques à des images binaires, on choisis de dire que tous les objets dans une image binaires seront representés par la couleur noire tandis que le fond sera representé par la couleur blanche.

Dilatation

Elle aura pour effet de dilater/étendre les objets dans l'image binaire, pour cela on parcours chaque pixels de l'image et si on à un pixel noir (objet) tous ses voisins deviennent noir (objet).

Erosion

Elle aura pour effet d'éroder/réduire les objets dans l'image binaire, pour cela on parcours chaque pixels de l'image et si on à un pixel blanc (fond) tous ses voisins deviennent blanc (fond).

Fermeture

Elle aura effet de supprimer les pixels blancs (fond) isolés, consolidant ainsi la forme des objets de l'image. pour cela on applique une ou plusieurs dilatations d'affilés puis le même nombre d'erosions sur l'image.

Ouverture

Elle aura pour effet de supprimer les pixels noirs (objet) isolés, consolidant ainsi le fond de l'image. pour cela on applique une ou plusieurs erosions puis le même nombre de dilatations sur l'image.

Ces opération morphologiques peuvent être pour la detection des contours d'objets dans une image.

Convolution

Une convolution en traitement d'image est le resultat de l'application d'un filtre (noyau de convolution) à cette image, concretement c'est une matrice que l'on applique à chaque pixels de l'image, le resultat de l'operation sur chaques pixels depends de ses voisins.

Application

Detection de contours
Effet de flou
Amélioration de la netteté

Traitement des bords

Les pixels des bords doivent être traité avec attention car ceux-ci n'ont pas de voisins

Extension : on étant les pixels des bords
Enroulage : on prend les valeurs des bords opposés
Miroir : reflet de l'image par les bords
Crop : on ne traite pas les pixels nécessitant les des pixels hors limites l'image resultante est plus petite
Kernel Crop : on ajuste la normalisation de la matrice en fonction des pixels inutilisables

Courbe ROC

La courbe ROC (receiver operating characteristic) permet d'evaluer les performances d'un classificateur binaire : vrai positifs (VP), faux positifs (FP), vrai negatifs (VN), faux negatifs (FN)

$ X : VP / (VP + FN) $
$ Y : 1 - VN / (VN + FP) $

Segmentation

La segmentation d'image a pour but de grouper des pixels en région, elle peut être utile pour séparer les objets du fond.

Methode de segmentation

Régions
- Croissance de région
- Split and merge
Contours (edge based segmentation)
Seuillage

Split and merge

Division

Decoupage de l'image en sous-région tant que la variance de la région est plus grande que le seuil ou la taille de la région est trop grande
Calcul de la moyenne des intensitées pour chaques régions

Fusion

Calcul d'un graphe d'adjacence pour chaque régions
Pour chaque sommet du graphe on fusionne les sommets ayant des valeurs suffisamment proches.

Inpainting

Methodes permettant de reconstruire les parties manquantes/endommagées d'une image. Cette methode demande au préalable d'entourer à la main la zone a reconstruire.

Moyenne des pixels voisins
Dilatation pixels par pixels sur les contours de l'objet
Analyse est diffusion de la texture des contours de l'objet

Image mosaique

On decoupe un image en blocks qu'on remplira à l'aide d'une grande base d'image (imagettes) similaire au blocks.

Disposer d'une grande base d'imagettes
Calculer un critère de similitudes (moyenne, variance, etc...) pour chaque blocs de l'image
On remplis chaque blocs de l'image avec l'imagette la plus proche selon notre critère

Eigenface

Technique permettant de reconnaitre un visage

Calcul du visage moyen à partir d'une grande base de données d'images
Calcul des caractèristiques propre du visage par soustraction au visage moyen
Calcul de la matrice de covariance du visage propre
Calcul des vecteurs propres de la matrice de covariance
Projection de l'image a tester dans l'espace des visages propres
Différence de l'image propre avec l'image projeté
Comparaison selon un seuil de correspondance

Detection de points caracteristiques

Detection de points caractèristiques dans des images de tels sorte qu'ils soient le plus insensible au transformation d'images tels que la rotation et la mise à l'echelle.

HARRIS
SIFT
SURF

Image 3D

Superposition d'images 2D
Composée de voxels
DICOM : Format standard de fichier d'imagerie médicale
Tomodensitométrie par rayons X
- Défaut : artéfact en étoile dû à des matériaux très denses (alliages dentaires, prothèses...)
Imagerie par résonance Magnétique (IRM)
- Défaut : décalage chimique lié à des matériaux qui sont proches spatialement
Visualisation
- Maximum Intensity Projection (MIP) : visualisation des structures denses comme les os
- Minimum Intensity Projection (MinIP) : visualisation des structures vides comme les poumons, sinus, etc...
- Average Intensity Projection (AIP) : visualisation globale des structures
Modélisation
- Algorithme du marching cube
Stockage
- Les données sont souvent stocké en little-endian sur 2 octets
- Exemple : $ 1000 = 256 \times 3 + 232 $
  - Big-endian : 03 E8
  - Little-endian : E8 03

Colorimetrie

Y : $ 0.299 \times R + 0.587 \times G + 0.114 \times B $
XYZ
YCrCb :
YUV :
Lab
CMYK
HLS (HUE, LUMINOSITY, SATURATION)

Files

HMIN211 - Analyse et traitement des images

Directory actions

More options

Directory actions

More options

Latest commit

History

HMIN211 - Analyse et traitement des images

Folders and files

parent directory

README.md

Sommaire

Informations

Examens

Ressources

Analyse d'une image

Representation mathématiques des images

Distance entre deux pixels

Connexité

Histrogramme

Traitement ↺

Explication au tableau pour TP3

Suite du cours en pdf

Système visuel humain

Erosion, dilatation, ouverture, fermeture

Filtrage d'images

Pretraitement d'images

Supprimer le bruit

Filtre moyenneur

Filtre gaussien

Filtre exponentiel

Filtre gaussien 3x3

Filtre non linaires

Filtre median

Colorimetrie

Filtres passe haut (Détection de contours)

1) Interpretation

2) Gradiant d'une image

3) Utilisation du gradient

Opérateurs dérivatifs du second ordre

a) Laplacien sous forme discrète

b) Filtres dérivatifs (1er ordre, 2eme ordre)

1) Filtre de dérivation double passe (Sobel, hewit)

2) Approximation du gradient

3) Filtre de renforcement

4) Filtre pass haut

Projet

Mémo

Seuillage

Histogramme

Etirement d'histogramme

Egalisation d'histogramme

Specification d'histogramme

Opérations morphologiques

Dilatation

Erosion

Fermeture

Ouverture

Convolution

Application

Traitement des bords

Courbe ROC

Segmentation

Methode de segmentation

Split and merge

Division

Fusion

Inpainting

Image mosaique

Eigenface

Detection de points caracteristiques

Image 3D

Colorimetrie