Classification des données d’image

Une image est représentée sous la forme d’un réseau bidimensionnel de coefficients, chaque coefficient représentant le niveau de luminosité à ce point. En regardant d’un point de vue plus élevé, nous ne pouvons pas faire la différence entre les coefficients comme les plus importants et les moins importants. Mais en pensant plus intuitivement, nous pouvons. La plupart des images naturelles ont des variations de couleurs lisses, les détails fins étant représentés comme des bords nets entre les variations lisses. Techniquement, les variations douces de couleur peuvent être qualifiées de variations de basse fréquence et les variations nettes de variations de haute fréquence.

Les composantes basse fréquence (variations lisses) constituent la base d’une image, et les composantes haute fréquence (les bords qui donnent le détail) s’ajoutent à elles pour affiner l’image, donnant ainsi une image détaillée. Par conséquent, les variations douces exigent plus d’importance que les détails.

La séparation des variations fluides et des détails de l’image peut être effectuée de plusieurs manières. L’une de ces méthodes est la décomposition de l’image à l’aide d’une transformation en ondelettes discrète (DWT).

Le DWT d’une image

La procédure se déroule ainsi. Un filtre passe-bas et un filtre passe-haut sont choisis, de sorte qu’ils divisent exactement de moitié la gamme de fréquences entre eux. Cette paire de filtres est appelée paire de filtres d’analyse. Tout d’abord, le filtre passe-bas est appliqué pour chaque ligne de données, obtenant ainsi les composants basse fréquence de la ligne. Mais comme le lpf est un filtre demi-bande, les données de sortie ne contiennent des fréquences que dans la première moitié de la plage de fréquences d’origine. Ainsi, selon le théorème d’échantillonnage de Shannon, ils peuvent être sous-échantillonnés par deux, de sorte que les données de sortie ne contiennent plus que la moitié du nombre original d’échantillons. À présent, le filtre passe-haut est appliqué pour la même ligne de données et, de la même manière, les composants passe-haut sont séparés et placés à côté des composants passe-bas. Cette procédure est effectuée pour toutes les lignes.

Ensuite, le filtrage est effectué pour chaque colonne des données intermédiaires. Le tableau de coefficients bidimensionnel résultant contient quatre bandes de données, chacune étiquetée LL (bas-bas), HL (haut-bas), LH (bas-haut) et HH (haut-haut). La bande LL peut être à nouveau décomposée de la même manière, produisant ainsi encore plus de sous-bandes. Cela peut être fait jusqu’à n’importe quel niveau, entraînant ainsi une décomposition pyramidale comme indiqué ci-dessous.

Fig 1. Décomposition pyramidale d’une image

Comme mentionné ci-dessus, la bande LL au plus haut niveau peut être classée comme la plus importante, et les autres bandes `détaillées` peuvent être classées comme de moindre importance, le degré d’importance diminuant du haut de la pyramide aux bandes au bas.

Fig 2. La décomposition en trois couches de l’image «Lena».

Le DWT inverse d’une image

Tout comme une transformation directe à utiliser pour séparer les données d’image en différentes classes d’importance, une transformation inverse est utilisée pour réassembler les différentes classes de données en une image reconstruite. Une paire de filtres passe-haut et passe-bas est également utilisée ici. Cette paire de filtres est appelée paire de filtres de synthèse. La procédure de filtrage est tout le contraire – nous partons du niveau le plus haut, appliquons les filtres d’abord en colonne puis en ligne, et passons au niveau suivant, jusqu’à ce que nous atteignions le premier niveau.

Ressources Wavelet sur le Web

Si les ondelettes semblent intéressantes, vous pouvez suivre les liens ci-dessous pour en savoir plus.

La page de résumé des ondelettes sur www.wavelet.org
Logiciel Wavelab matlab sur www-stat.stanford.edu/~wavelab/
Guide de l’ingénieur pour l’analyse des ondelettes par Polikar à users.rowan.edu/~polikar/WTtutorial.html


Source de la page: https://www.debugmode.com/imagecmp/classify.htm
Traduit par Jean-Etienne Bergemer

Publié dans Edu

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *