Qu'est-ce qu'une pyramide gaussienne?

La pyramide gaussienne est une technique de traitement d'image qui décompose une image en groupes de pixels de plus en plus petits, en étapes répétées, dans le but de la rendre floue. Il tire son nom du mathématicien allemand Johann Carl Friederich Gauss. Ce type de flou mathématique précis est largement utilisé dans le traitement artificiel de la vision par ordinateur en tant qu'étape de pré-traitement. Par exemple, lorsqu'une photo numérique est floue de cette manière, les contours des objets sont beaucoup plus faciles à détecter, ce qui permet à un ordinateur de les identifier automatiquement.

Comment ça marche?

La "pyramide" est construite en calculant de manière répétée une moyenne pondérée des pixels voisins d'une image source et en réduisant l'image. Il est possible de visualiser l'image en empilant des versions de plus en plus petites de l'image. Ce processus crée une forme de pyramide dans laquelle la base de la pyramide est l'image d'origine et la pointe est un pixel unique représentant la valeur moyenne de l'image entière.

Termes de programmation