Una imagen numérica está constituida por un conjunto de . A cada pixel es asociado un . Se trata de un valor numérico que representa la intensidad luminosa del pixel. La imagen pude ser también una imagen color: a cada pixel corresponden entonces tres informaciones numéricas, que codifican el color.
Se habla frecuentemente de imágenes : son imágenes monocromáticas (en niveles de gris), a las cuales es asociada una . La introducción del color puede ayudar a distinguir niveles de gris cercanos. Otra noción es el . Se trata de una técnica de visualización, bajo la forma de una sola imagen, de varias imágenes correspondientes a canales de adquisición diferentes. Cada canal se utiliza como si fuera un componente (rojo-verde-azul) de una imagen color. Una noción importante en procesamiento de imágenes es la de . Cada pixel de la imagen es considerado como un vecino de otros pixeles. El número de vecinos depende de la seleccionada. Puede ser de 4 o de 8, según la convención escogida. La imagen es cuando cada pixel tiene únicamente dos valores : verdadero o falso.
El de una imagen es un mecanismo de descripción global de la distribución de niveles de gris en la imagen. Permite analizar simplemente la imagen y definir numerosas . Las técnicas más simples de , en particular la , son también derivadas de un estudio del histograma de la imagen.
Varias nociones derivadas del procesamiento de señales, tienen un significado en procesamiento de imágenes:
El entre dos imágenes, permite el cálculo de la mayor parte de los operadores diferenciales clásicos. Permite en particular definir filtros lineales sobre la imagen.
La transformada de Fourier 2D da una representación de las frecuencias espaciales contenidas en la imagen. El filtrado lineal de una imagen puede así realizarse en el plano de Fourier.
La define un conjunto de operadores que permiten realizar operaciones sobre las imágenes en términos de morfología (estudio de formas). La morfología matemática está basada sobre el uso de una , noción derivada de vecindario.