¿Quién sabe qué es la transformada de Fourier?

Edición González lt; Procesamiento de Imágenes

La explicación que contiene es muy vívida: una metáfora apropiada es comparar la transformada de Fourier con un prisma de vidrio. Un prisma es un instrumento físico que puede dividir la luz en diferentes colores, y el color de cada componente está determinado por su longitud de onda (o frecuencia).

La transformada de Fourier puede considerarse como un prisma matemático que descompone una función en sus componentes en función de la frecuencia. Cuando pensamos en la luz,

hablamos de su espectro o espectro de frecuencias. Asimismo,

La transformada de Fourier nos permite analizar una función por sus componentes frecuenciales.

El significado físico de la transformada de Fourier de una imagen

La frecuencia de una imagen es un indicador de la gravedad de los cambios en la escala de grises en una imagen y es el gradiente de la escala de grises en el espacio plano. Por ejemplo: un área grande de desierto es un área con cambios lentos en escala de grises en la imagen y el valor de frecuencia correspondiente es muy bajo, mientras que el área del borde donde los atributos de la superficie cambian violentamente es un área con cambios violentos en escala de grises en la imagen; , y el valor de frecuencia correspondiente mayor. La transformada de Fourier tiene un significado físico muy obvio en la práctica. Supongamos que f es una señal analógica con energía limitada, entonces su transformada de Fourier representa el espectro de f. Desde un sentido puramente matemático, la transformada de Fourier convierte una función en una serie de funciones periódicas. Desde la perspectiva de los efectos físicos, la transformada de Fourier convierte la imagen del dominio espacial al dominio de frecuencia, y su transformada inversa convierte la imagen del dominio de frecuencia al dominio espacial. En otras palabras, el significado físico de la transformada de Fourier es transformar la función de distribución de escala de grises de la imagen en la función de distribución de frecuencia de la imagen, y la transformada de Fourier inversa es transformar la función de distribución de frecuencia de la imagen en una función de distribución de escala de grises. /p>

Transformada de Fourier En el pasado, las imágenes (mapas de bits sin comprimir) eran una colección de puntos obtenidos mediante muestreo en un espacio continuo (espacio real). Estamos acostumbrados a utilizar una matriz bidimensional para representar cada punto en el espacio. entonces la imagen se puede representar mediante z = f (x, y). Dado que el espacio es tridimensional y las imágenes son bidimensionales, la relación entre los objetos en el espacio en otra dimensión está representada por gradientes. De esta manera, podemos conocer la relación correspondiente entre los objetos en el espacio tridimensional al observar la imagen. ¿Por qué mencionar el gradiente? Porque, de hecho, el espectrograma obtenido al realizar la transformada de Fourier bidimensional en la imagen es el diagrama de distribución del gradiente de la imagen. Por supuesto, no existe una correspondencia uno a uno entre los puntos del espectrograma y los puntos de la imagen. , incluso sin cambio de frecuencia. Los reflejos brillantes y oscuros que vemos en el espectrograma de Fourier son en realidad la diferencia entre un determinado punto de la imagen y los puntos vecinos, es decir, el tamaño del gradiente, es decir, el tamaño de la frecuencia del punto (puede debe entenderse que, en la imagen la parte de baja frecuencia se refiere al punto con bajo gradiente, y la parte de alta frecuencia es lo contrario). En términos generales, si el gradiente es grande, el brillo del punto es fuerte; de ​​lo contrario, el brillo del punto es débil. De esta manera, al observar el espectrograma después de la transformada de Fourier, también llamado diagrama de potencia, primero podemos ver la distribución de energía de la imagen. Si hay más puntos oscuros en el espectrograma, entonces la imagen real es más suave (porque cada punto es). diferente del adyacente). La diferencia de dominio no es grande y el gradiente es relativamente pequeño. Por el contrario, si hay muchos puntos brillantes en el espectrograma, entonces la imagen real debe ser nítida, con límites claros y una gran diferencia. en píxeles a ambos lados del límite. Después de desplazar el espectro de frecuencias al origen, se puede ver que la distribución de frecuencias de la imagen está distribuida simétricamente con el origen como centro del círculo. Además de ver claramente la distribución de frecuencia de la imagen, desplazar el espectro de frecuencia al centro del círculo tiene otra ventaja: puede separar señales de interferencia con patrones periódicos, como la interferencia sinusoidal. Una señal con interferencia sinusoidal se desplaza en frecuencia. origen Se puede ver en el espectrograma que, además del centro, hay un conjunto de puntos brillantes distribuidos simétricamente centrados en un determinado punto. Este conjunto es causado por ruido de interferencia. En este momento, la interferencia se puede eliminar intuitivamente. colocando un filtro de parada de banda en esta posición

Además, me gustaría explicar los siguientes puntos: 1. Después de que la imagen se somete a una transformación de Fourier bidimensional, su matriz de coeficientes de transformación muestra: Si el origen de la matriz de transformación Fn se establece en el centro, su energía espectral se concentra en la matriz corta de coeficientes de transformación cerca del centro (área sombreada en la imagen)

. Si el origen de la matriz de transformada de Fourier bidimensional Fn utilizada se establece en la esquina superior izquierda, entonces la energía de la señal de la imagen se concentrará en las cuatro esquinas de la matriz de coeficientes. Esto está determinado por las propiedades de la propia transformada de Fourier bidimensional. También muestra que una corriente de energía de la imagen se concentra en la región de baja frecuencia.

2. Antes de traducir el origen, las cuatro esquinas de la imagen transformada son de baja frecuencia y las más brillantes. Después de la traducción, la parte media es de baja frecuencia y la más brillante. El alto brillo indica que la energía de baja frecuencia es grande. (el ángulo es relativamente grande)