Ce document est une introduction à l'analyse spectrale des signaux périodiques. Après avoir expliqué la décomposition d'un signal périodique en somme de fonctions sinusoïdales, on verra comment effectuer l'analyse spectrale d'un signal échantillonné.
On considère un signal périodique, représenté par une fonction d'une variable t réelle à valeurs réelles, de période T et de classe C1 par morceaux.
La fréquence fondamentale du signal est :
D'après le théorème de Fourier, cette fonction peut s'écrire comme une somme de sinusoïdes dont les fréquences sont multiples de la fréquence fondamentale. La somme obtenue est la série de Fourier :
Dans certains cas, la somme peut être stoppée à un rang P fini. Dans d'autres cas, il faut en principe considérer la limite .
Le terme de rang n est appelé l'harmonique de rang n du signal : c'est une sinusoïde de fréquence
L'harmonique de rang n est défini par son amplitude An (positive) et son déphasage ϕn.
Le terme constant A0/2, qui peut être vu comme le terme de fréquence nulle, est la valeur moyenne du signal :
Considérons comme exemple une fonction dont la série de Fourier s'arrête au rang P=3. On dit dans ce cas que le signal comporte trois harmoniques. Par convention, la période est prise égale à 1 :
import numpy import math f1=1.0 def u(t): return 0.4+1.0*numpy.cos(2*numpy.pi*f1*t)\ +0.5*numpy.cos(2*2*numpy.pi*f1*t-numpy.pi/3)\ +0.2*numpy.cos(3*2*numpy.pi*f1*t+numpy.pi/4)
Pour tracer ce signal, il faut l'échantillonner, c'est-à-dire calculer les valeurs de u(t) pour des instants régulièrement répartis sur un intervalle et les placer dans un tableau. Voici un échantillonnage sur deux périodes comportant 500 points :
import numpy N = 500 Tmax = 2.0 Te = Tmax/N t = numpy.arange(N)*Te x = u(t)
La courbe du signal est obtenue avec la fonction plot, qui relie les points par des segments de droites. Si la période d'échantillonnage Te est petite par rapport à la période du dernièr harmonique (ici celui de rang 3), on obtient ainsi une bonne représentation graphique du signal.
from matplotlib.pyplot import * figure(figsize=(10,4)) plot(t,x) xlabel('t') ylabel('u') axis([0,2,-2,2]) grid()Figure pleine page
Le spectre du signal est la représentation graphique de l'amplitude An en fonction de la fréquence. Un signal périodique a en théorie un spectre discret formé de raies, chacune correspondant à un harmonique. Pour cet exemple, il y a 4 raies : une pour la valeur moyenne (fréquence nulle) et 3 raies pour les harmoniques de rang 1, 2 et 3 :
figure(figsize=(8,4)) stem([0,1,2,3],[0.8,1.0,0.5,0.2],'r') xlabel('f') ylabel('A') axis([-1,5,0,2]) grid()Figure pleine page
La raie de fréquence nulle a une amplitude égale au double de la valeur moyenne du signal (la composante dite continue).
La première courbe (u en fonction de t) est la représentation temporelle du signal. Le spectre est la représentation fréquentielle du signal. En principe, il faudrait aussi tracer la phase ϕn pour avoir une représentation complète.
Pour les calculs, il est commode d'introduire la série de Fourier sous forme complexe :
Le coefficient cn est un nombre complexe appelé coefficient de Fourier. Il se calcule à partir de la fonction u avec l'intégrale suivante :
Puisque u(t) est réel, le coefficient de Fourier vérifie la propriété suivante :
où l'étoile désigne le complexe conjugué. La somme s'écrit donc :
Par identification, on en déduit :
La transformée de Fourier discrète (TFD) est la transformation qui permet de calculer le spectre d'un signal discret, obtenu par échantillonnage d'un signal continu. Considérons un échantillonnage de la fonction u sur l'intervalle [0,T], comportant N points et défini par :
On définit la période d'échantillonnage et la fréquence d'échantillonnage par :
Une valeur approchée de l'intégrale définissant les coefficients de Fourier peut être obtenue par la méthode des rectangles :
Par définition, la transformée de Fourier discrète ([1]) est l'application qui aux N nombres uk associe les N nombres complexes suivants () :
La TFD vérifie la propriété suivante (si uk est réel) :
La transformée de Fourier discrète est calculée numériquement avec l'algorithme dit de Transformée de Fourier rapide. La fonction qui effectue ce calcul (sur un oscilloscope ou dans un logiciel) est souvent désignée par FFT (Fast Fourier Transform).
Si u est un polynôme trigonométrique, il existe un rang P fini tel que on a cn=0. Autrement dit, la série de Fourier s'arrête à un rang fini. Il existe donc dans le spectre du signal une fréquence maximale :
On suppose que la condition de Nyquist-Shannon est vérifiée : la fréquence d'échantillonnage est supérieure au double de la fréquence maximale du spectre
ou encore :
Si cette condition est vérifiée, alors les P+1 premières valeurs de la TFD sont exactement les coefficients de Fourier :
Cette propriété est étonnante puisque la TFD est initialement définie pour donner des valeurs approchées des coefficients de Fourier. Sa démonstration est donnée plus loin (paragraphe 3.d).
Pour voir comment la TFD permet d'obtenir le spectre du signal, reprenons l'exemple précédent. Comme la période est égale à 1, l'indice n correspond exactement à la fréquence. La plus grande fréquence du spectre est P=3 (harmonique de rang 3). Pour respecter la condition, il faut donc échantillonner à au moins 6 points par période. Voyons le résultat pour N=10. La période du signal étant connue a priori, on peut échantillonner exactement 10 points sur une période :
N = 10 Tmax = 1.0 Te = Tmax/N t = numpy.arange(0,N)*Te x=u(t) figure(figsize=(10,4)) stem(t,x) xlabel('t') ylabel('u') grid()Figure pleine page
Voici le calcul de la transformée de Fourier discrète :
import numpy.fft tfd = numpy.fft.fft(x)
print(tfd) --> array([4.00000000e+00+0.00000000e+00j, 5.00000000e+00+0.00000000e+00j, 1.25000000e+00-2.16506351e+00j, 7.07106781e-01+7.07106781e-01j, 1.94289029e-16-3.33066907e-16j, 3.88578059e-16-1.11022302e-16j, 1.94289029e-16+3.33066907e-16j, 7.07106781e-01-7.07106781e-01j, 1.25000000e+00+2.16506351e+00j, 5.00000000e+00+1.66533454e-16j])
On trace le module en fonction de la fréquence. On doit diviser par N car la fonction numpy.fft.fft calcule la TFD sans le facteur 1/N. Ici la fréquence est égale à l'indice n :
figure(figsize=(10,5)) f=numpy.arange(0,N,1) stem(f,numpy.absolute(tfd)/N) xlabel("f") ylabel("|cn|") axis([-1,11,0,1]) grid()Figure pleine page
Les 4 premières valeurs de la TFD donnent bien les coefficients de Fourier de rang 0 à 3. Les éléments d'indice 4,5 et 6 sont nuls, aux erreurs d'arrondis près (erreurs de l'ordre de 1e-16). Les trois derniers éléments (indices 7 à 9) sont les conjugués des trois coefficients c1, c2 et c3; ils ont donc le même module. Le terme d'indice 1 est conjugué du terme d'indice 9, celui d'indice 2 conjugué du terme d'indice 8, etc. La fréquence centrale du spectre est égale à la moitié de la fréquence d'échantillonnage; c'est la fréquence de Nyquist. Ici, la fréquence de Nyquist est fn=5. Comme la condition de Nyquist-Shannon est respectée, cette fréquence est supérieure à P=3. La partie du spectre située à gauche de cette fréquence est le spectre du signal continu u(t). La totalité du spectre est celui du signal discret. La partie située à droite de la fréquence de Nyquist est l'image de la partie gauche (à l'exclusion de la composante de fréquence nulle). On voit que la condition de Nyquist-Shannon se traduit par le non chevauchement du spectre et de son image.
En fait, le spectre du signal discret est périodique, de période égale à la fréquence d'échantillonnage. La relation définissant la TFD vérifie en effet la relation :
La TFD que nous avons calculée donne donc les valeurs de ce spectre sur une période. Cependant, ce qui nous intéresse en pratique est plutôt le spectre du signal continu u(t), qui est donné par la première moitié de la TFD.
En pratique, on s'intéresse aux amplitudes An des harmoniques plutôt qu'aux valeurs des coefficients de Fourier cn. Il faut alors multiplier les coefficient par deux :
figure(figsize=(10,5)) f=numpy.arange(0,N,1) stem(f,numpy.absolute(tfd)*2/N) xlabel("f") ylabel("|cn|") axis([-1,11,0,1.2]) grid()Figure pleine page
On remarque que la composante de fréquence nulle du spectre a une amplitude égale au double de la valeur moyenne. Dans le cas présent, on pourrait facilement diviser le terme d'indice 0 par deux pour obtenir directement la composante de fréquence nulle du signal, mais cette méthode n'est pas toujours applicable sur les spectres expérimentaux.
L'information présente dans le signal échantillonné est entièrement contenue dans sa TFD. On peut en effet calculer le signal à partir de sa TFD par la relation suivante (voir [1] pour la démonstration) :
La transformation qui permet ainsi de retrouver le signal discret est la transformation de Fourier discrète inverse. Elle ressemble beaucoup à la TFD directe : on remarque le changement de signe dans l'exponentielle et l'absence du facteur 1/N. En ce qui concerne ce facteur, il existe d'ailleurs différentes conventions pour la définition de la TFD.
Comme exemple, calculons la TFD inverse de la TFD obtenue précédemment :
y = numpy.fft.ifft(tfd) figure(figsize=(10,4)) stem(t,y) xlabel('t') ylabel('y') grid()Figure pleine page
On retrouve bien le signal discret de départ.
Il est intéressant de modifier la TFD avant de calculer la TFD inverse. On peut par exemple enlever l'harmonique de rang 3. Pour cela, il faut annuler le coefficient d'indice 3 et son image, d'indice N-3=7 :
i=3 tfd[i] = 0 tfd[N-i] = 0 y = numpy.fft.ifft(tfd) figure(figsize=(10,4)) stem(t,y) xlabel('t') ylabel('y') grid()Figure pleine page
Le résultat est le signal discret qui serait obtenu par échantillonnage du signal u(t) auquel on aurait enlevé l'harmonique de rang 3. On a donc là une méthode de filtrage très sélective, appelée filtrage dans le domaine fréquentiel, ou filtrage par transformée de Fourier. Elle peut être utilisée lorsqu'on doit filtrer un signal discret dont la taille N est fixée à l'avance (et pas trop grand). Cependant, cette méthode est plus difficile à mettre en œuvre pour faire un filtrage temps-réel, pour lequel il y a un flux continu de données à traiter. Dans ce cas, on effectue plutôt un filtrage dans le domaine temporel, appelé aussi filtrage par convolution. Voir à ce sujet le document Introduction aux filtres numériques.
Ce paragraphe donne la démonstration de l'égalité entre les coefficients de Fourier et la TFD.
On considère la série de Fourier pour l'instant tk=kT/N :
On se place pour l'instant dans le cas théorique général, où la somme doit être étendue à l'infini. Considérons la division entière de l'indice m par N :
q est l'entier résultat de cette division et n est le reste. La somme sur l'indice m peut s'écrire comme une double somme, sur n et sur q. En regroupant tous les termes qui ont le même reste, on obtient ainsi :
En identifiant cette expression avec celle de la TFD inverse, on montre que :
Pour le coefficient de Fourier de rang n, l'erreur de l'approximation par est donc :
On se place à présent dans le cas où il existe un rang P tel que pour |k|>P on ait ck=0. On suppose de plus que N>2P (condition de Nyquist-Shannon).
Soit un entier n tel que . Pour q>0, on a qN+n>2qP+n>2P+n>P donc cqN+n=0. De même pour q<0 on a qN+n<2qP+n<-2P+n<-P donc cqN+n=0. Tous les termes de la somme sont donc nuls :
Cela démontre l'égalité entre les P+1 premiers termes de la TFD et les coefficients de Fourier, pourvu que la condition de Nyquist-Shannon soit respectée.
Un signal périodique réel a une période qui, le plus souvent, n'est pas connue a priori. L'objectif de l'analyse spectrale est justement de déterminer les fréquences qu'il contient. Par ailleurs, sa périodicité peut être imparfaite, voire très grossière. On voit donc que l'approche précédente, qui consistait à échantillonner le signal sur sa période T, n'est pas applicable en pratique.
Au lieu de cherche à échantillonner sur une période, on considère une durée T grande devant la période supposée. Par exemple, pour un son de fréquence 400 Hz, on peut prendre T=1 s. On obtient ainsi un spectre dont les raies sont les coefficients de Fourier d'une fonction de période T. Les fréquences de ces raies sont donc multiples de 1/T. La durée T est la largeur de la fenêtre d'analyse. La résolution fréquentielle du spectre obtenu est 1/T.
On reprend le signal déjà utilisé en modifiant sa fréquence :
f1 = 1.0324
On choisit une durée d'analyse T=20, qui donnera une résolution fréquentielle de 0,05. La fréquence d'échantillonnage doit respecter la condition de Nyquist-Shannon, c'est-à-dire fe>7.
T=20.0 fe=10.0 N=int(T*fe) t = numpy.arange(0,N)*Te x=u(t) tfd=numpy.fft.fft(x) f=numpy.arange(0,N)*1.0/T figure(figsize=(10,4)) vlines(f,[0],numpy.absolute(tfd)/N,'b') xlabel('f') ylabel('C') axis([-1,10,0,0.5]) grid()figG.pdf
Le spectre obtenu est composé de raies très resserées, espacées de 1/T. Le spectre de la fonction apparaît comme la courbe dessinée par ces raies. La démonstration de cette propriété sort du cadre de cette introduction, car elle fait appel à la notion de transformée de Fourier.
On voit sur cet exemple que le spectre obtenu est imparfait : la position du maximum des raies est définie au mieux avec une précision de 1/T. Dans le cas présent, cela induit une erreur bien visible sur la hauteur des raies. Pour améliorer la précision, il faut augmenter la durée de la fenêtre d'analyse. Voyons le résultat avec T=10000 :
T=10000.0 fe=10.0 N=int(T*fe) t = numpy.arange(0,N)*Te x=u(t) tfd=numpy.fft.fft(x) f=numpy.arange(0,N)*1.0/T figure(figsize=(10,4)) plot(f,numpy.absolute(tfd)/N,'b') xlabel('f') ylabel('C') axis([-1,10,0,0.5]) grid()figH.pdf
La résolution fréquentielle est bien meilleure. Les amplitudes des harmoniques attendues (d'après la définition du signal) sont correctes : c0=0,4, c1=0,5, c2=0,25, c3=0,1. Remarque : on a ici utilisé la fontion plot et non vlines car cette dernière n'est pas optimisée pour le traitement d'un gros volume de données.
Dans certains cas, l'augmentation de la durée de la fenêtre d'analyse n'est pas possible, ou bien n'est pas suffisante pour obtenir précisément la hauteur des raies. On peut alors utiliser la technique du remplissage par des zéros associée à un fenêtrage, expliquée dans Analyse spectrale d'un signal numérique.
Voyons à présent un exemple plus réaliste, l'analyse du son émis par un instrument de musique. Il s'agit du son émis par une clarinette (note La3) pendant une durée d'environ 3 secondes. Evidemment, la largeur de la fenêtre d'analyse est limitée par cette durée.
Le son est enregistré dans un fichier WAV. On commence par lire le fichier et on extrait la fréquence d'échantillonnage, le nombre d'échantillons et la durée du son :
import scipy.io.wavfile as wave fe,data = wave.read("clarinette_la3.wav") N = data.size T = N*1.0/fe data =data/data.max()
print(fe) --> 44100
print(T) --> 2.8908843537414968
Pour obtenir une représentation temporelle du signal (la forme d'onde), il faut se limiter à une fenêtre comportant une dizaine d'oscillations, soit ici environ 0,02 s :
te = 1.0/fe T = 0.02 N = int(T/te) t = numpy.arange(N)*te x = data[0:N] figure(figsize=(10,4)) plot(t,x) xlabel("t") ylabel("A") grid()figI.pdf
La forme d'onde laisse deviner un spectre très riche en harmoniques.
Pour faire l'analyse spectrale, on choisit une fenêtre de largeur T=1 Hz, qui donnera une précision de 1 Hz sur la fréquence :
T=1.0 N=int(T/te) x = data[0:N] tfd = numpy.fft.fft(x) f = numpy.arange(N)*1.0/T a = numpy.absolute(tfd)*2/N figure(figsize=(10,4)) plot(f,a) xlabel("f (Hz)") ylabel("A") grid()figJ.pdf
On s'intéresse au spectre du son en tant que signal continu, c'est-à-dire à la première moitié. Voyons le détail dans la bande [0,5 kHz] :
figure(figsize=(10,4)) plot(f,a) xlabel("f (Hz)") ylabel("A") grid() axis([0,5000,0,a.max()])figK.pdf
On repère sur ce spectre le fondamental (à 440 Hz) et des harmoniques de rang 2 à 8. Les harmoniques de rang élevé (par exemple 7) ont une fréquence très élevée (pour l'oreille). Bien que leur amplitude soit relativement faible, elles contribuent au timbre du son.