SINTESI FM Analisi dei concetti teorici alla base della sintesi dei suoni attraverso la modulazione di frequenza Franc rances esco co Paolo aolo Chie Chiete tera ra
Rela Relato tore re:: Prof Prof.. Ange Angelo lo Colu Colucc ccia ia
Un po’ di storia... La Sintesi a modulazione di frequenza fu scoperta da John Chowning nel 1968/1969 presso
la Stanford University. Fu registrata nel 1975 ed ottenne il brevetto USA nel 1977. Successivamente la licenza per l’utilizzo del brevetto fu ceduta alla Yamaha che la utilizzò per produrre una vasta gamma di chip sonori e sintetizzatori musicali. La tecnica della Sintesi FM, infatti, permette la creazione di suoni armonici e non, attraverso un’ implementazione digitale semplice e senza requisiti computazionali elevati. Queste caratteristiche hanno fatto di questa tecnica, per molti anni, uno degli strumenti
fondamentali per la sintesi sonora. Un illustre esempio è rappresentato proprio dal Sintetizzatore DX7, prodotto da Yamaha nel 1982, che usava sei ’operatori’ configurabili per produrre i suoni.
Funzionamento La Sintesi FM applica al segnale di ingresso delle trasformazioni non lineari. Questo si traduce nell’arricchimento e nella traslazione dello spettro del segnale. L’arricchimento dello spettro deriva dalla distorsione della fase del segnale e si traduce in una maggiore brillantezza e corposità tonale del suono. La traslazione dello spettro è legata alla presenza di un segnale sinusoidale portante che permette di spostare lo spettro sulle frequenze desiderate, permettendo di controllare i rapporti armonici tra i vari contributi frequenziali.
Per riuscire a capire correttamente come opera la Sintesi FM è opportuno considerare da principio un segnale modulato in fase del tipo: s (t) = sin (2πf c t + φ (t))
dove f c è la frequenza portante del segnale s (t), e φ (t) è il segnale modulante. A seconda della forma che assume φ (t), si avranno diversi tipi di distorsione del segnale. Analiziamone alcuni casi. Modulante Semplice Consideriamo il caso in cui la modulante sia una singola sinusoide di ampiezza I (indice di modulazione) e frequenza f m . Otteniamo quindi φ (t) = I sin (2πf m t)
che produce un segnale modulato del tipo s (t) = sin [2πf c t + I sin (2πf m t)]
che diventa, usando le formule di sommazione per archi s (t) = sin (2πf c t) · cos[I sin (2πf m t)] + cos (2πf c t) · sin[I sin (2πf m t)]
a questo punto possiamo sviluppare in serie di Fourier le funzioni periodiche cos [I sin (2πf m t)] e sin [I sin (2πf m t)], la prima sviluppata in soli termini pari e la seconda in soli termini dispari.
1
cos[I sin (2πf m t)] =J 0 (I ) + 2 J 2 (I ) cos(4πf m t) + + · · · + 2J 2k (I ) cos(4kπf m t) + . . . sin[I sin (2πf m t)] =2J 1 (I ) sin(2πf m t) + 2 J 3 (I ) sin(6πf m t) + + · · · + 2J 2k−1 (I ) sin (2(2k − 1)πf m t) + . . .
Ora moltiplicando i termini in frequenza portante per gli sviluppi in serie di Fourier appena trovati e ricordando che, per le formule di Werner si ha che sin(α) cos(β ) = 1 2
[sin(α − β ) + sin(α + β )], otteniamo il seguente risultato. s (t) = J 0 (I ) sin2πf c t
− J 1 (I ) [sin2π (f c − f m )t − sin2π (f c + f m )t]
+ J 2 (I ) [sin2π (f c − 2f m )t + sin 2π (f c + 2 f m )t] − J 3 (I ) [sin2π (f c − 3f m )t − sin2π (f c + 3 f m )t]
+ ...
I coefficienti dello sviluppo in serie di Fourier J k (I ), sono proprio funzioni di Bessel del primo tipo di ordine k. Sfruttando ora la proprietà di tali funzioni per la quale vale J −k (I ) = ( −1)k J k (I ) per k ≥ 0, otteniamo la seguente forma compatta. s (t) =
J k (I ) sin[2π (f c + kf m )t]
k
Analizzando il risultato ci si accorge che il segnale risultante ha una ampiezza data da J k (I )
e uno spettro centrato nelle frequenze f c ± kf m . È doveroso precisare che pur essendo la sommatoria estesa a infiniti termini, solo le funzioni di Bessel di ordine più basso sono significative per indici di modulazione piccoli. All’aumentare del valore di I , la potenza del segnale si distribuisce maggiormente sullle frequenze parziali, aumentando conseguentemente la banda del segnale modulato. Facendo riferimento alla regola di Carson , che ci identifica una banda di larghezza finita per le modulazioni FM/PM tale da contenere circa il 98% della
potenza del segnale, si può considerare empiricamente un numero L di frequenze laterali con potenza non trascurabile pari a circa L = 1.5 · I (per una trattazione più dettagliata sulle funzioni di Bessel e sulla regola di Carson si rimanda a [1],[4]). Interpretiamo ora il caso preso in esame rispetto alla modulazione di frequenza. Sapendo che la fase istantanea di un segnale del tipo s (t) = sin [ψ (t)] è data da f i (t) = 21π · dψ , la dt frequenza istantanea del nostro segnale vale f i (t) = f c + If m cos (2πf m t)
ovvero varia intorno alla frequenza portante f c con una deviazione massima di I · f m .
2
Spettro di frequenze di un segnale con con fc = 200 Hz, fm = 500 hz e indice di modulazione unitario
0.35
0.3
0.25
0.2 r e w o P
0.15
0.1
0.05
0
-3000
-2000
-1000
0 Hz
1000
2000
3000
Portante Composta Possiamo ora applicare i risultati ottenuti a un segnale la cui portante non sia una semplice sinusoide, ma un segnale periodico composto da più sinusoidi operanti a diverse frequenze.
Questo mette in luce una importante potenzialità della Sintesi FM. Consideriamo per esempio un segnale costituito dalla somma di due sinusoidi, centrate in due frequenze f c1 e f c2 entrambe modulate con la stessa frequenza f m = f m1 = f m2 . Il segnale risultante sarà del tipo s (t) = sin [2πf c1 t + I sin (2πf m t)] + sin [2πf c2 t + I sin (2πf m t)]
e produrrà uno spettro di frequenze che saranno centrate in [ f c1 ± kf m ] [f c2 ± kf m ].
Questa peculiarità è particolarmente utile nella sintesi sonora, in quanto permette di generare contributi tonali in frequenze specifiche, semplicemente sommando segnali con portanti in quelle frequenze.
3
Spettro di un segnale composto da due portanti in fc1 = 200 Hz e fc2 = 10000 Hz con modulanti fm1 = fm2 = 500 Hz 0.4
0.35
0.3
0.25
r e w o P
0.2
0.15
0.1
0.05
0 -2.5
-2
-1.5
-1
-0.5
0 Hz
0.5
1
1.5
2
2.5 4
x 10
Modulante Composta Sulla scia del caso precedente è legittimo pensare di costruire un segnale modulante composto da più sinusoidi sommate tra loro. Consideriamo per esempio il caso di una portante singola = f m2. Otterremo quindi un segnale f c e di due frequenze modulanti f m1 e f m2 , con f m1 del tipo s (t) = sin [2πf c t + I 1 sin (2πf m1 t) + I 2 sin (2πf m2 t)]
=
k
J k (I 1 ) · J h (I 2 )sin[2π (f c + kf m1 + hf m2 ) t]
h
Lo spettro risultante è molto più complicato, con contributi frequenziali centrati in [ f c ± kf m1 ± hf m2 ]
Una considerazione interessante va fatta in merito al tipo di rapporto tra le frequenze di
modulazione. Se hanno rapporti semplici tra loro, lo spettro del segnale ha contributi alle frequenze [ f c ± f M CD ], con f M CD il massimo comun divisore tra le due frequenze modulanti. Cio significa che si ottengono suoni simili a quelli ottenuti con la modulazione semplice ma con una maggiore complessità tonale.
Se invece i rapporti tra le frequenze modulanti non sono semplici, si generano suoni inarmonici e potenzialmente rumorosi. Tuttavia nel caso in cui f m1 sia multipla di f m2 a meno di un errore ε molto piccolo, si ottengono risultati che simulano la intrinseca , per quanto minima, inarmonicità dei suoni prodotti dagli strumenti reali.
4
Spettro delle frequenze di un segnale a singola portante fc = 300 Hz e modulante complessa composta da due termini in fm1 = 300 Hz e fm2 = 1200 Hz 0.35
0.3
0.25
0.2 r e w o P
0.15
0.1
0.05
0 -2.5
-2
-1.5
-1
-0.5
0 Hz
0.5
1
1.5
2
2.5 4
x 10
Spettro del segnale precedente a cui sono state modificate leggermente le frequenze di modulazione per ottenere dei rapporti non semplici
0.2
0.15
r e w o P
0.1
0.05
0 -1
-0.5
0 Hz
5
0.5
1 4
x 10
PROGETTO Alla luce di quanto detto fino ad ora è doveroso mostrare come si possano effettivamente applicare le nozioni teoriche appena viste per la Sintesi FM si segnali audio.
Si è deciso di riportare un esempio, realizzato in MATLAB, che tenta di riprodurre i suoni di un quartetto di campane che suonano una semplice melodia. Tuttavia prima di procedere è bene avere qualche nozione in più sulle frequenze che identificano le note musicali e sull’ acustica delle campane. Acustica delle campane e analisi tonale Partiamo dal presupposto che possiamo dividere lo spettro delle frequenze da noi udibili in
ottave, ogniuna delle quali composta da 12 semitoni che identificano, per ogni ottava, le note musicali che conosciamo. Questo significa che ad ogni nota musicale è associata una determinata frequenza specifica per ogni ottava di riferimento. Queste frequenze hanno diverse proprietà. Per cominciare il rapporto tra una frequenza che identifica una nota e quella che identifica la successiva è sempre costante. Inoltre basta raddoppiare o dimezzare una frequenza che identifichi una nota qualsiasi per ottenere la stessa nota, rispettivamente di una ottava più alta o più bassa. Per esempio, partendo dal presupposto che la frequenza di 440 Hz identifica un LA sulla quarta ottava, allora una frequenza di 880 Hz identificherà un LA sulla quinta ottava e così via.
Gli strumenti musicali, tuttavia, non emettono suoni composti da singole note, bensì producono suoni più complessi costituiti da diverse note, distribuite su diverse ottave, e suonate con intensità differente. Le campane non fanno eccezione. Esse infatti producono ad ogni rintocco almeno 3 note differenti distribuite su 3 ottave diverse. Normalmente ogni
campana è progettata per emettere una nota nominale mentre le altre note che emette suonando, sono di contorno ed esaltano il suono della nota nominale, esattamente come per gli accordi di una chitarra o di un pianoforte. Queste note sono distribuite secondo un
ordine preciso. Viene suonata la prima (la nota nominale), la terza minore (la terza nota rispetto alla prima, diminuita di un semitono), la quinta (la quinta nota dalla prima), la prima sull’ottava inferiore e su quella superiore. Info Codice MATLAB Si noti che l’emulazione di ogni campana è stata realizzata attraverso la sovrapposizione di
quattro segnali, con contributi frequenziali pesati, presenti su tutte e cinque le frequenze minime delle note necessarie a produrre il suono cercato. Le campane, infatti, a differenza di altri tipi di strumenti a percussione che producono suoni caratterizzati da una sola nota
distribuita su diverse ottave, sviluppano veri e propri accordi come quelli che si possono suonare su una chitarra o un piano.
L’idea è stata quella di agire separatamente sulle parti dello spettro che si voleva modulare.
Nello specifico, per ogni campana, il segnale numero uno è quello più potente e agisce sulla nota nominale della campana. Si è deciso di modularlo con una frequenza multipla esatta della frequenza nominale stessa, ovvero quattro volte superiore. Questo garantisce una perfetta armonicità della nota nominale, che ha contributi sensibili sia sull’ottava di riferimento, che sulla quinta. Il segnale numero due ha un’ampiezza leggermente più piccola del primo ed agisce sulla
nota corrispondente alla terza minore dell’accordo della campana. Anche in questo caso la modulazione è fatta con una frequenza quattro volte superiore a quella della nota in questione, sempre per aggiungere carattere tonale al suono. Stavolta però, la frequenza
6
modulante non è un multiplo esatto della portante, ma vi è un errore di qualche Hz. Questo conferisce al segnale un lieve tocco inarmonico che dovrebbe simulare meglio il suono reale.
Il segnale numero tre è il più debole dei quattro. La ragione è che esso serve a dare contriburi frequenziali relativi alla nota corrispondente alla quinta dell’accordo, che tipicamente è quella che fornisce meno potenza al suono di una campana. La modulazione è stata fatta con una modulante composta da due sinusoidi, una nella stessa frequenza della
portante, e l’altra ad una frequenza circa quattro volte superiore. Questa scelta è stata fatta nella speranza di dare maggiore carattere tonale alla frequenza portante del segnale, per compensarne l’ampiezza ridotta.
Il segnale numero quattro, infine, è caratterizzato da una media potenza e fornisce contributi frequenziali relativi alla nota nominale della campana, sia sull’ottava più bassa che su quella più alta. Questo risultato è ottenuto attraverso una modulazione effettuata con una sinusoide semplice alla stessa frequenza della portante, ma con un indice di modulazione I = 3 che garantisce quindi contributi significativi su circa quattro frequenze laterali. Si precisa che tutti gli indici numerici, relativi all’ampiezze, al decadimento del suono e
ai modificatori vari delle frequenze scelte per le modulanti, sono stati stabiliti in maniera totalmente empirica. Chi scrive ha ritenuto che tra le varie soluzioni provate, quella proposta sia stata la più efficace trovata.
7
8
Conclusioni
Alla luce di ciò che è stato illustrato, si capisce che la Sintesi FM è sicuramente uno strumento potente, che permette di produrre sonorità ricche di contributi tonali senza richiedere capacità computazionali proibitive, in quanto bastano pochi parametri inseriti in una configurazione semplice per ottenere risultati importanti. Va tuttavia sottolineato come questo strumento, per quanto potente, non sia di facile e intuitivo utilizzo per la realizzazione di sonorità che emulino quelle di strumenti reali. Ci vuole infatti una enorme
esperienza e molti tentativi per ottenere dei risultati accettabili. Per questa ragione col passare del tempo e con la scoperta di mezzi di calcolo sempre più performanti, l’uso della Sintesi FM ha ceduto il passo, almeno in alcuni campi, a metodi di sintesi di più immediato riscontro pratico, seppur di maggiore complessità computazionale.
9
Bibliografia [1] Matteo Franca. Le Funzioni di Bessel – Appunti del corso di Metodi Matematici . Dipartimento di Scienze Matematiche, Università Politecnica delle Marche. [2] Giovanni De Poli. Carlo Cap. 5 . Università di Padova. [3]
Drioli, Federico Avanzini . Sintesi
Valentino Liberali. Teoria
dei segnali audio,
dei Segnali – Modulazione di frequenza e di fase .
Dipartimento di Fisica, Università degli Studi di Milano. [4] Matteo Beardo . Dispense di Comunicazioni Elettriche, Cap. 6 . Politecnico di Torino. [5] Wikipedia. Armoniche Cilindriche . http://it.wikipedia.org/wiki/Armoniche_cilindriche [6] Wikipedia. Equazioni di Bessel . http://it.wikipedia.org/wiki/Equazioni_di_Bessel
10