mercoledì 2 settembre 2015

F. Albano Leoni - P. Maturi, Manuale di Fonetica (cap. III)



Cap. 3 Fonetica acustica

3.1 Elementi di fisica acustica

3.1.1 L’onda sonora
Il suono consiste nella oscillazione di particelle di un mezzo provocata dalle vibrazioni di un corpo detto sorgente. Queste vibrazioni si trasmettono alle molecole del mezzo (aria, acqua ecc.), che si mettono in movimento oscillando avanti e indietro rispetto al loro punto di riposo. Se facciamo vibrare un diapason, le sue vibrazioni provocheranno alle molecole d’aria vicine analoghi movimenti oscillatori, che si trasmetteranno alle molecole adiacenti imprimendo loro un analogo movimento pendolare. Questo fenomeno è detto onda sonora, che tenderà a propagarsi dalla sorgente verso tutte le direzioni libere fino a quando, allontanandosi dalla sorgente, le vibrazioni cessano. Considerando una serie di particelle durante la propagazione sonora (vd. Figura 3.1), ci si accorge che in ogni momento si alternano zone in cui le particelle si avvicinano tra loro (zone di condensazione) a zone in cui queste si allontanano (zone di rarefazione).
La velocità con cui un suono si propaga dipende dal mezzo e dalle sue caratteristiche fisiche (densità, temperatura, pressione ecc.). A parità di tutte queste variabili, la velocità del suono è costante (ad esempio, nell’aria a 20° di temperatura e pressione a 760 mm il suono si propaga alla velocità di 343 mt al secondo).
Infine, se analizziamo una fila di particelle (della figura 3.1) possiamo misurare la distanza che separa due successive zone di condensazione o quelle di rarefazione. Questa distanza è detta lunghezza d’onda.

3.1.2 I segnali semplici
Possiamo rappresentare gli spostamenti di una particella nel tempo con un grafico cartesiano, disponendo il tempo sull’asse delle ascisse e gli spostamenti sull’asse delle ordinate.
Per un’onda sonora prodotta da un diapason sul grafico (fig. 3.2) apparirà una curva chiamata sinusoide che tende periodicamente a ripetersi sempre uguale e questo tipo di oscillazione viene perciò definito periodico. Il ciclo oscillatorio consiste di quattro fasi: spostamento in avanti; ritorno all’indietro al punto di riposo; spostamento all’indietro; ritorno in avanti verso il punto di riposo e il tempo T per compiere l’intero ciclo è detto periodo. Gli spostamenti in avanti (lontano dalla sorgente) sono in positivo, quelli all’indietro (di riavvicinamento alla sorgente) in negativo. La misura degli spostamenti massimi (in positivo e in negativo) è detta ampiezza dell’onda sonora il cui valore, insieme a quello del tempo, sono sufficienti a descrivere un’onda periodica sinusoidale. Tuttavia, per descrivere la dimensione temporale al posto di periodo si usa il concetto di frequenza, che indica quante volte il ciclo di oscillazione si ripete in un secondo. Ad es., se un ciclo dura un decimo di secondo, si avrà una frequenza (F) di 10 cicli per secondo (c.p.s.) e questa relazione matematica, detta di proporzionalità inversa, si esprime con la formula F = ɪ/T oppure T = ɪ/F.
L’unità di misura della frequenza (il c.p.s.) è detta anche Hertz (Hz), e la lunghezza d’onda (λ), inversamente proporzionale alla frequenza (F), poiché la velocità (V) del suono è costante può dedursi dalla formula  λ = V/F. Per es., se un’onda si propaga alla velocità di 343 mt/s a una frequenza di 100 Hz la lunghezza d’onda sarà 3,43 mt.
S’è detto che l’ampiezza è la distanza massima dal punto di riposo. Ciò significa che in un’onda dotata di ampiezza maggiore le spinte che le particelle oscillanti esercitano sarà maggiore e si misura in termini di pressione sonora e può essere espressa in termini di intensità, che si misura in decibel (dB). Il decibel è un’unità di misura relativa e in rapporto al suono di intensità più debole percepibile da orecchio umano (1.000 Hz) che, quindi, corrisponde a 0 dB. Questa misura relativa all’intensità è detta livello di intensità sonora (il). Stabilità l’intensità del suono più debole percepibile, osserviamo che il suono più forte percepibile è centomila miliardi (1014) di volte più forte e, ovviamente, misurabile attraverso una scala logaritmica, basata sugli esponenti delle potenze di 10 e che va quindi soltanto da 0 a 14. l’unità di misura così definita è detta Bell e il decibel si ottiene moltiplicando il Bell per 10 e può essere espresso con la formula  il = 10 log I/Iₒ, ossia il livello di intensità sonora (il) è uguale a 10 volte il logaritmo del rapporto tra intensità I del segnale in esame e l’intensità Iₒ presa convenzionalmente come riferimento.

3.1.3 I segnali complessi
La forma sinusoidale e la periodicità non sono comuni a tutti i tipi di onde sonore: infatti, se la sorgente oscilla in modo complesso, anche l’onda sonora sarà complessa. In base alla presenza o meno delle due caratteristiche segnalate, le onde sonore possono suddividersi in:
-          onde periodiche sinusoidali o semplici, come quelle prodotte dal diapason;
-          onde periodiche non sinusoidali o complesse, che non hanno forma sinusoidale ma sono periodiche;
-          onde non periodiche o aperiodiche, che non hanno periodicità, non sono suddivisibili in cicli uguali e sono definibili come rumore.
Tutti i suoni linguistici appartengono alle due ultime categorie, cioè sono segnali periodici complessi le vibrazioni prodotte dalle pliche vocali, sono segnali aperiodici quelli prodotti dalle esplosioni e frizioni che avvengono nell’apparato fonatorio.
In un’onda periodica complessa (figura 3.3) possiamo comunque individuare l’ampiezza massima e il periodo e, analogamente, possiamo calcolare la frequenza (in Hz) come l’inverso del periodo.
In un’onda aperiodica (figura 3.4) invece, possiamo stabilire l’ampiezza massima ma non il periodo né la frequenza.

3.1.4 L’analisi di Fourier
L’ampiezza e la frequenza sono parametri sufficienti per definire un segnale sinusoidale, ma per descrivere un’onda periodica complessa non bastano; si ricorre pertanto all’analisi di Fourier, secondo cui un’onda periodica complessa si può scomporre e analizzare come una serie di onde periodiche semplici, che possono essere descritte in modo non ambiguo in base all’ampiezza e la frequenza, che vengono dette armoniche del segnale complesso e il loro insieme è detto spettro.
Un postulato molto importante dell’analisi di Fourier è che le frequenze delle armoniche sono multipli interi della frequenza del segnale complesso. Ad es., un segnale periodico complesso della frequenza di 100 Hz viene scomposto in una serie di armoniche di frequenze uguali a 100*1, 100*2, 100*3, 100*n, ovvero 100 Hz, 200 Hz, 300 Hz ecc. Questa serie di armoniche è detta serie di Fourier. La frequenza della prima armonica, per definizione uguale a quella del segnale complesso (100 Hz*1, nel nostro esempio) è chiamata frequenza fondamentale ed è indicata con la sigla Fₒ.
Le ampiezze delle diverse armoniche, invece, non sono calcolabili se non ricorrendo a procedimenti matematici e elettronici sofisticati.

3.1.5 I filtri
 La scomposizione di un’onda complessa periodica viene eseguita con un metodo basato su dispositivi detti filtri, capaci di individuare le armoniche all’interno di un determinato intervallo di frequenza e di separarle da tutte le altre di frequenza diversa. Ad es., un filtro con una banda che va da 50 a 150 Hz di un segnale periodico complesso della frequenza di 100 Hz e sappiamo che le armoniche di questo segnale hanno frequenze di 100, 200, 300, 400 Hz, il filtro sarà in grado di individuare la prima armonica (100 Hz) e separarla. Con un filtro poi con una banda 150-250 Hz, isoliamo la seconda armonica, con un filtro con banda 250-350 Hz isoliamo la terza armonica e così via. Con un sistema di molti filtri (banco di filtri) tutti della medesima larghezza di banda, giungeremo così a scomporre il segnale complesso in tutte le sue armoniche, di cui possiamo dedurre sia la frequenza che l’ampiezza, cioè tutta l’informazione necessaria per descrivere lo spettro del segnale complesso.
Se tuttavia provassimo ad analizzare lo stesso segnale con una banda più larga 50-250 Hz non potremo separare la prima e la seconda armonica. Quindi, se si adopera una larghezza di banda stretta capace di separare le armoniche si dice che si esegue un’analisi a banda stretta; viceversa, avremo un’analisi a banda larga.

3.1.6 Lo spettrogramma
Con la scomposizione del segnale periodico complesso disponiamo quindi dei valori di frequenza e di ampiezza e un certo numero (molto alto) di armoniche, e può essere rappresentata con una serie di oscillogrammi, uno per ogni armonica (cfr. fig. 3.6). Tuttavia, la rappresentazione più frequente è un grafico detto spettrogramma, in cui la frequenza è in ascissa e l’ampiezza in ordinata. Ma dal momento che ogni armonica è caratterizzata dai valori della frequenza e dell’ampiezza, questo grafico conterrà tutta l’informazione per descrivere la serie di Fourier, cioè tutto il contenuto spettrale del segnale complesso (cfr. fig. 3.7).
Nella fig. 37a vediamo lo spettrogramma corrispondente all’oscillogramma di fig. 3.6, in cui ogni armonica corrisponde a una colonnina, che parte dalla rispettiva frequenza e si innalza in proporzione alla rispettiva ampiezza. Questo grafico è detto spettro a righe. Se ora congiungiamo le estremità superiori otterremo l’inviluppo spettrale.
Tuttavia, se si esegue l’analisi di un segnale periodico complesso con un filtro a banda larga (cioè maggiore della frequenza fondamentale) le singole armoniche non saranno evidenziate, ma otterremo soltanto l’informazione relativa all’ampiezza globale delle singole bande filtrate e otterremo uno spettro continuo (cfr. fig. 37b).

3.1.7 I risuonatori
Ogni corpo elastico entra in vibrazione se sollecitato da una particolare frequenza (frequenza di risonanza) legata alle dimensioni e alla forma del corpo stesso.
Se un’onda complessa attraversa un corpo cavo pieno d’aria, il suo spettro subirà sensibili modifiche perché le armoniche di frequenza uguale alla frequenza di risonanza verranno amplificate e altre diminuite. Una cavità che modifica lo spettro di un segnale è detta risuonatore, le frequenze amplificate risonanze, quelle diminuite antirisonanze. Ma si pensi alla cassa di un violino, il cui suono prodotto dalle vibrazioni della corda viene modificato sensibilmente dalla cassa di risonanza. Qualcosa di simile accade nella voce umana, modificata dalla cassa di risonanza costituita dalle cavità del condotto vocale.
In figura 3.8 è rappresentato lo spettrogramma della figura 3.7 passato attraverso un sistema di risuonatori. Mentre prima le armoniche avevano un’ampiezza regolarmente decrescente, ora le armoniche hanno ampiezze diverse e l’inviluppo presenta dei picchi, detti formanti (F), mentre gli avvallamenti rappresentano le armoniche indebolite dalle antirisonanze.

3.1.8 Segnali complessi aperiodici
Abbiamo già visto l’oscillogramma di un segnale aperiodico (fig. 3.4 p. 91) per il quale, ovviamente, l’analisi di Fourier non avrebbe senso. È possibile invece osservarlo attraverso un banco di filtri, e anche se nessun filtro potrà mai individuare armoniche di un segnale aperiodico, e dunque senza ottenere spettri a righe, otterremo spettri continui e i loro relativi inviluppi spettrali.
Se lo spettrogramma mostra a tutte le frequenze la stessa altezza (con inviluppo orizzontale) si parla di rumore bianco; se invece l’inviluppo presenta altezze diverse con picchi e avvallamenti si dice che il rumore è colorato.

3.1.9 Il sonogramma
Per analizzare un segnale dinamico (come, ad es., il suono vocale umano) è tuttavia indispensabile considerare anche la variabile tempo: la durata e il suo variare. Bisogna quindi disporre di uno strumento che evidenzi la sua struttura spettrale e le sue variazioni nel tempo: il sonogramma, un grafico che presenta il tempo in ascissa e la frequenza in ordinata.
Nella figura 3.10 sono rappresentati gli spettrogrammi di una a e di una i e il sonogramma della sequenza ai, dove le striature orizzontali (come le colonne verticali degli spettrogrammi) rappresentano le armoniche nel loro sviluppo temporale.
Nel sonogramma l’ampiezza (o terza dimensione di un segnale acustico) è indicata in modo indiretto mediante l’annerimento del tracciato: maggior annerimento, maggior ampiezza. Si nota inoltre che il passaggio da un fono all’altro è graduale e continuo. Il sonogramma è anche in grado di determinare la durata della sequenza.
Il sonogramma descritto è a banda stretta, cioè è realizzato con un banco di filtri in grado di separare tutte le armoniche di un segnale complesso. A banda larga (fig. 3.10) invece il banco non separa le singole armoniche e le striature sono scomparse. Le fasce più larghe e più scure sono le parti dello spettro dotate di maggior ampiezza, le formanti. Dunque un sonogramma a banda larga da informazioni solo sulle formanti e nulla ci dice della struttura armonica del segnale

3.2 Fonetica acustica segmentale

3.2.1 La produzione del segnale vocale
Un segnale vocale può esser visto come il risultato dell’attivazione di una sorgente di segnale periodico e/o di una sorgente di rumore, combinate con un sistema di risuonatori. La sorgente del segnale periodico si trova nella glottide, quella del rumore nei diversi luoghi di articolazione delle consonanti.
Con l’attivazione del meccanismo laringeo si attiva un’onda periodica complessa (fig. 3.12) detta segnale glottico, la cui frequenza corrisponde a quella delle vibrazioni laringee.
L’inviluppo spettrale del segnale glottico è regolarmente decrescente, con una graduale riduzione delle armoniche detta decadimento.
Il segnale glottico così rappresentato non raggiungerà mai le nostre orecchie se non dopo esser stato modificato dall’apparato fonatorio, dalla laringe alle labbra, che possiamo rappresentare con un tubo a diametro variabile di 17-18 cm. (fig. 3.13), fungendo quindi da cassa di risonanza variabile. Questo risuonatore dunque conferisce di volta in volta al segnale glottico un diverso inviluppo spettrale, al quale corrisponde il timbro di un determinato fono sonoro.

3.2.2 Le vocali
La produzione delle vocali (sempre sonore) prevede l’attivazione del meccanismo laringeo, che dà periodicità al segnale, e un risuonatore orale che ne determina il timbro.
I foni vocalici sono caratterizzati dalla presenza di alcune formanti, molto evidenti nelle rappresentazioni grafiche, e per classificare le vocali sono determinanti i valori di frequenza delle prime due formanti (F1 e F2).
F1 si trova a basse frequenze (200-300 Hz) per le vocali alte, aumentando di valore man mano che passa a vocali medio-alte, medio-basse e infine basse (800 Hz), per cui F1 è direttamente proporzionale al grado di apertura della vocale.
F2 invece, ha il suo valore minimo per le vocali posteriori alte (800 Hz) e aumenta, avanzando nel cavo orale, fino alla frequenza massima per le vocali anteriori alte (2.200 Hz), per cui F2 è direttamente proporzionale al grado di anteriorità della vocale.
Nel sonogramma a banda larga delle vocali in fig. 3.14 si nota come F1 vari in funzione del grado di apertura e come F2 vari in funzione dell’anteriorità. Se si considerano ora i valori medi di F1 e F2 delle vocali toniche ricavati da un campione di 12 soggetti maschili e li poniamo su un grafico (F1 in ascissa e F2 in ordinata) notiamo che le vocali si dispongono in un modo che rende ancor più evidente la stretta relazione tra le principali caratteristiche articolatorie delle vocali (grado di apertura e grado di anteriorità) e le loro caratteristiche acustiche.
La correlazione tra caratteristiche articolatorie e..


3 pagine di 7 – per continuare segui questo link (o copialo nella barra indirizzi):

Nessun commento:

Posta un commento