Cap. 3 Fonetica
acustica
3.1 Elementi di
fisica acustica
3.1.1 L’onda sonora
Il
suono consiste nella oscillazione di
particelle di un mezzo provocata
dalle vibrazioni di un corpo detto sorgente.
Queste vibrazioni si trasmettono alle molecole del mezzo (aria, acqua ecc.),
che si mettono in movimento oscillando avanti e indietro rispetto al loro punto di riposo. Se facciamo vibrare un
diapason, le sue vibrazioni provocheranno alle molecole d’aria vicine analoghi
movimenti oscillatori, che si trasmetteranno alle molecole adiacenti imprimendo
loro un analogo movimento pendolare. Questo fenomeno è detto onda sonora, che tenderà a propagarsi
dalla sorgente verso tutte le direzioni libere fino a quando, allontanandosi
dalla sorgente, le vibrazioni cessano. Considerando una serie di particelle
durante la propagazione sonora (vd. Figura 3.1), ci si accorge che in ogni
momento si alternano zone in cui le particelle si avvicinano tra loro (zone di condensazione) a zone in cui queste si
allontanano (zone di rarefazione).
La
velocità con cui un suono si propaga dipende dal mezzo e dalle sue
caratteristiche fisiche (densità, temperatura, pressione ecc.). A parità di
tutte queste variabili, la velocità del suono è costante (ad esempio, nell’aria
a 20° di temperatura e pressione a 760 mm il suono si propaga alla velocità di 343
mt al secondo).
Infine,
se analizziamo una fila di particelle (della figura 3.1) possiamo misurare la
distanza che separa due successive zone di condensazione o quelle di
rarefazione. Questa distanza è detta lunghezza
d’onda.
3.1.2 I segnali semplici
Possiamo
rappresentare gli spostamenti di una particella nel tempo con un grafico
cartesiano, disponendo il tempo sull’asse delle ascisse e gli spostamenti
sull’asse delle ordinate.
Per
un’onda sonora prodotta da un diapason sul grafico (fig. 3.2) apparirà una curva
chiamata sinusoide che tende
periodicamente a ripetersi sempre uguale e questo tipo di oscillazione viene
perciò definito periodico. Il ciclo oscillatorio consiste di quattro
fasi: spostamento in avanti; ritorno all’indietro al punto di riposo;
spostamento all’indietro; ritorno in avanti verso il punto di riposo e il tempo
T per compiere l’intero ciclo è detto periodo.
Gli spostamenti in avanti (lontano dalla sorgente) sono in positivo, quelli all’indietro
(di riavvicinamento alla sorgente) in negativo. La misura degli spostamenti
massimi (in positivo e in negativo) è detta ampiezza dell’onda sonora il cui valore, insieme a quello
del tempo, sono sufficienti a descrivere un’onda periodica sinusoidale.
Tuttavia, per descrivere la dimensione temporale al posto di periodo si usa il
concetto di frequenza, che indica
quante volte il ciclo di oscillazione si ripete in un secondo. Ad es., se un
ciclo dura un decimo di secondo, si avrà una frequenza (F) di 10 cicli per
secondo (c.p.s.) e questa relazione matematica, detta di proporzionalità
inversa, si esprime con la formula F = ɪ/T oppure T = ɪ/F.
L’unità
di misura della frequenza (il c.p.s.) è detta anche Hertz (Hz), e la lunghezza
d’onda (λ), inversamente proporzionale alla frequenza (F), poiché la
velocità (V) del suono è costante può dedursi dalla formula λ = V/F. Per es., se un’onda si propaga alla
velocità di 343 mt/s a una frequenza di 100 Hz la lunghezza d’onda sarà 3,43
mt.
S’è
detto che l’ampiezza è la distanza massima dal punto di riposo. Ciò significa
che in un’onda dotata di ampiezza maggiore le spinte che le particelle
oscillanti esercitano sarà maggiore e si misura in termini di pressione sonora e può essere espressa
in termini di intensità, che si
misura in decibel (dB). Il decibel è un’unità di misura relativa e in rapporto
al suono di intensità più debole percepibile da orecchio umano (1.000 Hz) che,
quindi, corrisponde a 0 dB. Questa misura relativa all’intensità è detta livello di intensità sonora (il).
Stabilità l’intensità del suono più debole percepibile, osserviamo che il suono
più forte percepibile è centomila miliardi (1014) di volte più forte
e, ovviamente, misurabile attraverso una scala logaritmica, basata sugli
esponenti delle potenze di 10 e che va quindi soltanto da 0 a 14. l’unità di misura così
definita è detta Bell e il decibel
si ottiene moltiplicando il Bell per 10 e può essere espresso con la
formula il
= 10 log I/Iₒ, ossia il livello di intensità sonora (il) è uguale a 10 volte il logaritmo del rapporto tra
intensità I del segnale in esame e l’intensità Iₒ presa convenzionalmente come
riferimento.
3.1.3 I segnali complessi
La
forma sinusoidale e la periodicità non sono comuni a tutti i tipi di onde
sonore: infatti, se la sorgente oscilla in modo complesso, anche l’onda sonora
sarà complessa. In base alla presenza o meno delle due caratteristiche
segnalate, le onde sonore possono suddividersi in:
-
onde periodiche sinusoidali o semplici, come quelle prodotte dal diapason;
-
onde periodiche non sinusoidali o complesse, che non hanno forma sinusoidale ma sono periodiche;
-
onde non periodiche o aperiodiche, che non hanno periodicità, non sono suddivisibili in
cicli uguali e sono definibili come rumore.
Tutti
i suoni linguistici appartengono alle due ultime categorie, cioè sono segnali periodici complessi le
vibrazioni prodotte dalle pliche vocali, sono segnali aperiodici quelli prodotti dalle esplosioni e frizioni che
avvengono nell’apparato fonatorio.
In
un’onda periodica complessa (figura 3.3) possiamo comunque individuare
l’ampiezza massima e il periodo e, analogamente, possiamo calcolare la
frequenza (in Hz) come l’inverso del periodo.
In
un’onda aperiodica (figura 3.4) invece, possiamo stabilire l’ampiezza massima
ma non il periodo né la frequenza.
3.1.4 L’analisi di Fourier
L’ampiezza
e la frequenza sono parametri sufficienti per definire un segnale sinusoidale,
ma per descrivere un’onda periodica complessa non bastano; si ricorre pertanto
all’analisi di Fourier, secondo cui un’onda periodica complessa si può
scomporre e analizzare come una serie di onde periodiche semplici, che possono
essere descritte in modo non ambiguo in base all’ampiezza e la frequenza, che
vengono dette armoniche del segnale
complesso e il loro insieme è detto spettro.
Un
postulato molto importante dell’analisi di Fourier è che le frequenze delle
armoniche sono multipli interi della frequenza del segnale complesso. Ad es.,
un segnale periodico complesso della frequenza di 100 Hz viene scomposto in una
serie di armoniche di frequenze uguali a 100*1, 100*2, 100*3, 100*n, ovvero 100
Hz, 200 Hz, 300 Hz ecc. Questa serie di armoniche è detta serie di Fourier. La frequenza della prima armonica, per
definizione uguale a quella del segnale complesso (100 Hz*1, nel nostro
esempio) è chiamata frequenza
fondamentale ed è indicata con la sigla Fₒ.
Le
ampiezze delle diverse armoniche, invece, non sono calcolabili se non
ricorrendo a procedimenti matematici e elettronici sofisticati.
3.1.5 I filtri
La scomposizione di un’onda complessa
periodica viene eseguita con un metodo basato su dispositivi detti filtri, capaci di individuare le
armoniche all’interno di un determinato intervallo di frequenza e di separarle
da tutte le altre di frequenza diversa. Ad es., un filtro con una banda che va
da 50 a
150 Hz di un segnale periodico complesso della frequenza di 100 Hz e sappiamo
che le armoniche di questo segnale hanno frequenze di 100, 200, 300, 400 Hz, il
filtro sarà in grado di individuare la prima armonica (100 Hz) e separarla. Con
un filtro poi con una banda 150-250 Hz, isoliamo la seconda armonica, con un
filtro con banda 250-350 Hz isoliamo la terza armonica e così via. Con un
sistema di molti filtri (banco di filtri)
tutti della medesima larghezza di banda, giungeremo così a scomporre il segnale
complesso in tutte le sue armoniche, di cui possiamo dedurre sia la frequenza
che l’ampiezza, cioè tutta l’informazione necessaria per descrivere lo spettro
del segnale complesso.
Se
tuttavia provassimo ad analizzare lo stesso segnale con una banda più larga
50-250 Hz non potremo separare la prima e la seconda armonica. Quindi, se si
adopera una larghezza di banda stretta capace di separare le armoniche si dice
che si esegue un’analisi a banda stretta;
viceversa, avremo un’analisi a banda
larga.
3.1.6 Lo spettrogramma
Con
la scomposizione del segnale periodico complesso disponiamo quindi dei valori
di frequenza e di ampiezza e un certo numero (molto alto) di armoniche, e può
essere rappresentata con una serie di oscillogrammi, uno per ogni armonica
(cfr. fig. 3.6). Tuttavia, la rappresentazione più frequente è un grafico detto
spettrogramma, in cui la frequenza è
in ascissa e l’ampiezza in ordinata. Ma dal momento che ogni armonica è
caratterizzata dai valori della frequenza e dell’ampiezza, questo grafico
conterrà tutta l’informazione per descrivere la serie di Fourier, cioè tutto il
contenuto spettrale del segnale
complesso (cfr. fig. 3.7).
Nella
fig. 37a vediamo lo spettrogramma corrispondente all’oscillogramma di fig. 3.6,
in cui ogni armonica corrisponde a una colonnina, che parte dalla rispettiva
frequenza e si innalza in proporzione alla rispettiva ampiezza. Questo grafico
è detto spettro a righe. Se ora
congiungiamo le estremità superiori otterremo l’inviluppo spettrale.
Tuttavia,
se si esegue l’analisi di un segnale periodico complesso con un filtro a banda
larga (cioè maggiore della frequenza fondamentale) le singole armoniche non
saranno evidenziate, ma otterremo soltanto l’informazione relativa all’ampiezza
globale delle singole bande filtrate e otterremo uno spettro continuo (cfr. fig. 37b).
3.1.7 I risuonatori
Ogni
corpo elastico entra in vibrazione se sollecitato da una particolare frequenza
(frequenza di risonanza) legata alle
dimensioni e alla forma del corpo stesso.
Se
un’onda complessa attraversa un corpo cavo pieno d’aria, il suo spettro subirà
sensibili modifiche perché le armoniche di frequenza uguale alla frequenza di
risonanza verranno amplificate e altre diminuite. Una cavità che modifica lo
spettro di un segnale è detta risuonatore,
le frequenze amplificate risonanze,
quelle diminuite antirisonanze. Ma
si pensi alla cassa di un violino, il cui suono prodotto dalle vibrazioni della
corda viene modificato sensibilmente dalla cassa di risonanza. Qualcosa di
simile accade nella voce umana, modificata dalla cassa di risonanza costituita
dalle cavità del condotto vocale.
In
figura 3.8 è rappresentato lo spettrogramma della figura 3.7 passato attraverso
un sistema di risuonatori. Mentre prima le armoniche avevano un’ampiezza
regolarmente decrescente, ora le armoniche hanno ampiezze diverse e l’inviluppo
presenta dei picchi, detti formanti (F),
mentre gli avvallamenti rappresentano le armoniche indebolite dalle
antirisonanze.
3.1.8
Segnali complessi aperiodici
Abbiamo
già visto l’oscillogramma di un segnale aperiodico (fig. 3.4 p. 91) per il
quale, ovviamente, l’analisi di Fourier non avrebbe senso. È possibile invece
osservarlo attraverso un banco di filtri, e anche se nessun filtro potrà mai
individuare armoniche di un segnale aperiodico, e dunque senza ottenere spettri
a righe, otterremo spettri continui e i loro relativi inviluppi spettrali.
Se
lo spettrogramma mostra a tutte le frequenze la stessa altezza (con inviluppo
orizzontale) si parla di rumore bianco; se invece l’inviluppo presenta
altezze diverse con picchi e avvallamenti si dice che il rumore è colorato.
3.1.9
Il sonogramma
Per
analizzare un segnale dinamico (come, ad es., il suono vocale umano) è tuttavia
indispensabile considerare anche la variabile tempo: la durata e il suo variare.
Bisogna quindi disporre di uno strumento che evidenzi la sua struttura
spettrale e le sue variazioni nel tempo: il sonogramma, un grafico che
presenta il tempo in ascissa e la frequenza in ordinata.
Nella
figura 3.10 sono rappresentati gli spettrogrammi di una a e di una i
e il sonogramma della sequenza ai, dove le striature orizzontali (come
le colonne verticali degli spettrogrammi) rappresentano le armoniche nel loro
sviluppo temporale.
Nel
sonogramma l’ampiezza (o terza dimensione di un segnale acustico) è indicata in
modo indiretto mediante l’annerimento del tracciato: maggior annerimento, maggior
ampiezza. Si nota inoltre che il passaggio da un fono all’altro è graduale e
continuo. Il sonogramma è anche in grado di determinare la durata della
sequenza.
Il
sonogramma descritto è a banda stretta, cioè è realizzato con un banco
di filtri in grado di separare tutte le armoniche di un segnale complesso. A
banda larga (fig. 3.10) invece il banco non separa le singole armoniche e
le striature sono scomparse. Le fasce più larghe e più scure sono le parti
dello spettro dotate di maggior ampiezza, le formanti. Dunque un sonogramma a
banda larga da informazioni solo sulle formanti e nulla ci dice della struttura
armonica del segnale
3.2 Fonetica acustica
segmentale
3.2.1
La produzione del segnale vocale
Un
segnale vocale può esser visto come il risultato dell’attivazione di una
sorgente di segnale periodico e/o di una sorgente di rumore, combinate con un
sistema di risuonatori. La sorgente del segnale periodico si trova nella
glottide, quella del rumore nei diversi luoghi di articolazione delle consonanti.
Con
l’attivazione del meccanismo laringeo si attiva un’onda periodica complessa
(fig. 3.12) detta segnale glottico, la cui frequenza corrisponde a
quella delle vibrazioni laringee.
L’inviluppo
spettrale del segnale glottico è regolarmente decrescente, con una graduale
riduzione delle armoniche detta decadimento.
Il
segnale glottico così rappresentato non raggiungerà mai le nostre orecchie se
non dopo esser stato modificato dall’apparato fonatorio, dalla laringe alle
labbra, che possiamo rappresentare con un tubo a diametro variabile di 17-18 cm. (fig. 3.13), fungendo
quindi da cassa di risonanza variabile. Questo risuonatore dunque conferisce di
volta in volta al segnale glottico un diverso inviluppo spettrale, al quale
corrisponde il timbro di un determinato fono sonoro.
3.2.2
Le vocali
La
produzione delle vocali (sempre sonore) prevede l’attivazione del meccanismo
laringeo, che dà periodicità al segnale, e un risuonatore orale che ne
determina il timbro.
I
foni vocalici sono caratterizzati dalla presenza di alcune formanti, molto
evidenti nelle rappresentazioni grafiche, e per classificare le vocali sono
determinanti i valori di frequenza delle prime due formanti (F1 e F2).
F1
si trova a basse frequenze (200-300 Hz) per le vocali alte, aumentando di valore
man mano che passa a vocali medio-alte, medio-basse e infine basse (800 Hz),
per cui F1 è direttamente proporzionale al grado di apertura della vocale.
F2
invece, ha il suo valore minimo per le vocali posteriori alte (800 Hz) e
aumenta, avanzando nel cavo orale, fino alla frequenza massima per le vocali
anteriori alte (2.200 Hz), per cui F2 è direttamente proporzionale al grado di
anteriorità della vocale.
Nel
sonogramma a banda larga delle vocali in fig. 3.14 si nota come F1 vari in
funzione del grado di apertura e come F2 vari in funzione dell’anteriorità. Se
si considerano ora i valori medi di F1 e F2 delle vocali toniche ricavati da un
campione di 12 soggetti maschili e li poniamo su un grafico (F1 in ascissa e F2
in ordinata) notiamo che le vocali si dispongono in un modo che rende ancor più
evidente la stretta relazione tra le principali caratteristiche articolatorie
delle vocali (grado di apertura e grado di anteriorità) e le loro
caratteristiche acustiche.
La correlazione tra
caratteristiche articolatorie e..
3 pagine di 7 – per continuare segui questo link (o copialo nella
barra indirizzi):
Nessun commento:
Posta un commento