Esercitazione analisi non lineare dei segnali vocali

 

File allegati

 

m_file_nolinear.zip     (link)

 

Troverete all’interno 4 funzioni.

 

find_time_delay da utilizzare per la stima del time delay. Esegue il grafico della funzione di correlazione e della mutua informazione tra la serie di partenza e la serie ritardata al variare del ritardo.

 

AFNN_Plot e falsi_vicini due diversi approcci per stimare la dimensione di embedding. Il primo implementa il metodo Average False Nearest Neighbours mentre il secondo disegna la percentuale di falsi vicini all'aumentare della dimensione di embedding.

 

create_embedding fornisce la matrice di embedding a partire dalla serie temporale una volta stimati il time delay e la dimensione di embedding.

 

dati.zip            (link)

 

Alcune registrazioni in formato Microsoft WAVE (.wav) di vocali normali e da un soggetto che utilizza una parlata tracheoesofagea.

 

Descrizione

 

L’esercitazione consiste nello stimare per i diversi file quale sia il parametro teta, di un predittore S-Map, che fornisce la predizione ottima.

 

Per fare questo bisogna eseguire una corretta ricostruzione dell’embedding del segnale in esame: questo significa che per ogni segnale vanno stimati time delay e dimensione di embedding opportune.

 

Nel caso della fonazione normale nel segnale sono facilmente identificabili le ripetizioni periodiche di una forma di base. Queste sono in corrispondenza dell’apertura e della chiusura della glottide. Si raccomanda di prendere un certo numero di ripetizioni del segnale (>15). Nel caso del segnale tracheoesofageo, si cerchi di ottenere un numero equivalente di campioni ove possibile.

 

Il numero di ripetizioni della forma base nel caso normale dovrebbe aiutare a scegliere il numero di vicini per l’utilizzo dell’algoritmo AFNN (es. se abbiamo 20 ripetizioni allora i vicini per ogni punto possono essere fissati utilizzando lo stesso ordine di grandezza).

 

Si raccomanda di eliminare dai segnali vocali, il transitorio iniziale e finale, almeno nel caso di fonazione normale: nel caso del segnale tracheoesofageo potrebbe non essere semplice.

 

Le singole registrazioni ,quando viene utilizzato il metodo S-Map, vanno separate in due parti di uguale dimensione: la prima parte serve per la stima dei coefficienti di predizione che saranno poi utilizzati per predire la seconda.

 

Come indice di bontà della predizione col predittore S-Map è possibile valutare il coefficiente di correlazione tra serie predetta e serie di partenza. L’indice di bontà correntemente utilizzato è il guadagno di predizione, definito come

 

 

dove

 

con  operatore di aspettazione,  è la serie di partenza, è la serie predetta.

 è l’energia dei residui rispetto all’energia del segnale.