Programma
Top
Il programma del corso consiste di una parte teorica e di una parte
pratica-applicativa. La parte teorica richiama i fondamenti di elaborazione del segnale audio digitale. Sono quindi
trattati i principali modelli di elaborazione numerica del segnale audio
(suono e voce). La modellazione delle applicazioni audio-digitali viene esemplificata in
ambiente di modellazione SoundForge e di programmazione Matlab.
Teoria
1.
Fondamenti di acustica
Natura del suono, parametri fisici del suono, effetti della propagazione,
decibel, misure acustiche, potenza e intensità, tono puro, toni complessi,
strumenti di misura, parametri del suono nel tempo e in frequenza, struttura
frequenziale
2. Fondamenti di psicoacustica
Limiti della percezione acustica, sistema uditivo, altezza, banda critica,
intensità, timbro, durata, perdita uditiva.
3. Digitalizzazione dell’audio
Natura e trasformazione dei suoni, traduzione, campionamento, aliasing,
quantizzazione lineare e non lineare.
4. Analisi dell’audio
Componenti frequenzialali, struttura frequenziale del suono, spettro,
periodicità, modello frequenziale, finestratura, controllo della risoluzione
frequenziale, analisi a tempo
breve, sonogramma, analisi frequenziale di
Fourier, DFT, FFT, altre tecniche di analisi.
5. Modifica dell’audio
Natura filtrante dei sistemi audio, filtraggio analogico, filtraggio digitale,
caratteristiche dei filtri, tipologie, filtri digitali, modello matematico,
comportamento dei sistemi lineari, uso della convoluzione, uso della
deconvoluzione, risposta in frequenza, risposta all’impulso, restauro del
suono, FIR, IIR.
6. Sintesi dell’audio
Modellizzazione, sintesi additiva, sintesi sottrattiva, sintesi FM, table
look-up, filtri risonanti.
7. Analisi e sintesi della voce
Sistema fonatorio, digitalizzazione della voce, preenfasi, analisi di Fourier
con finestre sovrapposte, estrazione del pitch e delle formanti,
autocorrelazione, codifica predittiva lineare, cepstrum, sintesi,
riconoscimento,
8. Compressione dell’audio
Pulse Code Modulation lineare e non lineare, Delta Modulation, Codifica
Sub-Band, Vocoder, compressione della dinamica, MPEG audio.
9. Spazializzazione dell’audio
Echi e riverberi, risposta all’impulso, riverberatori all-pass, effetto coro,
simulazione di sorgenti sonore in movimento
Prerequisiti
Top
Analisi Matematica / Matematica discreta / Fisica/ Elaborazione Numerica del Segnale
Materiale
Top
Testo di riferimento:
M. Malcangi: "Informatica Applicata al Suono
– Digital Audio: Teoria e pratica", Maggioli Editore, Milano, 2008. Cod. 8838741824
Tutorial:
Sound Forge
Metodi didattici
Top
Modalità di esame: Scritto; Modalità di frequenza: Fortemente consigliata;
Modalità di erogazione: Tradizionale.
Esami
Risultati esami
Test corso AA 2013-2014
Test fine corso AA 2014-2015
Risultati fine corso AA 2015-2016
Stages-Tesi
(interne/esterne)
Top- Contestual sensing (audio-visual-motion)
- Emotional sensing (audio-visual-physiologic)
- Internet of Things (IoT)/Internet of Everything (IoE) audio sensing and interaction
- Indoor navigation (audio-inertial)
- Audio games
- Audio/visual human-environment interaction
- Natural User Interfaces
- Audio Sources Localization
Lezioni (Le date e i contenuti potrebbero subire variazioni)
Top
1.10.2015 - Introduzione
al corso. Natura fisica (acustica) del suono e sua rappresentazione
matematica e grafica. Misura dell'informazione del segnale audio.
Problematiche di non linearità dei trasduttori microfonici e della
catena microfonica. Campionamento e quantizzazione. Calibrazione della catena
microfonica.
5.10.2015 - Editing del segnale audio. Problematiche della segmentazione dell'audio. Click e inversione di
fase.
Formattazione della finestra di editing.
8.10.2015 - Programmazione
del segnale audio. Definizione del
formato audio digitale: frequenza di campionamento e quantizzazione.
12.10.2015 - Introduzione
all'editing del segnale audio. Problematiche della segmentazione dell'audio. Click e inversione di
fase.
Formattazione della finestra di editing.
15.10.2015 - File audio. Formato senza header (PCM grezzo) e formato con header
(Wav). Lettura e scrittura di file grezzi (senza header)19.10.2015 - Resampling e
riquantizzazione. Problematiche connesse al resampling e riquantizzazione (oversampling, dithering, noise shaping).
22.10.2015
- Analisi frequenziale di Fourier.
26.10.2015
- Problematiche applicative dell'analisi frequenziale di Fourier. Minimizzazione degli artefatti di analisi (finestratura e overlapping)..
5.11.2015 - Analisi frequenziale ed editing assistito (spettrogramma). Segmentazione del segnale audio.
9.11.2015
- Sintesi del suono. Additiva, sottrattiva, a forma d'onda memorizzata, a modulazione di frequenza.12.11.2015
- Sintesi del suono per analisi.
16.11.2015
- Prima prova in itinere (argomenti trattati dal 1.10.2015 al 12.11.2015)
19.11.2015
- Elaborazione del suono nel dominio del tempo.
23.11.2015
- Filtraggio: definizione e parametrizzazione di un filtro (passa
basso, passa alto, passa banda, elimina banda).
26.11.2015
- Modellazione tramite
risposta all'impulso (convoluzione). Risposta in frequenza.
Filtri FIR e IIR. Composizione serie e parallelo dei filtri.30.11.2015 - Filtraggio nel dominio del
tempo (filtri) e nel dominio delle frequenze (trasformate).
3.12.2015
- Equalizzazione parametrica, paragrafica e grafica.
10.12.2015
- Compressione del suono. Compressione nel dominio del tempo. Compressione nel dominio delle frequenze.
14.12.2015 - Modello
percettivo. Compressione senza perdita di informazione. Compressione
con perdita di informazione. Standard di compressione.
17.12.2015
- Spazializzazione del suono. Modellazione dell'ambiente
tramite risposta all'impulso. Suono diretto, echo, riverbero. Modello
di produzione dell'echo semplice e multiplo. Riverberatore: ambiente di riferimento: Modellazione di un sistema di conferimento di echo.
21.12.2015
- Localizzazione di sorgenti sonore nello spazio. Beamforming. Cancellazione d'eco. Cancellazione del rumore.
7.1.2016
-
Analisi e sintesi della voce. Metodi di elaborazione e di editing
dell'audio vocale. Text-to-speech e Speech-to-text. Identificazione
biometrica tramite impronta vocale. Riconoscimento delle emozioni.
11.1.2016- Comprensione del linguaggio naturale.
14.1.2016
- Seconda prova in itinere (argomenti trattati dal 19.11.2015 al 11.1.2016)
Contatti
Top
Prof. Mario Malcangi
Computer Science Department
Università degli Studi di Milano
Mail: Via Comelico 39
20135 Milano
Italy
Fax:+39.02.503.16373
Office: Via Celoria 20
Settore Didattico Edificio 3 (2° Piano)
20133 Milano
Italy
Tel: +39.02.503.14003
Fax: +39.02.503.14012
Labs: Via Celoria 20
Settore Didattico Edificio 3 (2° Piano)
20133 Milano
Italy
Tel: +39.02.503.14004
Fax: +39.02.503.14012
Email: malcangi@di.unimi.it
Skype: mario.malcangi
Last update: 28th October 2015
© Mario
Malcangi
Università degli Studi di
Milano