GOVORNE IN SLIKOVNE TEHNOLOGIJE prof. dr. France

Izvajanje in seznam predavanj
GOVORNE IN SLIKOVNE
TEHNOLOGIJE
prof. dr. France Mihelič
IZVAJANJE

Predavatelj

Asistenta

Url

Literatura
prof. France Mihelič
Govorilne ure: četrtek 11:30 – 12:15
Elm. france.mihelic@fe.uni-lj.si
Prostor: Kabinet BN207
Tel. 01 4768 841
doc. Simon Dobrišek – govorne tehnologije
as. Vitomir Štruc – slikovne tehnologije
Elm. simon.dobrisek@fe.uni-lj.si
Elm. vitomir.struc@fe.uni-lj.si
Prostor: LUKS – BN204
Tel. 01 4768 839
http://luks.fe.uni-lj.si/sl/studij/GST/index.html






Signali, France Mihelič, Založba FE in FRI, 2006
Razpoznavanje vzorcev, Nikola Pavešić, Založba FE in FRI, 2004
Spoken Language Processing: A Guide to Theory, Algorithm and System Development,
Huang X., Acero A., Hon H.W.:, Prentice Hall, 2001
Digital Image Processing, R.C. Gonzales, R.E. Woods, Pearson Prantice Hall, 2008
Predstavitve s predavanj na spletni strani predmeta
Navodila za vaje na spletni strani predmeta
OBVEZNOSTI IN OCENJEVANJE

Obveznosti
Laboratorijske vaje
 Pisni izpit
 Ustni izpit


Ocenjevanje
Pogoj za opravljanje ustnega izpita je pozitivna ocena iz vaj, ki
sestoji iz ocene lab. vaj in ocene pisnega izpita.
 Skupna ocena se določi kot povprečna ocena vaj in ustnega izpita.


Prisotnost
Prisotnost na predavanjih in vajah se beleži ni pa obvezna.
 Študent na osnovi prisotnosti lahko pridobi določeno število točk.
 Bolj podrobno bo točkovalnik predstavljen na spletni strani
predmeta http://luks.fe.uni-lj.si/sl/studij/GST/index.html


Laboratorijske vaje se bodo začele v tednu 05. – 10. marca.
SEZNAM PREDAVANJ

Predstavitev področja govornih tehnologij







Primeri sistemov govornih tehnologij
Variabilnost govornega signala
Interdisciplinarnost področja
Uporaba
Govorne tehnologije za slovenski jezik
Zgodovina
Razpoznavanje vzorcev
SEZNAM PREDAVANJ

Govor splošno
Tvorjenje in zaznavanje govora pri ljudeh
 Značilnosti govornega signala in njegove predstavitve
 Kodiranje informacije z govorom
 Govorne podatkovne zbirke



Označevanje govornih podatkov
MRPA notacija
SEZNAM PREDAVANJ

Obdelava govornega signala
Zajemanje govornega signala
 Določanje značilk







Oknenje
Ocena amplitudne spektra
Pasovni filtri
Kepstrum
LPC, LPC kepstrum
Dinamične značilke
SEZNAM PREDAVANJ

Razpoznavanje govora

Vrste razpoznavanja



Besedilo (ločeno izgovorjene besede, glasovi, tekoč govor)
Govorec (verifikacija/razpoznavanje identitete, ugotavljanje
čustvenega stanja, psihofizičnih karakteristik, … )
Tehnologija razpoznavanja


DTW
HMM
SEZNAM PREDAVANJ

Sinteza govora
Zgradba sistema
 Tehnologija tvorjenja akustičnega signala





Difonska sinteza – TD PSOLA
Korpusna sinteza
HMM sinteza
Vrednotenje delovanja sintetizatorjev
SEZNAM PREDAVANJ
Sinteza
govora
Razpoznavanje
govora

Dialog
Zgradba sistema in opis posameznih modulov
 Načini vodenja dialoga
 Vrednotenje delovanja

SEZNAM PREDAVANJ

Slikovne tehnologije - Uvod








Uvod v slikovne tehnologije
Naloge/problemi
Zgradba slike, vzorčenje in kvantizacija
Prostorska in svetlostna ločljivost
Relacije med elementi
Osnovne transformacije
Barvne slike
Formati in kompresija
SEZNAM PREDAVANJ

Obdelava slik

Izboljšanje slik v slikovnem prostoru
Točkovno
 Lokalno
 Globalno


Izboljšanje slik v frekvenčnem prostoru
DFT
 Filtriranje v frekvenčnem prostoru
 Glajenje in izostritev
 Homomorfno filtriranje


Obnavljanje slik
Lastnosti šuma
 Vrste filtrov za odpravljanje šuma

SEZNAM PREDAVANJ

Morfološke operacije in segmentacija

Binarne slike in morfološke operacije
Erozija
 Dilatacija
 Zapiranje in odpiranje


Morfološki algoritmi in karakteristike
Obrisi, konveksna ovojnica, …
 Detekcija robov (Sobel, …)
 Hough-ova transforamcija
 RANSAC

SEZNAM PREDAVANJ

Področja uporabe in napredni algoritmi

Šivanje slik (lokalni deskriptorji)
SIFT
 SURF


Detektorji objektov
Viola-Jones
 Drugi detektorji

SEZNAM PREDAVANJ

Področja uporabe in napredni algoritmi

Razpoznavanje objektov
Podprostori
 PCA
 LDA


Segementacija
Rojenje
 Mean Shift
