Mesterséges beszédfunkciók

A tantárgy angol neve: Artificial Speech Functions

Adatlap utolsó módosítása: 2006. július 1.

Tantárgy lejárati dátuma: 2007. január 3.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Orvosbiológiai mérnökképzés

Választható tárgy

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITT3MBF   4/0/0/v 5 1/1
3. A tantárgyfelelős személy és tanszék Dr. Gordos Géza,
4. A tantárgy előadója

Név:

Beosztás:

Tanszék, Int.:

Dr. Németh Géza

adjunktus

TTT

Dr. Olaszy Gábor

docens

TTT

Dr. Vicsi Klára

tud.fmts.

TTT

Dr. Pataki László

ov. főorvos (egyszeri meghívott)

Heim Pál Kórház

5. A tantárgy az alábbi témakörök ismeretére épít

Jelek és rendszerek leírásának matematikai alapjai, eszközei. Anatómia. Élettan.

6. Előtanulmányi rend
Ajánlott:
7. A tantárgy célkitűzése

Rendszerezett ismereteket kíván adni a természetes beszédláncról és egyes elemeinek kiváltására alkalmas megoldásokról. Példákat mutat be az orvosbiológiai témakör alkalmazási lehetőségeiről.

8. A tantárgy részletes tematikája

Bevezetés, áttekintés

ˇ A természetes beszédlánc modellezése

ˇ A főbb beszédfunkciók felsorolása, a mesterséges megoldások kategorizálása

ˇ Alapvető természettudományos modellek (lineáris időinvariáns és idővariáns rendszerek, Fourier-sor és integrál, sztochasztikus folyamatok jellemzői)

ˇ Alapvető mérési és kijelzési módszerek

ˇ Mintavételezés és kvantálás

ˇ Beszéd specifikus szempontok

Beszédakusztikai alapismeretek

ˇ A beszéd elemei, a beszédhangok definíciója

ˇ Artikuláció és akusztikai szerkezet (idő-, frekvencia- és intonációs struktúrák)

ˇ Szegmentális és szupraszegmentális jellemzők és modellezésük

ˇ A beszédészlelés folyamatai

Beszédtechnológiai alkalmazások

ˇ Kötött szótáras beszédszintézis tervezése és megvalósítása (nagy hanghűségű számbemondó példája)

ˇ Szövegfelolvasó (Text-To-Speech, TTS) rendszerek alapvető struktúrái és algoritmusai

ˇ Formánsszintézis és hullámforma alapú szintézis (a technológiák demonstrációja magyar, angol és német nyelven)

ˇ Elektronikus-levél felolvasó rendszer tervezése és megvalósítása

ˇ Felolvasó rendszerek alkalmazása látás- és beszédsérült emberek segítésére

ˇ Kötött szótáras személyfüggő és személyfüggetlen beszédfelismerés (jó minőségű és telefonos akusztikai környezet hatása és megoldásai)

ˇ Nagyszótárú beszédfelismerés architektúrája és alapvető algoritmusai

ˇ Beszédfelismerő technológiák demonstrációja

ˇ Beszédfelismerési megoldások alkalmazása a beszédképzés rehabilitációjában

ˇ Beszédtechnológia a foniátriai gyakorlatban

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

előadás

10. Követelmények

a. A szorgalmi időszakban:

b. A vizsgaidőszakban:

A vizsga írásbeli, szóbeli javítási lehetőséggel.

c. Elővizsga:

13. Jegyzet, tankönyv, felhasználható irodalom

Ajánlott irodalom:

Gordos-Takács: Digitális beszédfeldolgozás, Műszaki Kiadó, 1983

Olaszy: Elektronikus beszédelőállítás, Műszaki Kiadó, 1989

Beszédkutatás kiadványsorozat, MTA Nyelvtudományi Intézet

15. A tantárgy tematikáját kidolgozta

Név:

Beosztás:

Tanszék, Int.:

Dr. Gordos Géza

egy. tanár

TTT

Dr. Németh Géza

adjunktus

TTT

Dr. Olaszy Gábor

docens

TTT

Dr. Vicsi Klára

tud. fmts.

TTT