Gépi látás

A tantárgy angol neve: Computer Vision

Adatlap utolsó módosítása: 2006. július 1.

Tantárgy lejárati dátuma: 2015. január 31.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Villamosmérnöki Szak

Irányítástechnikai és Robotinformatikai főszakirány

Választható tárgy

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIFO4054 8 4/0/0/v 5 1/1
3. A tantárgyfelelős személy és tanszék Dr. Loványi István György,
4. A tantárgy előadója

Név:

Beosztás:

Tanszék, Int.:

Dr. Loványi István

egyetemi docens

IIT

Dr. Vajta László

egyetemi docens

IIT

5. A tantárgy az alábbi témakörök ismeretére épít
6. Előtanulmányi rend
Ajánlott:
7. A tantárgy célkitűzése

A korszerű méréstechnika egyik legfontosabb eszközének, az optikai mérőeszközök jelfeldolgozási kérdéseinek megismerése, az intelligens képfeldolgozó rendszerekben történő felhasználhatóság analízise, a kapcsolódó matematikai apparátus tárgyalása, a digitális képfeldolgozás alapvető hardver és szoftver elemeinek ismertetése.

8. A tantárgy részletes tematikája

Bevezetés: A számítógépes látás fogalmai, definíciók. Emberi látás alapjai. A térbeli érzékelés lehetősége monokuláris látással.

Optoelektronikai eszközök: Alapfogalmak. Fénytechnikai mértékegységek. Optoérzékelők, CCD érzékelők, PSD érzékelők.

Korszerű képmegjelenítő eszközök. LCD és plazma kijelzők, projektorok. Lentikuláris megjelenítők.

Koordinátageometriai alapok. Geometriai transzformációk. Kameramodellek: Pin-hole modell. A perspektív leképzés transzformációs modellje. Kalibráció.

Megvilágítás, optika, érzékelő modellezése. Árnyalási modellek.

A képek matematikai leírása. A képfüggvények tulajdonságai. Tértranszformációk szerepe a képfeldolgozásban. 2D Fourier transzformáció tulajdonságai, képi ábrázolása, interpretálása.

Digitális kép matematikai reprezentációja: Mintavételezés, kvantálás.

Egyszerű képfeldolgozási esettanulmányok: Bináris képek feldolgozása: Egyszerű geometriai tulajdonságok (terület, hely, orientáció), vetületek. Topológiai tulajdonságok.

Képek javításának módszerei. Pontszerű lokális és globális műveletek. Hisztogram analízis, skálázások, hisztogram transzformációk. Példa a képek javítására: archív felvételek digitalizálása

A képek szűrése a tér- és frekvenciatartományban. Konvolúció, mint szűrés. Alul- és felüláteresztő szűrők realizálása. Nemlineáris szűrők.

Szegmentálás. Régiók, struktúrák, geometriai jellemzők reprezentációja. Szinteken alapuló módszerek. Küszöbözés, régió növelés, szeletelés és növesztés. Nagyfrekvenciás analízis: kontúrdetektálás, kontúrkövetés. Hough transzformáció.

Képjellemzők detektálása: Makro- és mikrojellemzők mérése, Lokális/globális jellemzők meghatározása konvolúcióval. Invariáns alakegyütthatók. Matematikai morfológia. (bináris alapalgoritmusok. kiterjesztés gradált képekre). Távolság / hasonlóság mértékek. Képelemek cimkézése.

Textúra-analízis: statisztikai módszerek. különbségi hisztogram, co-occurence mátrix, autókorreláció, fraktális módszerek.

Lényegkiemelés és osztályozás: Tulajdonságtér és tulajdonságvektor. Sajátságvektorok típusai. Dimenziócsökkentés. Lényegtömörítés célfüggvény alapján. A döntési feladat megfogalmazása. Alakfelismerés és leírás. Determinisztikus, statisztikus, szintaktikus módszerek. Osztályozás neurális hálózatokkal.

Hálózati képfeldolgozás: Analóg és digitális képkódolás. Képtranszformációs alapok (DCT, Wavelet, VQ). Álló- és mozgóképek kompressziója és dekompressziója. Képtárolás, tömörítés, továbbítás, feldolgozás szabványos megoldásai. Szteganográfia. Képek vízjelezése, integritás vizsgálata. Tartalom szerinti képindexelés.

Gépi látás biometriai és biomechanikai alkalmazásai. Arcfelismerés. Járművezetők éberségvizsgálata. Mozgásanalízis: feladatok, eszközök, algoritmusok. Emberi mozgásmodellek. Egész testes mozgás, gesztikuláció, mimika érzékelése és feldolgozása.

Általános célú képfeldolgozó platformok. Alkalmazás-specifikus célrendszerek. Valósidejű képfeldolgozás: Algoritmusok video-rate implementálása célhardverrel. LabView alapú képfeldolgozás.

Látórendszerek hibaanalízise. Képszintézis. Tesztképek generálása.

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

(előadás, gyakorlat, laboratórium):

A tantárgy előadásból áll, amelynek anyagába beillesztésre kerülnek az elméletet magyarázó illusztrációs példák és esettanulmányok.

10. Követelmények
  1. A szorgalmi időszakban:

házi feladat és zárthelyi.

  1. A vizsgaidőszakban:
  2. a vizsga írásbeli.

  3. Elővizsga:

Az utolsó oktatási héten elővizsga lehetőséget biztosítunk.

11. Pótlási lehetőségek

A házi feladat elkészítése a vizsgaidőszakban nem pótolható. A zárthelyi pótlására a TVSZ előírásai szerint van lehetőség.

12. Konzultációs lehetőségek

A házi feladat elkészítéséhez egy alkalommal, valamint minden vizsga előtt konzultációs lehetőséget biztosítunk.

13. Jegyzet, tankönyv, felhasználható irodalom

Tanszéki sokszorosított kiadványok, PowerPoint prezentációk

Haralick, R.M.: "Computer and Robot Vision I-II". Addison Wesley, 1993.

Gonzalez: Digital Picture Processing, Addison Wesley, 1993

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka

:

Kontakt óra

60

Félévközi készülés órákra

10

Felkészülés zárthelyire

20

Házi feladat elkészítése

20

Kijelölt írásos tananyag elsajátítása

10

Vizsgafelkészülés

30

Összesen

150

15. A tantárgy tematikáját kidolgozta

Név:

Beosztás:

Tanszék, Int.:

Dr. Loványi István

egyetemi docens

IIT

Dr. Vajta László

egyetemi docens

IIT