Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Gépi látás

    A tantárgy angol neve: Computer Vision

    Adatlap utolsó módosítása: 2006. július 1.

    Tantárgy lejárati dátuma: 2015. január 31.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Villamosmérnöki Szak

    Irányítástechnikai és Robotinformatikai főszakirány

    Választható tárgy

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIFO4054 8 4/0/0/v 5 1/1
    3. A tantárgyfelelős személy és tanszék Dr. Loványi István György,
    4. A tantárgy előadója

    Név:

    Beosztás:

    Tanszék, Int.:

    Dr. Loványi István

    egyetemi docens

    IIT

    Dr. Vajta László

    egyetemi docens

    IIT

    5. A tantárgy az alábbi témakörök ismeretére épít
    6. Előtanulmányi rend
    Ajánlott:
    7. A tantárgy célkitűzése

    A korszerű méréstechnika egyik legfontosabb eszközének, az optikai mérőeszközök jelfeldolgozási kérdéseinek megismerése, az intelligens képfeldolgozó rendszerekben történő felhasználhatóság analízise, a kapcsolódó matematikai apparátus tárgyalása, a digitális képfeldolgozás alapvető hardver és szoftver elemeinek ismertetése.

    8. A tantárgy részletes tematikája

    Bevezetés: A számítógépes látás fogalmai, definíciók. Emberi látás alapjai. A térbeli érzékelés lehetősége monokuláris látással.

    Optoelektronikai eszközök: Alapfogalmak. Fénytechnikai mértékegységek. Optoérzékelők, CCD érzékelők, PSD érzékelők.

    Korszerű képmegjelenítő eszközök. LCD és plazma kijelzők, projektorok. Lentikuláris megjelenítők.

    Koordinátageometriai alapok. Geometriai transzformációk. Kameramodellek: Pin-hole modell. A perspektív leképzés transzformációs modellje. Kalibráció.

    Megvilágítás, optika, érzékelő modellezése. Árnyalási modellek.

    A képek matematikai leírása. A képfüggvények tulajdonságai. Tértranszformációk szerepe a képfeldolgozásban. 2D Fourier transzformáció tulajdonságai, képi ábrázolása, interpretálása.

    Digitális kép matematikai reprezentációja: Mintavételezés, kvantálás.

    Egyszerű képfeldolgozási esettanulmányok: Bináris képek feldolgozása: Egyszerű geometriai tulajdonságok (terület, hely, orientáció), vetületek. Topológiai tulajdonságok.

    Képek javításának módszerei. Pontszerű lokális és globális műveletek. Hisztogram analízis, skálázások, hisztogram transzformációk. Példa a képek javítására: archív felvételek digitalizálása

    A képek szűrése a tér- és frekvenciatartományban. Konvolúció, mint szűrés. Alul- és felüláteresztő szűrők realizálása. Nemlineáris szűrők.

    Szegmentálás. Régiók, struktúrák, geometriai jellemzők reprezentációja. Szinteken alapuló módszerek. Küszöbözés, régió növelés, szeletelés és növesztés. Nagyfrekvenciás analízis: kontúrdetektálás, kontúrkövetés. Hough transzformáció.

    Képjellemzők detektálása: Makro- és mikrojellemzők mérése, Lokális/globális jellemzők meghatározása konvolúcióval. Invariáns alakegyütthatók. Matematikai morfológia. (bináris alapalgoritmusok. kiterjesztés gradált képekre). Távolság / hasonlóság mértékek. Képelemek cimkézése.

    Textúra-analízis: statisztikai módszerek. különbségi hisztogram, co-occurence mátrix, autókorreláció, fraktális módszerek.

    Lényegkiemelés és osztályozás: Tulajdonságtér és tulajdonságvektor. Sajátságvektorok típusai. Dimenziócsökkentés. Lényegtömörítés célfüggvény alapján. A döntési feladat megfogalmazása. Alakfelismerés és leírás. Determinisztikus, statisztikus, szintaktikus módszerek. Osztályozás neurális hálózatokkal.

    Hálózati képfeldolgozás: Analóg és digitális képkódolás. Képtranszformációs alapok (DCT, Wavelet, VQ). Álló- és mozgóképek kompressziója és dekompressziója. Képtárolás, tömörítés, továbbítás, feldolgozás szabványos megoldásai. Szteganográfia. Képek vízjelezése, integritás vizsgálata. Tartalom szerinti képindexelés.

    Gépi látás biometriai és biomechanikai alkalmazásai. Arcfelismerés. Járművezetők éberségvizsgálata. Mozgásanalízis: feladatok, eszközök, algoritmusok. Emberi mozgásmodellek. Egész testes mozgás, gesztikuláció, mimika érzékelése és feldolgozása.

    Általános célú képfeldolgozó platformok. Alkalmazás-specifikus célrendszerek. Valósidejű képfeldolgozás: Algoritmusok video-rate implementálása célhardverrel. LabView alapú képfeldolgozás.

    Látórendszerek hibaanalízise. Képszintézis. Tesztképek generálása.

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

    (előadás, gyakorlat, laboratórium):

    A tantárgy előadásból áll, amelynek anyagába beillesztésre kerülnek az elméletet magyarázó illusztrációs példák és esettanulmányok.

    10. Követelmények
    1. A szorgalmi időszakban:

    házi feladat és zárthelyi.

    1. A vizsgaidőszakban:
    2. a vizsga írásbeli.

    3. Elővizsga:

    Az utolsó oktatási héten elővizsga lehetőséget biztosítunk.

    11. Pótlási lehetőségek

    A házi feladat elkészítése a vizsgaidőszakban nem pótolható. A zárthelyi pótlására a TVSZ előírásai szerint van lehetőség.

    12. Konzultációs lehetőségek

    A házi feladat elkészítéséhez egy alkalommal, valamint minden vizsga előtt konzultációs lehetőséget biztosítunk.

    13. Jegyzet, tankönyv, felhasználható irodalom

    Tanszéki sokszorosított kiadványok, PowerPoint prezentációk

    Haralick, R.M.: "Computer and Robot Vision I-II". Addison Wesley, 1993.

    Gonzalez: Digital Picture Processing, Addison Wesley, 1993

    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka

    :

    Kontakt óra

    60

    Félévközi készülés órákra

    10

    Felkészülés zárthelyire

    20

    Házi feladat elkészítése

    20

    Kijelölt írásos tananyag elsajátítása

    10

    Vizsgafelkészülés

    30

    Összesen

    150

    15. A tantárgy tematikáját kidolgozta

    Név:

    Beosztás:

    Tanszék, Int.:

    Dr. Loványi István

    egyetemi docens

    IIT

    Dr. Vajta László

    egyetemi docens

    IIT