Gépi látás

A tantárgy angol neve: Computer Vision

Adatlap utolsó módosítása: 2006. július 1.

Tantárgy lejárati dátuma: 2015. január 31.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Informatika Szak

Intelligens robotok alfa szakirány

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIFO4275 8 4/0/0/v 5 1/1
3. A tantárgyfelelős személy és tanszék Dr. Loványi István György,
4. A tantárgy előadója

Név:

Beosztás:

Tanszék, Int.:

dr. Loványi István

docens

Irányítástechnika és Informatika

dr. Nagy Ákos

docens

Irányítástechnika és Informatika

dr. Vajta László

adjunktus

Irányítástechnika és Informatika

5. A tantárgy az alábbi témakörök ismeretére épít

-

6. Előtanulmányi rend
Ajánlott:

Tematikaütközés miatt a tárgyat csak azok vehetik fel, akik korábban nem hallgatták a következő tárgyakat:

Neptun-kód Cím

7. A tantárgy célkitűzése

A korszerű méréstechnika egyik legfontosabb eszközének, az optikai mérőeszközök jelfeldolgozási kérdéseinek megismerése, az intelligens képfeldolgozó rendszerekben történő felhasználhatóság analízise, a kapcsolódó matematikai apparátus tárgyalása, a digitális képfeldolgozás alapvető hardver és szoftver elemeinek ismertetése.

8. A tantárgy részletes tematikája

Bevezetés: A számítógépes látás fogalmai, definíciók. Emberi látás alapjai. Gépi látás feladatai. Digitális, analóg, optikai képfeldolgozás összehasonlítása.

Optoelektronikai eszközök: Alapfogalmak. Fénytechnikai mértékegységek. Inkoherens és koherens fényforrások. Optoérzékelők, CCD érzékelők, PSD érzékelők.

Koordinátageometriai alapok. Geometriai transzformációk. Kameramodellek: Pin-hole modell. A perspektív leképzés transzformációs modellje.

Megvilágítás, optika, érzékelő, elektronika torzításainak modellezése. Árnyalási modellek. A térbeli érzékelés lehetősége monokuláris látással.

A képek matematikai leírása. A képfüggvények tulajdonságai. Tértranszformációk szerepe a képfeldolgozásban. 2D Fourier transzformáció tulajdonságai, képi ábrázolása, interpretálása.

Digitális kép matematikai reprezentációja: Mintavételezés, kvantálás.

Egyszerű képfeldolgozási esettanulmányok: Bináris képek feldolgozása: Egyszerű geometriai tulajdonságok (terület, hely, orientáció), vetületek. Topológiai tulajdonságok.

Képek javításának módszerei. Pontszerű lokális és globális műveletek. Hisztogram analízis, skálázások, hisztogram transzformációk. Geometriai torzítás kompenzáció.

A képek szűrése a tér- és frekvenciatartományban. Konvolúció, mint szűrés. Alul- és felüláteresztő szűrők realizálása. Nemlineáris szűrők.

Szegmentálás. Régiók, struktúrák, geometriai jellemzők reprezentációja. Szinteken alapuló módszerek. Küszöbözés, régiónövelés, szeletelés és növesztés. Nagyfrekvenciás analízis: kontúrdetektálás, kontúrkövetés. Hough transzformáció.

Morfológia a képfeldolgozásban: Morfológiai nyitás és zárás. Kiterjesztés gradált képekre. Kép-előfeldolgozás morfológiai elven.

Textúra-analízis: Textúra taxonómia. Statisztikai analízis, autókorreláció, különbségi hisztogram, co-occurence mátrix. Fraktálanalízis. Szintaktikus analízis. Hierarchikus textúrák leírása.

Mozgás analízis: Differenciális módszerek. Globális / lokális optikai áramláson alapuló eljárások. Bázispontok követése. Mozgásdetektálás tér és frekvencia tartományban.

Lényegkiemelés: Tulajdonságtér és tulajdonságvektor. Invariáns alak / textúra jellemzők. Kontúros képek Fourier transzformációja, alakegyütthatók. Sajátságvektorok típusai. Dimenziócsökkentés. Lényegtömörítés célfüggvény alapján. A döntési feladat megfogalmazása.

Osztályozás: Alakfelismerés és leírás. Determinisztikus, statisztikus módszerek. Strukturális, szintaktikus módszerek. Döntési felület meghatározása a tulajdonságtérben. Osztályozás neurális hálózatokkal. Alapvető osztályozási módszerek matematikai alapjai (legközelebbi szomszéd, legközelebbi centrum, Bayes, korrelációs algoritmusok). Tartalom szerinti keresés képi adatbázisokban.

Képkódolás: Redundancia, kompressziós ráta definíciók, információelméleti alapok. Analóg / digitális, veszteséges / veszteségmentes módszerek áttekintése. Álló- és mozgóképek kompressziója és dekompressziója. Diszkrét transzformációk alkalmazhatósága. Prediktív algoritmusok. Vektor kvantálás. Fraktális kompresszió. Hierarchikus és progresszív kompresszió. Szabványok (MPEG, JPEG verziók, stb.). Kompressziós módszerek összehasonlítása. Intelligens képtömörítés négyszintű modellje.

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

A tantárgy előadásból áll, amelynek anyagába beillesztésre kerülnek az elméletet magyarázó illusztrációs példák és alkalmazási esettanulmányok.

10. Követelmények

a) Szorgalmi időszakban:

- A félév lezárásának módja: aláírás. Az aláírás megszerzésének feltétele:

elfogadott nagy házifeladat (vizsgaidőszakban nem pótolható)

sikeresen megírt zárthelyi

b) Vizsgaidőszakban:

- A vizsga írásbeli.

c) a tárgyhoz tartozó kreditpontok megszerzésének feltétele az aláírás és a sikeres vizsga

13. Jegyzet, tankönyv, felhasználható irodalom

Tanszéki sokszorosított kiadványok.

Haralick, R.M.: Computer and Robot Vision I-II, Addison-Wesley Pub Co; ISBN: 0201569434

Gonzales, R.C.: Digital Image Processing, Addison-Wesley Pub Co; ISBN: 0201508036

Álló Géza: Digitális képfeldolgozás alapproblémái: Akadémiai Kiadó

15. A tantárgy tematikáját kidolgozta

Név:

Beosztás:

Tanszék, Int.:

dr. Loványi István

docens

Irányítástechnika és Informatika

dr. Nagy Ákos

docens

Irányítástechnika és Informatika

dr. Vajta László

adjunktus

Irányítástechnika és Informatika