Adatelemzés mélytanulási módszerekkel

A tantárgy angol neve: Data Analysis with Deep Learning Methods

Adatlap utolsó módosítása: 2023. április 18.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar
BSc, mérnökinformatikus, specializáció
Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMAC15 5 2/2/0/v 5  
3. A tantárgyfelelős személy és tanszék Dr. Papp Dávid,
4. A tantárgy előadója Dr. Mihajlik Péter, egyetemi adjunktus, TMIT
Dr. Papp Dávid, egyetemi adjunktus, TMIT
Dr. Szűcs Gábor, egyetemi docens, TMIT
5. A tantárgy az alábbi témakörök ismeretére épít Alapvető matematikai és algoritmuselméleti ismeretek
7. A tantárgy célkitűzése A tárgy célkitűzése az adatelemzéshez szükséges gépi tanulás és azon belül a mélytanulás módszereinek oktatása, amelyek segítségével az intelligens rendszerek képesek akár az emberi képességet is meghaladó módon megtanulni az adatokban rejlő összefüggéseket, mintázatokat, jellegzetességeket. A tárgy során ismertetett módszereket strukturált gazdasági adatok előrejelzésén és strukturálatlan multimédia tartalmak elemzésén keresztül tekintjük át, így a hallgatók részletesen megismerkedhetnek az ezekhez szükséges gépi tanuló módszerek széles spektrumával, az információs rendszerek adattípusainak megfelelő specialitásokkal, munkafolyamattal, részfeladatokkal. Az adattípusok közül napjaink média-intenzív világában általánossá váltak a heterogén, zajos és hiányos multimédia tartalmak, melyek gépi tanításához mély neurális hálók szükségesek, így a tantárgy egy részletes, átívelő képet nyújt az intelligens adatelemzéstől a mélytanulásig.
8. A tantárgy részletes tematikája Az előadások részletes tematikája:

• Adatelemzési problémák típusai. Adatelőkészítési és gépi tanuló módszerek az adatelemzés folyamatában.
• Bináris és többosztályos osztályozás. Döntési felületek meghatározása. Szupport vektor gépek, one-vs-all algoritmus, keresztvalidáció.
• Magyarázható gépi tanuló módszerek. Lusta tanuló módszerek. K-legközelebbi szomszéd módszer.
• Lineáris modellek. Linear discriminant analysis (LDA).
• Klaszterezés, k-means (Forgy módszer), k-means++ algoritmus. Belső és külső kiértékelési indikátorok, klaszteranalízis. Hierarchikus klaszterezés. Sűrűség alapú klaszterezés (pl. DBSCAN).
• Dimenziócsökkentés szerepe az adatok elemzésében. Legfontosabb dimenziócsökkentő módszerek.
• Mélytanulás, mély neurális hálózatok (DNN). Aktivációs és veszteség függvények. Neurális hálózat tanítása, hiba visszaterjesztés. Túltanulás elleni regularizáció (early stopping, dropout, batch normalizálás). Optimalizációs eljárások, hiperparaméter optimalizálás.
• DNN típusok: Konvolúciós neurális hálózatok (CNN), Rekurrens neurális hálózatok (RNN), Gated Recurrent Unit (GRU), Long Short-Term Memory (LSTM) és Bidirectional RNN (BRNN).
• Adatelemzés strukturált és strukturálatlan vállalati adatokon. Szöveges adatállományok. Vállalati adatok osztályozása és szegmentálása.
• Idősor jellegű adatok specialitásai. Idősor analízis. Gazdasági adatok elemzése, előrejelzési módszerek.
• Idősor analízis mélytanulási módszerekkel. Sequence-to-sequence módszerek.
• Multimédia elemzés, mélytanulás az audio jellegű adatok osztályozásához.
• Videóelemzés. Objektumkövetés videókban. Tracking-by-detection megközelítés. Egyszerű IOU alapú követés, pozícióbecslési eljárások, Kálmán szűrő. Multiple Object Tracking (MOT). Simple Online and Realtime Tracking (SORT) és DeepSORT algoritmus.
• Osztályozás kevés adat alapján. Zero-shot, one-shot, few-shot tanulás, sziámi hálózatok. Megtévesztési módszerek. Face spoofing, deep fake.

A gyakorlatok/laborok részletes tematikája:

A félév során a gyakorlatok Python környezetben történnek, amelyek mindig az előadás anyaghoz kapcsolódnak és az ismeretek elmélyítését szolgálják.

• Python alapok (ipython notebook, numpy, scikit-learn). Adatelőkészítési lépések a gyakorlatban.
• Modell validáció és jellemzőtervezés. KNN és SVM összevetése.
• K-means és hierarchikus klaszterezés vállalati adatokon. Klaszterszám meghatározása.
• Dimenziócsökkentés a gyakorlatban.
• Neurális hálózat implementációja.
• Mélytanulási keretrendszerek. Konvolúciós réteg implementációja.
• Python OpenCV programkönyvtár.
• Osztályozás lineáris modellekel.
• Idősor analízis. Makrogazdasági adatok elemzése.
• Szöveges adatok elemzése.
• Beszédfelismerés.
• Közlekedési adatok elemzése.
• Gépjárművek követése IOU tracker és SORT segítségével, YOLO alapon.
• Házi feladatok bemutatása és megbeszélése.

 

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Heti 2 óra előadás, 2 óra gyakorlat
10. Követelmények Szorgalmi időszakban: 1 db zárthelyi és 1 db (opcionális) nagyházi. Az aláírás feltétele a zárthelyi dolgozat legalább elégséges szintre történő megírása. A félévközi eredmények alapján megajánlott jegy szerezhető, amely a zárthelyi és a szorgalmi nagyházi feladat osztályzatainak átlaga, amennyiben ez minimum 4-es osztályzatot jelent.
Vizsgaidőszakban: Írásbeli vizsga
11. Pótlási lehetőségek A zárthelyi pótlására a szorgalmi időszakban egy lehetőséget biztosítunk. Azok számára, akiknek nem sikerült sem a zárthelyi, sem a pótzárthelyi: a pótlási időszakban 1 alkalmat biztosítunk egy újabb zárthelyi dolgozatra. Az aláírás feltétele valamelyik zárthelyi (első vagy a pót- vagy a pótpót-zárthelyi) legalább elégséges szintre történő megírása.
12. Konzultációs lehetőségek A tárgy előadójával személyesen, vagy e-mailben egyeztetett időpontban.
13. Jegyzet, tankönyv, felhasználható irodalom • Thomas A. Runkler: Data Analytics - Models and Algorithms for Intelligent Data Analysis, 2nd Edition, Springer, 2016.
• Charu C. Aggarwal: Neural networks and Deep Learning, Springer, 2018.
• Andrew Ng: Deep Learning Tutorial, Stanford University, 2016.
• François Chollet: Deep Learning with Python (Second Edition), Manning, 2021.
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra56
Félévközi készülés órákra24
Felkészülés zárthelyire30
Házi feladat elkészítése-
Kijelölt írásos tananyag elsajátítása0
Vizsgafelkészülés40
Összesen150
15. A tantárgy tematikáját kidolgozta Dr. Papp Dávid, egyetemi adjunktus, TMIT
Dr. Szűcs Gábor, egyetemi docens, TMIT
IMSc tematika és módszer Az IMSc képzésben részt vevő hallgatóknak lehetőséget biztosítunk a tananyag magasabb szinten történő elsajátítására és mélyebb megértésére. Ezt a gyakorlati alkalmak során kiadott kiegészítő feladatok biztosítják, melyek gondolkodtató, nagyobb rutint és több gyakorlást igénylő feladatok, valamint mélyebb ismeretanyag elsajátítását igénylik.
IMSc pontozás A gyakorlatok során a kiadott feladatokra készített megoldásokat IMSc pontokkal jutalmazzuk. Feladatonként 3 pont, a gyakorlatokon összesen 15 szerezhető.
A vizsgán további 10 IMSc pont szerezhető a kijelölt feladat megoldásával, amennyiben a dolgozat meghaladja a 85%-os szintet. Megajánlott jegy szerzése esetén a vizsgán szerezhető 10 pontot az opcionális nagyházi feladat megoldásával lehet megszerezni, amennyiben az megfelelő komplexitású és a dokumentáció a szakirodalomban megszokott formázási követelményeket követi.
A tárgyon maximum 25 IMSc pont szerezhető.