Mérési adatok vizuális elemzése

A tantárgy angol neve: Visual Analysis of Measurement Data

Adatlap utolsó módosítása: 2021. március 19.

Tantárgy lejárati dátuma: 2023. július 31.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Mérnök informatikus alapszak

Villamosmérnöki alapszak

Szabadon választható tantárg
y

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIMIAV16   2/0/0/f 2  
3. A tantárgyfelelős személy és tanszék Dr. Gönczy László,
A tantárgy tanszéki weboldala https://www.mit.bme.hu/oktatas/targyak/vimiav16
4. A tantárgy előadója

Név:

Beosztás:

Tanszék, Int.:

Dr. Pataricza András

egyetemi tanár

MIT

Dr. Gönczy László

adjunktus

MIT

Dr. Kocsis Imre

adjunktus

MIT

5. A tantárgy az alábbi témakörök ismeretére épít

Alapvető statisztikai/valószínűségszámítási ismeretek, számítógépes rendszerek, hálózatok és operációs rendszerek alapfogalmai. Adatbázisok/táblázatkezelés alapismeretei.

7. A tantárgy célkitűzése

A műszaki gyakorlatban kulcsfontosságú a tapasztalati adatok gyűjtése és elemzése mind a rendszerek méretezésénél, mind teljesítmény- és időviszonyaik helyességének ellenőrzésénél. Ennek legegyszerűbb, de hatékony és a műszaki szemlélethez közel álló megközelítése a vizuális adatelemzés. Ennek tipikus alkalmazási területei: HW/SW teljesítményvizsgálat, web és felhő alapú rendszerek méretezése, komponensek közti kommunikáció vizsgálata, szűk keresztmetszetek keresése.

A tantárgy alapvető célkitűzése megismertetni a hallgatókat a vizuális adatelemzés alkalmazási lehetőségeivel, elsődlegesen műszaki alkalmazásokban, informatikai rendszerek tervezésében és kiértékelésében. A tárgy statisztikai/elméleti alapozás után gyakorlati példákon keresztül mutatja be az elemzési folyamat főbb feladatait (adatgyűjtés és tisztítás, modellalkotás, feltáró és megerősítő elemzés, stb.).

A tantárgy elvégzése után a hallgatók képesek lesznek méréseket tervezni, benchmarkokból és rendszermonitorozásból/logokból származó adatokat kiértékelni, a rendszer működéséből adódó sajátosságokat (pl. elemek közti függőségek, kapcsolatok) az elemzés során módszeresen felhasználni, ill. a rendszerről alkotott feltételezéseket elemzésekkel kiértékelni és alátámasztani. Az elemzési eredmények hatékonyan fejleszthető, intuitív felületeken keresztül különböző részletességgel és fókusszal tudják megjeleníteni mind informatikusok/rendszermérnökök, mind a rendszerek felhasználói ill. megrendelői számára.

A tárgy oktatása során elsősorban a vizuális megjelenítésre helyezzük a hangsúlyt, korszerű vizuális elemzési technológiákon keresztül ismertetve az alapvető módszereket, emellett kitekintünk a széles körben használt R nyelv interaktív vizualizációs lehetőségeire.

8. A tantárgy részletes tematikája

A tárgy az alapvető fogalmak és technológiák bevezetése után azok műszaki felhasználására koncentrál.

1. hét: Statisztikai és metrológiai alapok. Statisztikai alapfogalmak, mértékek fajtái, mérésekkel szembeni tipikus követelmények. Adattípusok és adatszerkezetek.  Adatok közti függőségek: korreláció, asszociáció, kauzalitás. Előzetes (a priori) ismeretek felhasználása.

2. hét: Vizuális elemzés alapok. Feltáró/megerősítő (Exploratory/Confirmatory) analízis. Főbb plot típusok (1, 2, n dimenzió) és felhasználásuk.

3. hét: Interaktív technológiák, data tours (esettanulmány). Egyedi vizualizáció példák, eloszlások megjelenítése, ötszámos jellemzés (five-number summary), nemparametrikus statisztika. Kihívások: interaktivitás, skálázhatóság (információ és megjelenítés), megismételhető/kollaboratív elemzés.

4. hét: Vizuális elemzés technológiai támogatása: szkript nyelvek (R, Python), vizuális folyamattervező eszközök (Knime, RapidMiner, TensorFlow, Orange, ...), hagyományos „BI" eszközök felhasználása (Microsoft PowerBI, Tableau, ...). Felhő alapú analitika (Microsoft Cortana Analytics, IBM Watson Analytics). Vizuális megjelenítő könyvtárak: JS alapú megoldások (D3.js, Processing, chart könyvtárak), Dashboard keretrendszerek (Graphite, CGP, ...). Eltérés a célokban, beágyazott heurisztikák torzító hatása, implicit feltételezések feltárása, az egyes technológiák összehasonlítása.

5. hét: Mérnöki modellek felhasználása adatelemzésben: Oksági kapcsolatok, topologikus korreláció, sorrendiség és viselkedésmodellek figyelembevétele, változószelekció. Minőségi modellek (Qualitative Reasoning).

6. hét: Kezdeti vizuális kiértékelés (esettanulmány), az eddig ismertetett módszerek bemutatása néhány reprezentatív példán (pl. felhő alapú rendszerek teljesítménymérése).

7. hét: Adatgyűjtés és -tisztítás: szakterület-specifikus adatszótár, adathiba taxonómia megalkotása, általános adatminőségi metrikák, felműszerezés, mintavételezés stb. informatikai rendszerekben. Szenzor adatforrások szemantikus leírása: az SSN szabvány.

8. hét: Adatforrások csatolása. Tipikus mérési adatforrások: relációs adatbázisok, kulcs-érték adatbázisok, oszlopadatbázisok, gráfadatbázisok. Ontológia alapú tárolás, online adatforrások (REST,JSON, ...). R, Python terminológia.

9. hét: Adatvezérelt modellalkotás. Klaszterezés és PCA támogatása. Klasszifikáció és csoportba sorolás. Kísérleti modellek validációja, kísérlettervezés.

10-11. hét: A vizuális elemzés alkalmazási területeinek sajátosságai. Kiberfizikai rendszerek (CPS) elemzése, különböző domének (kiber, fizikai) kapcsolatának feltárása. Dashboard tervezés informatikai rendszerek felügyeletére, "SCADA". Szolgáltatásbiztonság és teljesítőképesség elemzése. Szoftver teljesítmény hangolás. Biztonságkritikus rendszerek fejlesztési folyamatának vizsgálata.

12. hét: Vizuális elemzés használata rendszertervezésben. Fogalmi egységesítés. Mérés és benchmark tervezés. Informatikai modellek szimulációjának hatékony kiértékelése. Reprezentáció transzformálása.

13. hét: Rendszerek kiértékelés vizuális módszerekkel. Teszt- és tesztkészlet-kiértékelés támogatása. Logelemzés és eseményfeldolgozás komplex, felhő alapú rendszerekben. Kiugró értékek (outlier) keresése.

14. hét: Komplex esettanulmány.

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás.
10. Követelmények

a. A szorgalmi időszakban: egy házi feladat elkészítése.

A házi feladat egy önállóan elkészített, saját mérésből vagy publikus adatforrás(ok)ból származó adatkészleten elvégzett, elsősorban vizuális technikákra építő, megismételhető elemzés, megfelelően dokumentálva.

b. A vizsgaidőszakban: -

c. Elővizsga: -

11. Pótlási lehetőségek

A TVSZ szerint:

Házi feladat: a pótlási héten pótolható (különeljárási díj ellenében).

 

12. Konzultációs lehetőségek

Az oktatókkal előre egyeztetett időpontban. Emellett elérhetővé tesszük a tárgyban használt eszközök technikai útmutatóin és oktató videóin kívül saját, szemléltető példákat a tárgyhonlapon.

13. Jegyzet, tankönyv, felhasználható irodalom

1. Chen, Chun-houh, Wolfgang Karl Härdle, and Antony Unwin, eds. Handbook of data visualization. Springer Science & Business Media, 2007.

2. Theus, Martin, and Simon Urbanek. Interactive graphics for data analysis: principles and examples. CRC Press, 2008.

3. Antal Péter (szerk.). Intelligens adatelemzés. Typotex Kiadó, 2014. Elektronikusan elérhető jegyzet.

4. Imre Kocsis, Ágnes Salánki, and A. Pataricza, "Measurement-based identification of infrastructures for TCPS," in Trustworthy Cyber-Physical Systems Engineering, A. Romanovsky and Fuyuki Ishikawa, Eds. Chapman and Hall/CRC, 2016.

5. Pataricza, András, et al. "Empirical Assessment of Resilience." Software Engineering for Resilient Systems. Springer Berlin Heidelberg, 2013. 1-16.

További eszközspecifikus segédanyagok (pl. Adam Aspin, „High Impact Data Visualization with Power View, Power Map, and Power BI", Apress, 2014), online segédanyagok, példák.

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontaktóra 28
Készülés előadásra6
Házi feladat elkészítése 26
Összesen 60
15. A tantárgy tematikáját kidolgozta

Név:

Beosztás:

Tanszék, Int.:

Dr. Pataricza András

egyetemi tanár

MIT

Gönczy László

tanársegéd

MIT

Kocsis Imre

tanársegéd

MIT

Egyéb megjegyzések A tantárgy angol neve: Visual analysis of measurement data