Intelligens adatelemzés

A tantárgy angol neve: Intelligent Data Analysis

Adatlap utolsó módosítása: 2009. november 20.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Mesterképzés (MSc):

egészségügyi mérnöki szak

mérnök informatikus szak

villamosmérnöki szak

Intelligens rendszerek szakirány (MIT)

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIMIM328 3 2/1/0/v 4  
3. A tantárgyfelelős személy és tanszék Dr. Antal Péter,
4. A tantárgy előadója Dr. Antal Péter, egyetemi adjunktus
5. A tantárgy az alábbi témakörök ismeretére épít Valószínűségszámítás, Mesterséges Intelligencia
6. Előtanulmányi rend
Ajánlott:
Ajánlott:

Mesterséges intelligencia

7. A tantárgy célkitűzése A statisztikai adatelemzést az adatok mennyiségének és a számítási kapacitásnak a növekedése mellett a következő tényezők is új területekkel gazdagították:

 

  • az adatok heterogenitásának növekedése, a korábban domináns passzív, strukturálatlan megfigyeléses adat mellett, egyre nagyobb szerepet kap az aktív beavatkozásból származó és strukturált adat

     

  • az elektronikusan elérhető háttértudás növekedése, az a priori ismeretek szakértőtől származó beszerzését felváltják az elektronikus forrásokból származtatott ismeretek

     

  • a modellek komplexitásának növekedése, a korábbi függvényapproximációs és eloszlásmodellezős szemlélet mellett egyre nagyobb hangsúlyt kap a dekomponált, hierarchikus (relációs/objektum-orientált) modelleknek  a tanulása, illetve oksági modellek tanulása, beavatkozásokhoz tartozó és kontra-faktuális valószínűségek következtetése

     

  • és a feltett kérdések szemantikai jellegének a növekedése, a korábbi predikciós és teljes modell tanulását célzó módszerek mellett, egyre nagyobb szerepet kapnak a modell jegyeinek, szemantikus tulajdonságainak a tanulása, különös tekintettel a háttértudás felhasználására a kérdések megfogalmazásában

     

  • a bayes statisztikai megközelítés előtérbe kerülése, ami a számítási kapacitás, az elektronikusan elérhető a priori ismeretek, a modellek és a kérdések komplexitásának növekedésének is következménye.

     

 

Ezek az új területek összefoglalóan egy tudás és számítás intenzív bayes statisztikai keretben helyezhetők el, ami tehát komplex adatoknak, ismereteknek, modelleknek és kérdéseknek a statisztikai elemzését kínálja.

 

8. A tantárgy részletes tematikája

 

  • Bevezetés. A statisztikai adatok sokfélesége. Az indukció valószínűségi megközelítése. Klasszikus és bayesi statisztika célkitűzései, metodológiája. Alapfogalmak bemutatása egy változós normális eloszlás esetén, parallel fogalmak összehasonlítása és komplex valószínűségi modellek esetén. A valószínűségi következtetések típusai: megfigyeléses, beavatkozásos, kontra-faktuális.

     

  • Adatok vizualizációja. Dimenzió-, topológia- és varianciamegőrző dimenzió csökkentő leképezések.

     

  • Adatok leiró statisztikai elemzése. Kluszterező módszerek. A kiértékelés és értelmezés problémája. Adatintegrálás, tudásfúzió.

     

  • A hiányos adat típusai. Hiányos adatok kezelési módszerei. Expectation-Maximization. Bayesi megközelítés.

     

  • Kismintás statisztikai módszerek. Bootstrap. Bayesi következtetés hatékony Monte Carlo módszerekkel: MC, MCMC, MCMCMC, ....

     

  • Feltételes modellek tanulása és használata hiányos adat esetén kiegészítő modellekkel.

     

  • Kiterjesztett Bayes hálók. Monolitikus Bayes hálók. Oksági Bayes hálók. Hierarchikus és dekomponált Bayes hálók, objektum orientált Bayes hálók,  dinamikus Bayes hálók, rejtett Markov modellek.

     

  • Bayes hálók tanulása és értelmezése.

     

  • Bayes hálók tanulása hiányos adatok és beavatkozásos adatok esetén.

     

  • Bayesi következtetés Bayes hálók tulajdonságairól.

     

  • Tanulás logikai reprezentációkban. Induktív logikai programozás.    A tudás szerepe a tanulásban. Magyarázat alapú tanulás.

     

  • Sztochasztikus nyelvtanok. Rejtett Markov modellek és sztochasztikus nyelvtanok kapcsolata. Nyelvtanok tanulása.

     

  • Alkalmazások. Biológiai szekvenciák elemzése. Orvosbiológiai oksági modellek tanulása megfigyelési és beavatkozási adatok együtteséből.

     

  •  ‘Szövegbányászat’-i módszerek és információ keresés. Relációk automatikus kivonatolása szintaktikai (nyelvészeti) és statisztikai módszerekkel. Szakirodalmi hálók és tudásbázisok automatikus építése. A szövegbányászat eredményeinek felhasználása a statisztikai adatelemzésben.

     

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás
10. Követelmények

a. A szorgalmi időszakban:

· félév közben (kb. 8-9. héten) egy nagy ZH (max. pontszám 50), a szükséges minimum szint a pontok 40%-a.

b. pótlási héten: elővizsga igény szerint.

 b. A vizsgaidőszakban: írásbeli vizsga. A vizsgára bocsátás feltétele az évközi ZH minimális (40 %) szintű teljesítése.

c. Osztályozás:

A vizsga osztályzata a vizsgaeredmény alapján kerül megállapításra.  

 

 

11. Pótlási lehetőségek

Sikertelen zárthelyi a szorgalmi időszakban a pótzárthelyin pótolható. A sikertelen (pót)zárthelyi a pótlási héten különeljárási díj ellenében egy további alkalommal pótolható.

Javítás esetén a javító pótzárthelyi írás megkezdésekor az eredeti eredmény törlődik, mindenképpen a javító pótzh eredményét vesszük figyelembe (akár jobb, akár rosszabb az eredeti eredménynél).

12. Konzultációs lehetőségek Igény szerint
13. Jegyzet, tankönyv, felhasználható irodalom

D. J. Hand: Intelligent Data Analysis
T.Hastie, R.Tibshirani, J.Friedman: The Elements of Statistical Learning
R. G. Cowel: Probabilistic Networks and Expert Systems
C.M. Bishop: Neural Networks for Pattern Recognition
R.M.Neal: Bayesian Learning for Neural Networks
J. M. Bernardo, A. F. M. Smith: Bayesian Theory
Andrew Gelman: Bayesian Data Analysis
Bayesian inference Using Gibbs Sampling: http://www.mrc-bsu.cam.ac.uk/bugs/
Learning in Graphical Models (Adaptive Computation and Machine Learning) by Michael Irwin Jordan (Editor)
Graphical Models (Oxford Statistical Science Series, 17) by Steffen L. Lauritzen

 

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra42
Félévközi készülés órákra6
Felkészülés zárthelyire16
Házi feladat elkészítése0
Kijelölt írásos tananyag elsajátítása8
Vizsgafelkészülés48
Összesen120
15. A tantárgy tematikáját kidolgozta Antal Péter