Belépés címtáras azonosítással
magyar nyelvű adatlap
Adatelemzési platformok
A tantárgy angol neve: Data Analytics Platforms
Adatlap utolsó módosítása: 2014. október 3.
Mérnökinformatikus szak, MSc képzés
Adat- és médiainformatikai mellékspecializáció
Gáspár Csaba
egyetemi tanársegéd
BME-TMIT
Nagy István
tanszéki mérnök
Prekopcsák Zoltán
A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.
A kötelező előtanulmányi rend az adott szak honlapján és képzési programjában található.
Adatbányászat legújabb trendjei, CRISP-DM (Cross Industry Standard Process for Data Mining) metodika. Osztályozási feladat távközlési hívásadatok churn (lemorzsolódás, elvándorlás) rendszerében.
Hitelbírálati rendszer bemutatása, scoring technika, mintavételezés. Ügyfélérték fogalma.
Bankkártya adatok, keresztértékesítés iránya, a sikeres adatbányászat 6 feltétele.
Ügyfélszegmentálás, klaszterező eljárások, k-közép és k-medoid algoritmus
Kampányoptimalizáció. Biztosítási adatokon történő adatelemzés. Kombinált adatbányászati eljárások, együttes osztályozók
A hálózatelemzés alapjai, hálózat alapú előrejelzés, fertőzési modellek felhasználása
Közösségi hálók hálózati elemzése adatbányászat segítségével.
Társadalmi, környezeti adatok gyűjtése és feldolgozása.
Adattranszformációs és adatmanipulációs lehetőségek és vizuális adatelemzés: adattípusok, adatelemzési problémák áttekintése, visszamérési módszerek.
Adatelőkészítési módszerek: adattisztítási módszerek, adatintegrációs és transzformációs technikák, adatredukciós módszerek, diszkretizációs technikák.
Osztályozási problémák megoldása: döntési technikák, példányalapú mószerek. Metatanuló módszerek.
Klaszterezés és outlier keresés: hasonlósági és távolsági mértékek, particionáló módszerek, hierarchikus klaszterezők, sűrűség alapú klaszterezők, outlier keresési technikák.
Idősoros adatok feldolgozása: lineáris és nem-lineáris módszerek, regressziós fák.
A nagy adat (Big Data) jelensége és fogalma, szerepe. Az Apache Hadoop platform bemutatása.
Elosztott adattárolás és elemzések MapReduce alapokon. MapReduce programozási minták.
Lekérdezési módszerek és programnyelvek nagy adatok esetén (Hive, Pig). Big Data esettanulmányok.
Gyakorlati órák tématerületei:
Hitelbírálati feladat adatbányászati megoldásaKeresztértékesítésTávközlési cég ügyfeleinek elvándorlás (churn) előrejelzéseKampányoptimalizáció biztosítási környezetbenVásárlói kártya adatok adatbányászati feldolgozásaBig Data megoldásokhoz kapcsolódó Hadoop alapú technológiák
A szorgalmi időszakban: 1 db házi feladat és 1 db zárthelyi dolgozat
A kredit-megszerzés feltétele a nagyházi feladat (beleértve a pótló nagyházit is: lásd a következő pontban) és a zárthelyi dolgozat legalább elégséges szintre történő megírása. A félévközi érdemjegy a zárthelyi és a házi feladat osztályzatainak átlaga.
Dr. Abonyi János: Adatbányászat a hatékonyság eszköze, Computerbooks, Budapest 2006
Larose, Daniel T., Discovering Knowledge in Data: An Introduction to Data Mining, Wiley-Interscience, 2004.
Bodon Ferend, Búza Krisztián: Adatbányászat (folyamatosan bővülő elektronikus jegyzet), 2013
Dr. Szűcs Gábor
egyetemi docens
Dr. Magyar Gábor
Kazi Sándor
doktorandusz