Hálózatba kapcsolt adatbázisok

A tantárgy angol neve: Networked Databases

Adatlap utolsó módosítása: 2022. február 11.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Gazdaságinformatikus szak

MSc képzés

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMM100 1 3/1/0/v 5  
3. A tantárgyfelelős személy és tanszék Dr. Erős Levente,
A tantárgy tanszéki weboldala https://www.db.bme.hu/targyak/halozatba-kapcsolt-adatbazisok
4. A tantárgy előadója

Név:

 beosztás:

 Tanszék, Intézet:

Dr. Erős Levente

egyetemi adjunktus

TMIT

Dr. Gajdos Sándor

t. docens

TMIT

Marton József Ernő

ügyvivő szakértő

TMIT

Dr. Soproni Péter Balázs

külsős

TMIT

5. A tantárgy az alábbi témakörök ismeretére épít

 

 

adatbáziskezelő rendszerek felépítése, ER-modellezés, relációs adatmodell, relációs séma előállítása ER diagramból, SQL, funkcionális függőségek, normálformák (0-3NF, BCNF), redundancia, fizikai adatszervezési módszerek (heap, hash, ritka index, sűrű index, többszintű indexek), relációs lekérdezések optimalizálása, tranzakciókezelés, alapvető programozási, valamint adatszerkezetekkel és algoritmusokkal kapcsolatos ismeretek.

 

 

6. Előtanulmányi rend
Ajánlott:

Akik már kreditet szereztek a BMEVITMMA13 tárgyból, azok ezt a Hálózatba kapcsolt adatbázisokat nem vehetik fel.

7. A tantárgy célkitűzése

 

(K1) Bemutatni, hogy az adatbáziskezelő rendszerek hardver- és szoftverkomponenseit milyen módon és miért érdemes többszörözni, hálózatba kapcsolni, hogyan épülnek fel az ilyen rendszerek, milyen előnyökkel/hátrányokkal járnak az egyes megvalósítások, mire és milyen formában lehet ezeket használni.

(K3) Képessé tenni a hallgatót tranzakciós adatbázisokban használt adatstruktúrák megtervezésére változatos gazdasági/tudományos területekre adaptálva, amelyek nagyhatékonyságú információs rendszerek részeiként működhetnek.

(K3) Képessé tenni a hallgatót üzleti folyamatok elemzésére használható, analitikus célú, döntéstámogató rendszerek, a gazdasági élet számos területén használt adattárházak struktúráinak megtervezésére.

(K1) Áttekintést adni a „big data” korszak jellegzetes adatbázis-kezelési megoldásairól, elősegítve ezzel adott feladathoz legjobban illeszkedő technológia kiválasztását.

(K2) Megismertetni a hallgatót olyan optimalizálási módszerekkel, hálózati vagy elosztott feldolgozást segítő eljárásokkal, amelyek alkalmasak arra, hogy egy adatbázis-alapú információs rendszer teljesítményét növelni lehessen.

(K1) Esettanulmányok, megvalósítási példák segítségével megmutatni, hogy a megismert technológiák hogyan jelennek meg a legkorszerűbb, üzleti életben használt tranzakciós és döntéstámogató rendszerekben.

 

8. A tantárgy részletes tematikája

 

Adatbáziskezelő rendszerek-architektúrái és a párhuzamos működés 2 hét

Centralizált vs. kliens-szerver rendszerek, Párhuzamos rendszerek, IO párhuzamosítása, Inter- és intraquery párhuzamosítás, Particionálás lehetőségei, Relációs műveletek párhuzamos végrehajtása: párhuzamos keresési, rendezési, illesztési algoritmusok, Lekérdezés-optimalizálás párhuzamos végrehajtás estén, SMP és MPP architektúrák, Párhuzamos működésű adatbáziskezelők tervezési kérdései.

Elosztott adatbáziskezelés 2 hét

Elosztott, hálózatba kapcsolt adatbázisok típusai, Hatékonysági megfontolások, Zárkezelési protokollok, Elosztott sorosíthatóság, Lavinamentesség biztosítása, Elosztott megegyezés: 2PC-3PC, Elosztott időbélyeges tranzakciókezelés, Csúcsok helyreállítása rendszerhibák után, Elosztott pattok kezelése.

Extrém nagy adatmennyiségek kezelése 2 hét

A NoSQL helye és szerepe, Google-Amazon technológiák, Skálázási kérdések, Skálázhatóság vs. erőforrások megosztása, Konzisztencia fogalmának kiterjesztése, Rendelkezésreállás, Hibatűrés, CAP tétel, NoSQL adatbáziskezelők típusai: kulcs-érték tárak, oszlopcsaládok, gráfadatbázisok, dokumentumtárak, A fontosabb megvalósítások: MongoDB, Hadoop, Cassandra.

Adatstruktúrák tervezése ismert alkalmazásprofilhoz

a)      Relációs struktúrák tervezése OLTP rendszerekhez (2 hét)

A tranzakciós adatbázisrendszerek ismérvei, adatstruktúrák tervezése gyakran változó adattartalomra, tranzakciós adatbázisok alkalmazása üzleti környezetben. Adatbázis kényszerek szerepe, Sématervezés dekompozícióval, Funkcionális függések tulajdonságai, Helyesség és teljesség, Armstrong axiómái, Függéshalmaz tranzitív lezártja, Attribútumhalmaz tranzitív lezártja, Minimális függéshalmaz, Veszteségmentes sémafelbontás, Függőségőrző sémafelbontás, Sématervezés adott normálformába veszteségmentes és függőségőrző sémadekompozícióval.

b)     Relációs struktúrák tervezése  döntéstámogató rendszerek számára (2 hét)

Adattárházak tervezésének sajátosságai, Üzleti folyamatok elemzésére használt struktúrák tervezése, Dimenziós modellezés, Tények és dimenziók, Egyed-kapcsolat vs. dimenziós modellezés, Adattárházbusz, Dimenziós modellek készítése, Lassan változó dimenziók esete, Fizikai adatmodell tervezése.

Memóriaalapú adatbáziskezelés 1 hét

Diszkrezidens és memóriarezidens adatbáziskezelés, motivációk/trendek-előnyök/hátrányok, Megvalósítási kihívások: optimalizált adatszerkezetek, perzisztencia biztosítása, naplózás, tranzakciókezelés, Speciális indexstruktúrák IMDB-kben: B*-fa, AVL-fa, T-fa hatékonysága, Lekérdezések végrehajtása és költsége

Analitikus célú információs rendszerek tervezése és megvalósítása 1 hét

Stratégiai adatorientált döntéstámogató rendszerek alapelvei, Építőelemek, OLAP: Drill down, roll up, slice and dice; Analitikus rendszerek implementációs technológiái, Implementációs módszertanok, ETL folyamat, Adatminőség és adattisztítás szerepe, Valósidejűség értelmezései, Technológiai megoldások a valósidejűség megvalósítására, CTF (Capture-Transform-Flow).

Adatbáziskezelők teljesítménymérése és hangolása 1 hét

A teljesítménymérés céljai és kihívásai, Benchmarkok felállításának szabályai, ill. szabadságfokai, Adatstruktúrák és adatok, TPC-C, TPC-E, TPC-H, A hangolás szintjei, eszközei, Bevált módszerek a teljesítmény javítására. Esettanulmány.

Szemantikus adatkezelés 1 hét

A szemistrukturált adatok sajátosságai, hatékony kezelésük lehetőségei adatbázisokban, Szemantikus elemek tárolása XML adatformátumban, XML séma, Adatreprezentáció RDF formában, Az RDF lehetőségei és korlátai, RDF sémaleíró nyelvek, Ontológia fogalma, Kapcsolat a szemantikus webbel, Szemistrukturált adatok tárolása, szemistrukturált adatbázisok.


 

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

 

3 óra előadás/hét, + gyakorlat/ házi feladat. A házi feladat során üzleti életből vett folyamatokat megvalósító tranzakciós rendszer, valamint egy döntéstámogató adattárház struktúráját készítik el a hallgatók.A gyakorlatok keretében a kiadott házi feladatok megoldásának folyamatos konzultálása valósul meg. A hallgatók átlagosan kéthetente beszámolnak az előrehaladásukról, amely során értékeljük az időközben végzett munkát, korrigáljuk annak esetleges hibáit, megbeszéljük a soron következő lépéseket és az esetleges alternatívákat.


 

10. Követelmények

 

A szorgalmi időszakban: 1 db zárthelyi és egy házi feladat. Feladatkiadás a 4., beadás a 12. héten. Az aláírás feltétele a zárthelyi és a házi feladat külön-külön legalább elégséges teljesítése.

A vizsgaidőszakban: Szóbei vizsga, melynek keretében egyrészt meg kell védeni a házi feladat megoldását, másrészt kérdések hangzanak el a tárgy teljes anyagából. A végső jegy számítása: 30% ZH + 20% HF + 50% vizsga, de mindegyiknek legalább elégségesnek kell lennie.


 

11. Pótlási lehetőségek

 

1 db Pótzárthelyi a szorgalmi időszakban. Az HF beadása legkésőbb a 13. heti pótbeadási határidőig teljesíthető.


 

12. Konzultációs lehetőségek

 

A házi feladatok megoldásának rendszeres bemutatása keretében erre reguláris lehetőség nyílik átlagosan kéthetente, ezen felül igény szerint előzetesen egyeztetett időpontokban.

 

13. Jegyzet, tankönyv, felhasználható irodalom

[1]   Gajdos: Adatbázisok, 2019. https://db.bme.hu/~gajdos/Adatbazisok2019.pdf

[2]   Silberschatz, H. F. Korth, S. Sudarshan: Database System Concepts, 6th Edition, 2010. WCB/McGraw-Hill, ISBN 0-07-295886-3

[3]   Oracle Database Concepts 12c, 2014.

 http://docs.oracle.com/database/121/CNCPT/E41396-10.pdf

[4]   Oracle Exadata white paper, 2012:

 http://www.oracle.com/technetwork/database/exadata/exadata-technical-whitepaper-134575.pdf

[5]   Oracle Data Warehousing Guide 11g, 2007.

 http://docs.oracle.com/cd/B28359_01/server.111/b28313.pdf

[6]   www.tpc.org

[7]   Web-en elérhető oldalak elsősorban a NoSQL körbe tartozó témák esetén


14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka

Kontaktóra

  56

Félévközi készülés órákra

  20

Felkészülés zárthelyire

  16  

Házi feladat elkészítése

  42

Kijelölt írásos tananyag elsajátítása

   -

Vizsgafelkészülés

  16

Összesen

150

 

15. A tantárgy tematikáját kidolgozta

 Név:

 Beosztás:

 Tanszék, Intézet:

Dr. Gajdos Sándor

t. docens

TMIT

Dr. Erős Levente

egy. adjunktus

TMIT

Marton József Ernő

ügyvivő szakértő

TMIT