Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Bioinformatika

    A tantárgy angol neve: Bioinformatics

    Adatlap utolsó módosítása: 2006. július 1.

    Tantárgy lejárati dátuma: 2006. december 31.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Villamosmérnöki Szak

    Műszaki Informatika Szak

    Választható tárgy

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIMM9179   2/0/0/v 3 1/1
    3. A tantárgyfelelős személy és tanszék Dr. Antal Péter,
    4. A tantárgy előadója

    Név:

    Beosztás:

    Tanszék, Int.:

    Antal Péter

    egyetemi tanársegéd

    MIT, BMKE

    5. A tantárgy az alábbi témakörök ismeretére épít

    Valószínűségszámítás, Algoritmusok elmélete, Adatbázisok, Mesterséges intelligencia

    6. Előtanulmányi rend
    Ajánlott:

    Ajánlott az intelligens szakirányok hallgatói számára

    7. A tantárgy célkitűzése

    Az 1990-es évek technikai áttörései alapvető változást hoztak a biológiai/orvosi kutatások számára. Egyrészt a genom programokhoz kötődően egyre több organizmus teljes genetikai szekvenciája vált és válik ismertté, másrészt a “gén-chip”-ek segítségével nagyszámú (“összes”) gén aktivitásának egyidejű megfigyelése is lehetővé vált. A biológiai adatok mennyiségének és dimenzióinak rendkívül gyors növekedése kikényszerítette, hogy az adatok elemzése elosztottan, az internet segítségével megy végbe, elosztott adat és tudásbázisok, szolgáltatások százainak a segítségével. Az egységesen “bioinformatikának” nevezett terület az adatelemzésnek, a tudásmérnökségnek, a mesterséges intelligencia kutatásoknak, a számítógépes nyelvészetnek és az informatikának is húzóágazata, trend teremtője lett. Ez különösen igaz az ezek integrálását jelentő “intelligens rendszerek” kutatására és fejlesztésére.

    A tárgy a bioinformatika statisztikai, algoritmikai, információtechnológiai és tudásreprezentációs aspektusait mutatja be, egyrészt az alapvető ismeretek átadását, másrészt egyes aktuális kutatási témák bemutatását célozva. Bevezetésként a biológiában végbe ment paradigmaváltást ismertetjük (genomika, proteomika szemlélet), illetve az ezeket lehetővé tevő szekvencia adatok és génkifejeződés adatok (génchip adatok) természetét. Ezt követően a szekvenciák illesztéséhez, kereséséhez és elemzéséhéz kapcsolódó módszereket, illetve alapvető gén és fehérje predikciós módszereket ismertetünk. A génkifejeződés adatok elemzésénél különféle kluszterező módszereket mutatunk be, illetve részletesen bemutatjuk a valószínűségi gráf modellek (Bayes és Markov hálók) felhasználását. Az ‘adatbányászati’ módszerek mellett bemutatunk ‘szövegbányászat’-i módszereket is, illetve ezek kapcsolódását a statisztikai adatelemzéshez. Végül betekintést adunk biológiai adat és tudásbázisokba, internetes szolgáltatásokba és integrálásukba.

    8. A tantárgy részletes tematikája
    1. Genomika, poszt-genomika és “in silico” biológia. Biológiai alapok. Szekvencia adatok. Génchipek, génkifejeződés adatok, tárolási szabványok és statisztikai előfeldolgozás. Távlatok, ígéretek, farmakogenomika és személyre szabott gyógyszerek.
    2. Szekvencia elemzés I. Páronkénti illesztés. Rejtett Markov modellek. Többszörös illesztés. Rejtett Markov modell profil konstrukció. Motif keresés.
    3. Szekvencia elemzés II.
    4. Nyelvtanok felhasználása szekvencia modellezésben. Környezetlen független sztochasztikus nyelvtanok felhasználása.
    5. Gén predikció. Promoter predikció. Esettanulmány: heterogén a priori ismeretek integrált valószínűségi felhaszálása mikrobiális promoter predikció esetén.
    6. Fehérje osztályozás és predikció. Terminológia és alapvető módszerek.
    7. Filogenetikai algoritmusok. Evolúciós modellek. Fa-rekonstrukciós módszerek.
    8. Génkifejeződés adatok (profilok) statisztikai elemzése kluszterezéssel I. Kluszterező módszerek. A kiértékelés értelmezés problémája.
    9. Génkifejeződés adatok (profilok) statisztikai elemzése kluszterezéssel. II
    10. Génkifejeződés adatok (profilok) statisztikai elemzése interakciós hálózati modellekkel I. Valószínűségi gráf modellek, Bayes hálók és Markov hálók. Valószínűségi gráf modellek bioinformatikai alkalmazásai. Az a priori szakterületi ismeretek felhasználásának problémája.
    11. Génkifejeződés adatok (profilok) statisztikai elemzése interakciós hálózati modellekkel. II
    12. ‘Szövegbányászat’-i módszerek I. Információ keresés. Gén és fehérje név felismerés. Relációk automatikus kivonatolása szintaktikai (nyelvészeti) és statisztikai módszerekkel. Szakirodalmi hálók és tudásbázisok automatikus építése. A szövegbányászat eredményeinek felhasználása a statisztikai adatelemzésben.
    13. ‘Szövegbányászat’-i módszerek II.
    14. Biológia/orvosbiológiai adat és tudásbázisok, internetes szolgáltatások és integrációs eszközök áttekintése. Szekvencia adatbázisok: GenBank, EMBL, ExProt, SWISS-PROT/TrEMBL, PIR,TRANSFAC. Fehérje motif adatbázisok: Blocks, InterPro, Pfam, PRINTS, SUPFAM, PROSITE. Fehérje struktúra adatbázisok: PDB, MMDB. Génaktivitás-mintázatok adatbázisai: GEO, YMG.V Molekuláris kölcsönhatások adatbázisai: BIND, DIP, BRENDA. Metabolikus hálózat tudásbázisok: EcoCyc, MetaCyc, GeneNet Mutációs adatbázisok: OMIM. Ontológiák, tezauruszok: Gene Ontology, Unified Medical Language System. Publikációs adatbázisok: MEDLINE/PubMed.
    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

    :

    Előadás

    10. Követelmények

    a. A szorgalmi időszakban: Házi feladat, egy adott problémához kapcsolódó cikk, cikkek elolvasása és írásbeli beszámoló vagy algoritmus készítése. A feladat átvétele 8. hét végéig lehetséges, leadása vagy bemutatása a 13.hét végéig kötelező. A félévi aláírás és a vizsgára bocsátás feltétele a házi feladat helyes megoldása.

    b. A vizsgaidőszakban: Írásbeli és szóbeli vizsga.

    Pontozás: a pontszám 1/3 része házi feladatból, 1/3 része az írásbeliből és 1/3 része szóbeliből áll össze.

    1. Elővizsga: Igény szerint.
    11. Pótlási lehetőségek

    A házi feladatot a vizsgaidőszak első három hetében lehet pótolni.

    12. Konzultációs lehetőségek

    Megbeszélés alapján.

    13. Jegyzet, tankönyv, felhasználható irodalom

    Biological Sequence Analysis : Probabilistic Models of Proteins and Nucleic Acids by Richard Durbin (Author), Sean R. Eddy (Author), Anders Krogh (Author), Graeme Mitchison (Author)

    Statistical Methods in Bioinformatics: An Introduction by Gregory R. Grant, Warren J. Ewens

    Bioinformatics: Sequence and Genome Analysis by David W. Mount

    DNA Microarrays and Gene Expression : From Experiments to Data Analysis and Modeling by Pierre Baldi (Author), G. Wesley Hatfield (Author), Wesley G. Hatfield

    Bioinformatics: The Machine Learning Approach, Second Edition (Adaptive Computation and Machine Learning) by Pierre Baldi, Soren Brunak, Sren Brunak

    Bioinformatics: Databases and Systems by Stanley Letovsky (Editor)

    Modern Information Retrieval by R. Baeza-Yates, Berthier Ribeiro-Neto, Ricardo Baeza-Yates

    Learning in Graphical Models (Adaptive Computation and Machine Learning) by Michael Irwin Jordan (Editor)

    Graphical Models (Oxford Statistical Science Series, 17) by Steffen L. Lauritzen

    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka

    (a tantárgyhoz tartozó tanulmányi idő körülbelüli felosztása a tanórák, továbbá a házi feladatok és a zárthelyik között (a felkészülésre, ill. a kidolgozásra átlagosan fordítandó/elvárható idők félévi munkaórában, kredit x 30 óra, pl. 5 kredit esetén 150 óra)):

    Kontakt óra

    28

    Félévközi készülés órákra

    Felkészülés zárthelyire

    Házi feladat elkészítése

    27

    Kijelölt írásos tananyag elsajátítása

    ..

    Vizsgafelkészülés

    35

    Összesen

    90

    15. A tantárgy tematikáját kidolgozta

    Név:

    Beosztás:

    Tanszék, Int.:

    Antal Péter

    egyetemi tanársegéd

    MIT, BMKE