Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Intelligens szövegelemzés a gyakorlatban

    A tantárgy angol neve: IntelligentText Analysis in Real-Life Applications

    Adatlap utolsó módosítása: 2023. június 22.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Mérnökinformatikus Szak

    Szabadon választható tantárgy

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIMIAV18   1/0/1/f 2  
    3. A tantárgyfelelős személy és tanszék Dr. Mészáros Tamás Csaba,
    A tantárgy tanszéki weboldala http://www.mit.bme.hu/oktatas/targyak/vimiav18
    4. A tantárgy előadója Dr. Mészáros Tamás, egy. docens, Méréstechnika és Információs Rendszerek Tanszék
    5. A tantárgy az alábbi témakörök ismeretére épít Alapvető programozási ismeretek
    7. A tantárgy célkitűzése

    A tantárgy gyakorlatorientált. A teljesítéséhez alapvetően egy saját NLP projekt végigvitele szükséges, amelynek a témája szabadon választható (lásd kedvcsinálók a tanszéki lapon). A félév során bemutatunk számos ipari projekteket, ahonnan ötletek meríthetők, az előadásokon tárgyaljuk az alkalmazható módszerek elméleti hátterét, a laborokon pedig a projektek megvalósításához szükséges eszközöket mutatunk be.

    A tantárgy célja természetes nyelvű szövegek tudásalapú feldolgozásával kapcsolatos módszerek és eszközök bemutatása. A hallgatók megismerkedhetnek a szövegbányászat klasszikus módszerein túlmutató, különféle (statisztikai, mélytanulási és formális) nyelvi modellezési eszközökkel (NLTK, ANTRL, Spacy, OpenAI GPT stb.), kiegészítve azokat szemantikus technológiákat (RDF, OWL, Linked Open Data, SPARQL) és internetes tudástárakat (DBpedia, FactForge) alkalmazó technikákkal. A tantárgy ipari projektek és kutatói együttműködések tapasztalataira és feladatkészletére épít például az információkeresés, a szemantikus annotálás, a digitális bölcsészet és az ember-gép kommunikáció területén.

     

    8. A tantárgy részletes tematikája

    1. hét. A szövegelemzés tipikus problémái az információkeresés, az ember-gép interfészek és a digitális bölcsészet témaköreiből.

    2. hét. A szövegelemzés alapvető módszerei: indexkészítés és statisztikai módszerek, természetes nyelvű szövegfeldolgozás (NLP). A módszerek problémái és korlátai.

    3. hét. Tudásalapú módszerek bevezetésének területei és lehetőségei: nyelvi, tárgyterületi és alkalmazói tudás. Esettanulmányok.

    4-5. hét. Autonóm, tudásalapú ágensek és alkalmazásuk az intelligens szövegelemzésben: természetes nyelvű ember-gép interfészek és több-ágens elemzőrendszerek (előadás és laboratórium).

    6-7. hét. Nyelvi tudás reprezentációja, kontrollált természetes nyelvek (CNL) létrehozása és feldolgozása. Alkalmazásuk természetes nyelvű interfészek megvalósításában.

    8. hét. Ember-robot természetes nyelvű interfész fejlesztése Android és Robot Operating System környezetben (laboratórium).

    9-10. hét. Szakértői tudás reprezentációja: kiterjesztett szótárak, RDF tudásbázisok és ontológiák (OWL), valamint felhasználásuk a szövegelemzésben (normalizálás, entitásfelismerés, szemantikus annotálás).

    11. hét. Nagy nyelvi modellek tanulása adatokból (GPT) és alkalmazásuk (ChatGPT) a gyakorlatban (laboratórium).

    12. hét. Kontrollált természetes nyelvű annotálórendszer (tudásbázis-építés) digitális bölcsészeti rendszerben (laboratórium).

    13. hét. Internetes tudásbázisok (DBpedia, FactForge, MusicBrainz, OpenStreetMap stb.) és lekérdező módszereik (REST, SPARQL). Tudásintegrációs technikák (Linked Open Data).

    14. hét. Külső tudástárak integrációja és felhasználása elemzőrendszerekben (laboratórium). Esettanulmányok.

     

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

    A tantárgy géptermi előadásokból és laboratóriumi foglalkozásokból épül fel. Az előadásokon az elméleti anyag ismertetése mellett a NLP eszközök gyakorlati kipróbálására is sor kerül. A laboratóriumi foglalkozásokon a hallgatók egyrészt ipari és kutatási projektek eredményeivel ismerkednek meg, másrészt önállóan választott problémák megoldásán dolgoznak a tantárgyban megismert módszerekkel és eszközökkel.

    10. Követelmények

    a. A szorgalmi időszakban: zárthelyi sikeres (legalább 40%-os) teljesítése és egy választott otthoni feladat megoldása.

    A zárthelyi az előadások anyagára épít, a hallgatók alapvető tájékozottságát ellenőrzi.

    Az otthoni feladat programozási jellegű, pontos részletei az oktatóval egyeztethetők, összehangolhatók témalabor és önálló laboratórium feladattal. Megoldásával a hallgatók a gyakorlati ismeretek elsajátításáról adnak számot.

    b. A vizsgaidőszakban: -

    11. Pótlási lehetőségek

    A zárthelyi dolgozat pótlására a TVSZ-nek megfelelően egy alkalommal biztosítunk lehetőséget.

    Az otthoni feladat különeljárási díj megfizetése mellett a pótlási időszak végéig adható le késedelmesen (TVSZ).

    12. Konzultációs lehetőségek

    Otthoni feladatok megoldásához órarendi időben.

    13. Jegyzet, tankönyv, felhasználható irodalom

    Tamás Mészáros, „Agent-supported Knowledge Acquisition for Digital Humanities Research", In: A. Szakál (szerk.) IEEE International Conference on Systems, Man, and Cybernetics Conference Proceedings: SMC 2016. Budapest, Hungary, 2016.

    C. Bizer, T. Heath, and T. Berners-Lee, „Linked data-the story so far", Semantic Services, Interoperability and Web Applications: Emerging Concepts, pp. 205-227, 2009.

    Tamás Mészáros, Tadeusz Dobrowiecki, „Controlled Natural Languages for Interface Agents" In: IFAAMAS AAMAS 2009: 8th international conference on Autonomous agents and multiagent systems. Budapest, Magyarország, 2009

    Mészáros Tamás, „Kontrollált természetes nyelvek", tanulmány,  BME MIT, 2009.

    Dezsényi Csaba, Varga Péter, Mészáros Tamás, Strausz György, Dobrowiecki Tadeusz, „Tudásalapú információkinyerés: az IKF projekt" In: Tudományos és Műszaki Tájékoztatás 51:(5) pp. 193-208., 2004

    Mészáros Tamás, „Dokumentum analízis és keresés", tanulmány,  I2RT-TR-1341, 2001.

    Mészáros Tamás, „Szövegelemzési módszerek és esettanulmányok", tanulmány, I2RT-TR-1342, 2002.

    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontaktóra28
    Készülés előadásra3
    Készülés laborra7
    Készülés zárthelyire
    6
    Házi feladat elkészítése
    16
    Összesen60
    15. A tantárgy tematikáját kidolgozta

    Név:

    Beosztás:

    Tanszék, Int.:

    Dr. Mészáros Tamás

    egyetemi docens

    BME MIT