Navigacija

Opis predmeta

2127236 - Jezičke tehnologije 2

Specifikacija predmeta
Naziv Jezičke tehnologije 2
Akronim 2127236
Studijski program Jezik, književnost, kultura
Modul modul Albanski jezik, književnost, kultura, modul Bibliotekarstvo i informatika, modul Rumunski jezik, književnost, kultura, modul Skandinavski jezik, književnost, kultura
Tip studija osnovne akademske studije
Nastavnik (predavač)
Nastavnik/saradnik (vežbe)
Nastavnik/saradnik (DON)
    Broj ESPB 3.0 Status predmeta izborni
    Uslovljenost drugim predmetima Praćenje predmeta je uslovljeno brojem mesta na predmetu i prethodno odslušanim predmetom Jezičke tehnologije 1. Polaganje predmeta je uslovljeno prethodno položenim ispitom iz predmeta Jezičke tehnologije 1. Oblik uslovljenosti
    Ciljevi izučavanja predmeta Upoznavanje sa jezičkim tehnologijama, posebno sa vrstama jezičkih alata, jezičkim resursima na koje se oslanjaju, tekućim međunarodnim standardima za njihovu realizaciju i obučavanje za njihovo aktivno korišćenje. Fokus kursa su postojeći jezički alati za srpski jezik i preduslovi za izgradnju alata koji ne postoje za srpski.
    Ishodi učenja (stečena znanja) Student je upoznao osnovne vrste jezičkih alata i aplikacija vezanih za obradu prirodnih jezika, upoznao je osnovne standarde za njihovu izradu i osposobio se za njihovo korišćenje.
    Sadržaj predmeta
    Sadržaj teorijske nastave Osnovna polja primene jezičkih tehnologija danas: provera jezika, pretraživanje veba, govorna interakcija, mašinsko prevođenje, pronalaženje informacija i srodne aplikacije (odgovaranje na pitanje, ekstrakcija informacija, rezimiranje teksta, generisanje teksta). Jezički alati u obrazovanju. Jezički alati, tehnologije i aplikacije: prepoznavanje govora, sinteza govora, gramatička analiza, semantička analiza, generisanje jezika, mašinsko prevođenje. Osnovni pristupi u izgradnji jezičkih alata (statistički, zasnovan na lingvističkom znanju, hibridni). Jezički resursi kao podrška izgradnji jezičkih alata. Osnovna polja primene jezičkih resursa. Jezički alati za srpski jezik: kvantitet, dostupnost, kvalitet, pokrivenost, zrelost, održivost, prilagodljivost.
    Sadržaj praktične nastave Grebanje veba. Prikupljanje tekstualnog korpusa. Analiza i anotacija tekstualnih skupova podataka.
    Literatura
    1. Ruslan Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2nd ed, 2021.
    2. Yuli Vasiliev, Natural Language Processing with Python and spaCy: A Practical Introduction, No Starch Press, 2020.
    3. Daniel Jurafsky, and James H. Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 2nd ed, 2009.
    4. Kumar, Naresh, Pratap Dangeti, and Krishna Bhavsar, Natural Language Processing with Python Cookbook, Packt Publishing Ltd, 2019.
    5. Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python, Analyzing Text with the Natural Language Toolkit, O'Reilly Media, 2009.
    Broj časova aktivne nastave nedeljno tokom semestra/trimestra/godine
    Predavanja Vežbe DON Studijski i istraživački rad Ostali časovi
    1 1
    Metode izvođenja nastave
    Ocena znanja (maksimalni broj poena 100)
    Predispitne obaveze Poena Završni ispit Poena
    Aktivnosti u toku predavanja 5 Pismeni ispit 35
    Praktična nastava Usmeni ispit
    Projekti
    Kolokvijumi 30
    Seminari 30