Navigacija

Opis predmeta

2127235 - Jezičke tehnologije 1

Specifikacija predmeta
Naziv Jezičke tehnologije 1
Akronim 2127235
Studijski program Jezik, književnost, kultura
Modul modul Albanski jezik, književnost, kultura, modul Bibliotekarstvo i informatika, modul Italijanski jezik, književnost, kultura, modul Rumunski jezik, književnost, kultura, modul Skandinavski jezik, književnost, kultura
Tip studija osnovne akademske studije
Nastavnik (predavač)
Nastavnik/saradnik (vežbe)
Nastavnik/saradnik (DON)
    Broj ESPB 3.0 Status predmeta izborni
    Uslovljenost drugim predmetima Praćenje predmeta je uslovljeno brojem mesta na predmetu i prethodno odslušanim predmetima Informatički praktikum 3 i Struktura informacija 1 (grupa 27) ili odgovarajućim predznanjem koje zamenjuje pomenute predmete (ostale grupe). Polaganje predmeta je uslovljeno prethodno položenim ispitima iz predmeta Informatički praktikum 3 i Struktura informacija 1 (grupa 27) ili odgovarajućim predznanjem koje zamenjuje pomenute predmete (ostale grupe). Oblik uslovljenosti
    Ciljevi izučavanja predmeta Upoznavanje sa jezičkim tehnologijama, posebno sa vrstama jezičkih resursa, njihovim formiranjem, tekućim međunarodnim standardima za njihovu realizaciju i obučavanje za njihovo aktivno korišćenje. Fokus kursa su postojeći digitalni resursi za srpski jezik i osnove za izgradnju resursa koji ne postoje za srpski.
    Ishodi učenja (stečena znanja) Student upoznaje osnovne vrste jezičkih resursa koji se danas koriste u brojnim aplikacijama vezanim za obradu prirodnih jezika, upoznaje osnovne standarde za njihovu izradu i osposobljuje se za pripremanje materijala za izradu jezičkih korpusa i za njihovo korišćenje.
    Sadržaj predmeta
    Sadržaj teorijske nastave Uloga jezičkih tehnologija u savladavanju jezičkih barijera danas. Ugroženost jezika u novom digitalnom dobu. Mogućnosti jezičkih tehnologija i izazovi. Srpski jezik u informacionom društvu. Jezički resursi: tekstualni korpusi, govorni korpusi, paralelni korpusi, leksički resursi, gramatike. Osnovna polja primene jezičkix resursa. Jezički resursi za srpski jezik: kvantitet, dostupnost, kvalitet, pokrivenost, zrelost, održivost, prilagodljivost. Standardi za pripremu tekstova za arhive, korpuse i druge primene. Tekstualni arhivi – za srpski i druge jezike. Korpusi – istorijski pregled; vrste - jednojezični, uporedivi, paralelni; anotacija korpusa, metode, prednosti i nedostaci; pregled postojećih korpusa – za srpski i druge jezike; korišćenje korpusa u obradi prirodnih jezika; pitanje autorskih prava u izradi arhiva i korpusa. Ontologije i semantičke mreže.
    Sadržaj praktične nastave Pristup postojećim resursima i alatima za procesiranje jezika. Preprocesiranje teksta. Ekstrakcija informacija iz teksta (obeležavanje imenovanih entiteta, prepoznavanje događaja).
    Literatura
    1. Ruslan Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2nd ed, 2021.
    2. Yuli Vasiliev, Natural Language Processing with Python and spaCy: A Practical Introduction, No Starch Press, 2020.
    3. Duško Vitas i dr. Srpski jezik u digitalnom dobu, Serija belih knjiga META-NET-a, Springer, 2012.
    4. Kumar, Naresh, Pratap Dangeti, and Krishna Bhavsar, Natural Language Processing with Python Cookbook, Packt Publishing Ltd, 2019.
    5. Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python, Analyzing Text with the Natural Language Toolkit, O'Reilly Media, 2009.
    Broj časova aktivne nastave nedeljno tokom semestra/trimestra/godine
    Predavanja Vežbe DON Studijski i istraživački rad Ostali časovi
    1 1
    Metode izvođenja nastave
    Ocena znanja (maksimalni broj poena 100)
    Predispitne obaveze Poena Završni ispit Poena
    Aktivnosti u toku predavanja 5 Pismeni ispit 35
    Praktična nastava Usmeni ispit
    Projekti
    Kolokvijumi 30
    Seminari 30