Navigacija

Opis predmeta

21D27006 - Jezički resursi i tehnologije 1

Specifikacija predmeta
Naziv Jezički resursi i tehnologije 1
Akronim 21D27006
Studijski program Jezik, književnost, kultura
Modul modul Jezik, modul Književnost, modul Kultura, modul Srpska književnost, modul Srpski jezik
Tip studija doktorske akademske studije
Nastavnik (predavač)
Nastavnik/saradnik (vežbe)
    Nastavnik/saradnik (DON)
      Broj ESPB 9.0 Status predmeta izborni
      Uslovljenost drugim predmetima Predmeti Jezički resursi i tehnologije 1 i Jezički resursi i tehnologije 2, iako obrađuju povezane teme, nisu međusobno uslovljeni, ne moraju oba da se izaberu, niti da se slušaju određenim redosledom u slučaju da ih student izabere. Oblik uslovljenosti
      Ciljevi izučavanja predmeta Cilj predmeta je da upozna studenta sa izgradnjom i primenom mašinski čitljivih skupova jezičkih podataka i opisa koji se koriste u obrazovanju, istraživanju i razvoju tehnologija u vezi sa jezikom — jezičkih resursa, pre svega elektronskih korpusa i leksičkih resursa. Uvodni deo kursa je nezavisan od konkretnog prirodnog jezika, a najveći deo kursa se bavi digitalnim jezičkim resursima za srpski jezik, uključujući i višejezičke resurse (paralelni korpusi, višejezički rečnici).
      Ishodi učenja (stečena znanja) Student stiče teorijska znanja i praktične veštine potrebne da samostalno pripremi i koristi digitalne jezičke resurse (elektronske korpuse i rečnike) koristeći odgovarajuće softverske alatke za izgradnju, pretragu i analizu jezičkih resursa.
      Sadržaj predmeta
      Sadržaj teorijske nastave Jezički resursi. Definicija i podela.Digitalni tekst i njegovi formati. Digitalizacija nedigitalnih tekstova; tekstovi nastali kao digitalni; tekstovi na vebu. Digitalni leksički resursi (mašinski čitljivi i elektronski rečnici, lokalne gramatike kao grafovi konačnih transduktora). Obrada digitalnog teksta pomoću digitalnih leksičkih resursa. Alati za kreiranje i primenu elektronskih rečnika i lokalnih gramatika. Elektronski korpusi. Predobrada teksta za elektronski korpus. Anotacija elektronskog korpusa (posebno pomoću digitalnih leksičkih resursa). Alati za izgradnju, indeksiranje i pretragu elektronskih korpusa. Višejezični elektronski korpusi. Paralelni elektronski korpusi.
      Sadržaj praktične nastave
      Literatura
      1. Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić and Mladen Stanojević. Srpski jezik u digitalnom dobu -- The Serbian Language in the Digital Age, Springer, in “META-NET White Paper Series”, Georg Rehm and Hans Uszkoreit (Series Editors), 2012. ISBN (13) 978-3-642-30754-6.
      2. Miloš Utvić. Izgradnja referentnog korpusa savremenog srpskog jezika. Neobjavljena doktorska disertacija. Univerzitet u Beogradu, Filološki fakultet. Beograd 2014. https://nardus.mpn.gov.rs/bitstream/handle/123456789/4091/Disertacija.pdf?sequence=4&isAllowed=y https://fedorabg.bg.ac.rs/fedora/get/o:10061/bdef:Content/download
      3. Anke Lüdeling and Merja Kytö (eds.): Corpus Linguistics. An International Handbook. Berlin, New York: Walter de Gruyter. 2008. ISBN 978-3-11-018043-5. 776 pp.
      4. Daniel Jurafsky, James Martin, Speech and Language Processing. Prentice Hall, 2021, 3rd edition. https://web.stanford.edu/~jurafsky/slp3/
      5. Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistics, Oxford University Press, 2014.
      Broj časova aktivne nastave nedeljno tokom semestra/trimestra/godine
      Predavanja Vežbe DON Studijski i istraživački rad Ostali časovi
      4
      Metode izvođenja nastave monološke, interaktivno-komunikativne
      Ocena znanja (maksimalni broj poena 100)
      Predispitne obaveze Poena Završni ispit Poena
      Aktivnosti u toku predavanja 5 Pismeni ispit
      Praktična nastava 30 Usmeni ispit 35
      Projekti
      Kolokvijumi
      Seminari 30