Навигација

Опис предмета

21Д27006 - Језички ресурси и технологије 1

Спецификација предмета
НазивЈезички ресурси и технологије 1
Акроним21Д27006
Студијски програмЈезик, књижевност, култура
Модулмодул Језик, модул Књижевност, модул Култура, модул Српска књижевност, модул Српски језик
Тип студијадокторске академске студије
Наставник (предавач)
Наставник/сарадник (вежбе)
    Наставник/сарадник (ДОН)
      Број ЕСПБ9.0Статус предметаизборни
      Условљеност другим предметимаПредмети Језички ресурси и технологије 1 и Језички ресурси и технологије 2, иако обрађују повезане теме, нису међусобно условљени, не морају оба да се изаберу, нити да се слушају одређеним редоследом у случају да их студент изабере.Облик условљености
      Циљеви изучавања предметаЦиљ предмета је да упозна студента са изградњом и применом машински читљивих скупова језичких података и описа који се користе у образовању, истраживању и развоју технологија у вези са језиком — језичких ресурса, пре свега електронских корпуса и лексичких ресурса. Уводни део курса је независан од конкретног природног језика, а највећи део курса се бави дигиталним језичким ресурсима за српски језик, укључујући и вишејезичке ресурсе (паралелни корпуси, вишејезички речници).
      Исходи учења (стечена знања)Студент стиче теоријска знања и практичне вештине потребне да самостално припреми и користи дигиталне језичке ресурсе (електронске корпусе и речнике) користећи одговарајуће софтверске алатке за изградњу, претрагу и анализу језичких ресурса.
      Садржај предмета
      Садржај теоријске наставеЈезички ресурси. Дефиниција и подела.Дигитални текст и његови формати. Дигитализација недигиталних текстова; текстови настали као дигитални; текстови на вебу. Дигитални лексички ресурси (машински читљиви и електронски речници, локалне граматике као графови коначних трансдуктора). Обрада дигиталног текста помоћу дигиталних лексичких ресурса. Алати за креирање и примену електронских речника и локалних граматика. Електронски корпуси. Предобрада текста за електронски корпус. Анотација електронског корпуса (посебно помоћу дигиталних лексичких ресурса). Алати за изградњу, индексирање и претрагу електронских корпуса. Вишејезични електронски корпуси. Паралелни електронски корпуси.
      Садржај практичне наставе
      Литература
      1. Duško Vitas, Ljubomir Popović, Cvetana Krstev, Ivan Obradović, Gordana Pavlović-Lažetić and Mladen Stanojević. Српски језик у дигиталном добу -- The Serbian Language in the Digital Age, Springer, in “META-NET White Paper Series”, Georg Rehm and Hans Uszkoreit (Series Editors), 2012. ISBN (13) 978-3-642-30754-6.
      2. Miloš Utvić. Izgradnja referentnog korpusa savremenog srpskog jezika. Neobjavljena doktorska disertacija. Univerzitet u Beogradu, Filološki fakultet. Beograd 2014. https://nardus.mpn.gov.rs/bitstream/handle/123456789/4091/Disertacija.pdf?sequence=4&isAllowed=y https://fedorabg.bg.ac.rs/fedora/get/o:10061/bdef:Content/download
      3. Anke Lüdeling and Merja Kytö (eds.): Corpus Linguistics. An International Handbook. Berlin, New York: Walter de Gruyter. 2008. ISBN 978-3-11-018043-5. 776 pp.
      4. Daniel Jurafsky, James Martin, Speech and Language Processing. Prentice Hall, 2021, 3rd edition. https://web.stanford.edu/~jurafsky/slp3/
      5. Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistics, Oxford University Press, 2014.
      Број часова активне наставе недељно током семестра/триместра/године
      ПредавањаВежбеДОНСтудијски и истраживачки радОстали часови
      4
      Методе извођења наставемонолошке, интерактивно-комуникативне
      Оцена знања (максимални број поена 100)
      Предиспитне обавезеПоенаЗавршни испитПоена
      Активности у току предавања5Писмени испит
      Практична настава30Усмени испит35
      Пројекти
      Колоквијуми
      Семинари30