Навигација

Опис предмета

2127235 - Језичке технологије 1

Спецификација предмета
НазивЈезичке технологије 1
Акроним2127235
Студијски програмЈезик, књижевност, култура
Модулмодул Албански језик, књижевност, култура, модул Библиотекарство и информатика, модул Италијански језик, књижевност, култура, модул Румунски језик, књижевност, култура, модул Скандинавски језик, књижевност, култура
Тип студијаосновне академске студије
Наставник (предавач)
Наставник/сарадник (вежбе)
Наставник/сарадник (ДОН)
    Број ЕСПБ3.0Статус предметаизборни
    Условљеност другим предметимаПраћење предмета је условљено бројем места на предмету и претходно одслушаним предметима Информатички практикум 3 и Структура информација 1 (група 27) или одговарајућим предзнањем које замењује поменуте предмете (остале групе). Полагање предмета је условљено претходно положеним испитима из предмета Информатички практикум 3 и Структура информација 1 (група 27) или одговарајућим предзнањем које замењује поменуте предмете (остале групе).Облик условљености
    Циљеви изучавања предметаУпознавање са језичким технологијама, посебно са врстама језичких ресурса, њиховим формирањем, текућим међународним стандардима за њихову реализацију и обучавање за њихово активно коришћење. Фокус курса су постојећи дигитални ресурси за српски језик и основе за изградњу ресурса који не постоје за српски.
    Исходи учења (стечена знања)Студент упознаје основне врсте језичких ресурса који се данас користе у бројним апликацијама везаним за обраду природних језика, упознаје основне стандарде за њихову израду и оспособљује се за припремање материјала за израду језичких корпуса и за њихово коришћење.
    Садржај предмета
    Садржај теоријске наставеУлога језичких технологија у савладавању језичких баријера данас. Угроженост језика у новом дигиталном добу. Могућности језичких технологија и изазови. Српски језик у информационом друштву. Језички ресурси: текстуални корпуси, говорни корпуси, паралелни корпуси, лексички ресурси, граматике. Основна поља примене језичкиx ресурса. Језички ресурси за српски језик: квантитет, доступност, квалитет, покривеност, зрелост, одрживост, прилагодљивост. Стандарди за припрему текстова за архиве, корпусе и друге примене. Текстуални архиви – за српски и друге језике. Корпуси – историјски преглед; врсте - једнојезични, упоредиви, паралелни; анотација корпуса, методе, предности и недостаци; преглед постојећих корпуса – за српски и друге језике; коришћење корпуса у обради природних језика; питање ауторских права у изради архива и корпуса. Онтологије и семантичке мреже.
    Садржај практичне наставеПриступ постојећим ресурсима и алатима за процесирање језика. Препроцесирање текста. Екстракција информација из текста (обележавање именованих ентитета, препознавање догађаја).
    Литература
    1. Ruslan Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2nd ed, 2021.
    2. Yuli Vasiliev, Natural Language Processing with Python and spaCy: A Practical Introduction, No Starch Press, 2020.
    3. Душко Витас и др. Српски језик у дигиталном добу, Серија белих књига МЕТА-НЕТ-а, Спрингер, 2012.
    4. Kumar, Naresh, Pratap Dangeti, and Krishna Bhavsar, Natural Language Processing with Python Cookbook, Packt Publishing Ltd, 2019.
    5. Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python, Analyzing Text with the Natural Language Toolkit, O'Reilly Media, 2009.
    Број часова активне наставе недељно током семестра/триместра/године
    ПредавањаВежбеДОНСтудијски и истраживачки радОстали часови
    11
    Методе извођења наставе
    Оцена знања (максимални број поена 100)
    Предиспитне обавезеПоенаЗавршни испитПоена
    Активности у току предавања5Писмени испит35
    Практична наставаУсмени испит
    Пројекти
    Колоквијуми30
    Семинари30