Навигација

Опис предмета

2127236 - Језичке технологије 2

Спецификација предмета
НазивЈезичке технологије 2
Акроним2127236
Студијски програмЈезик, књижевност, култура
Модулмодул Албански језик, књижевност, култура, модул Библиотекарство и информатика, модул Румунски језик, књижевност, култура, модул Скандинавски језик, књижевност, култура
Тип студијаосновне академске студије
Наставник (предавач)
Наставник/сарадник (вежбе)
Наставник/сарадник (ДОН)
    Број ЕСПБ3.0Статус предметаизборни
    Условљеност другим предметимаПраћење предмета је условљено бројем места на предмету и претходно одслушаним предметом Језичке технологије 1. Полагање предмета је условљено претходно положеним испитом из предмета Језичке технологије 1.Облик условљености
    Циљеви изучавања предметаУпознавање са језичким технологијама, посебно са врстама језичких алата, језичким ресурсима на које се ослањају, текућим међународним стандардима за њихову реализацију и обучавање за њихово активно коришћење. Фокус курса су постојећи језички алати за српски језик и предуслови за изградњу алата који не постоје за српски.
    Исходи учења (стечена знања)Студент је упознао основне врсте језичких алата и апликација везаних за обраду природних језика, упознао је основне стандарде за њихову израду и оспособио се за њихово коришћење.
    Садржај предмета
    Садржај теоријске наставеОсновна поља примене језичких технологија данас: провера језика, претраживање веба, говорна интеракција, машинско превођење, проналажење информација и сродне апликације (одговарање на питање, екстракција информација, резимирање текста, генерисање текста). Језички алати у образовању. Језички алати, технологије и апликације: препознавање говора, синтеза говора, граматичка анализа, семантичка анализа, генерисање језика, машинско превођење. Основни приступи у изградњи језичких алата (статистички, заснован на лингвистичком знању, хибридни). Језички ресурси као подршка изградњи језичких алата. Основна поља примене језичких ресурса. Језички алати за српски језик: квантитет, доступност, квалитет, покривеност, зрелост, одрживост, прилагодљивост.
    Садржај практичне наставеГребање веба. Прикупљање текстуалног корпуса. Анализа и анотација текстуалних скупова података.
    Литература
    1. Ruslan Mitkov, The Oxford Handbook of Computational Linguistics, Oxford University Press, 2nd ed, 2021.
    2. Yuli Vasiliev, Natural Language Processing with Python and spaCy: A Practical Introduction, No Starch Press, 2020.
    3. Daniel Jurafsky, and James H. Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 2nd ed, 2009.
    4. Kumar, Naresh, Pratap Dangeti, and Krishna Bhavsar, Natural Language Processing with Python Cookbook, Packt Publishing Ltd, 2019.
    5. Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python, Analyzing Text with the Natural Language Toolkit, O'Reilly Media, 2009.
    Број часова активне наставе недељно током семестра/триместра/године
    ПредавањаВежбеДОНСтудијски и истраживачки радОстали часови
    11
    Методе извођења наставе
    Оцена знања (максимални број поена 100)
    Предиспитне обавезеПоенаЗавршни испитПоена
    Активности у току предавања5Писмени испит35
    Практична наставаУсмени испит
    Пројекти
    Колоквијуми30
    Семинари30