Анотација Корпуса савременог српског језика
Само за регистроване кориснике
2011
Чланак у часопису (Објављена верзија)
Метаподаци
Приказ свих података о документуАпстракт
Овај текст описује припрему и реализацију анотације Корпуса савременог српског језика величине 113 милиона речи. Анотација је спроведена на неколико нивоа. Сваком тексту корпуса је придружена одговарајућа библиографска информација. На основу електронског морфолошког речника српског језика припремљен је скуп етикета за врсте речи, као и речник за анотацију прилагођен програму за етикетирање TreeTagger. Коришћењем програма TreeTagger и ручно анотираног корпуса INTERA величине око милион речи, извршена је аутоматска морфосинтаксичка анотација Корпуса савременог српског језика, тј. корпусним речима је придружена информација о врсти речи и леми. Применом десетоструке унакрсне провере (енг. 10-fold cross-validation) обављена је евалуација примењеног поступка.
Кључне речи:
анотација / корпус / tagger / TreeTaggerИзвор:
Инфотека : часопис за дигиталну хуманистику, 2011, 12, 2, 39-51Издавач:
- Заједница библиотека универзитета у Србији
- Универзитетска библиотека „Светозар Марковић”
- Филолошки факултет, Универзитет у Београду
Финансирање / пројекти:
- Српски језик и његови ресурси: теорија, опис и примене (RS-MESTD-Basic Research (BR or ON)-178006)
- Овај рад приказује резултате постигнуте током 2011. године у оквиру пројекта CESAR као дела шире мреже пројеката META-NET коју финансира Европска унија.
Напомена:
- Related to a English-language version of the following article https://repff.fil.bg.ac.rs/handle/123456789/1546
URI
https://repff.fil.bg.ac.rs/handle/123456789/628https://infoteka.bg.ac.rs/index.php/sr/arhiva/2011/2/infoteka-12-2-2011-39-51
Институција/група
Filološki fakultet / Faculty of PhilologyTY - JOUR AU - Utvić, Miloš PY - 2011 UR - https://repff.fil.bg.ac.rs/handle/123456789/628 UR - https://infoteka.bg.ac.rs/index.php/sr/arhiva/2011/2/infoteka-12-2-2011-39-51 AB - Овај текст описује припрему и реализацију анотације Корпуса савременог српског језика величине 113 милиона речи. Анотација је спроведена на неколико нивоа. Сваком тексту корпуса је придружена одговарајућа библиографска информација. На основу електронског морфолошког речника српског језика припремљен је скуп етикета за врсте речи, као и речник за анотацију прилагођен програму за етикетирање TreeTagger. Коришћењем програма TreeTagger и ручно анотираног корпуса INTERA величине око милион речи, извршена је аутоматска морфосинтаксичка анотација Корпуса савременог српског језика, тј. корпусним речима је придружена информација о врсти речи и леми. Применом десетоструке унакрсне провере (енг. 10-fold cross-validation) обављена је евалуација примењеног поступка. PB - Заједница библиотека универзитета у Србији PB - Универзитетска библиотека „Светозар Марковић” PB - Филолошки факултет, Универзитет у Београду T2 - Инфотека : часопис за дигиталну хуманистику T1 - Анотација Корпуса савременог српског језика EP - 51 IS - 2 SP - 39 VL - 12 UR - conv_2591 ER -
@article{ author = "Utvić, Miloš", year = "2011", abstract = "Овај текст описује припрему и реализацију анотације Корпуса савременог српског језика величине 113 милиона речи. Анотација је спроведена на неколико нивоа. Сваком тексту корпуса је придружена одговарајућа библиографска информација. На основу електронског морфолошког речника српског језика припремљен је скуп етикета за врсте речи, као и речник за анотацију прилагођен програму за етикетирање TreeTagger. Коришћењем програма TreeTagger и ручно анотираног корпуса INTERA величине око милион речи, извршена је аутоматска морфосинтаксичка анотација Корпуса савременог српског језика, тј. корпусним речима је придружена информација о врсти речи и леми. Применом десетоструке унакрсне провере (енг. 10-fold cross-validation) обављена је евалуација примењеног поступка.", publisher = "Заједница библиотека универзитета у Србији, Универзитетска библиотека „Светозар Марковић”, Филолошки факултет, Универзитет у Београду", journal = "Инфотека : часопис за дигиталну хуманистику", title = "Анотација Корпуса савременог српског језика", pages = "51-39", number = "2", volume = "12", url = "conv_2591" }
Utvić, M.. (2011). Анотација Корпуса савременог српског језика. in Инфотека : часопис за дигиталну хуманистику Заједница библиотека универзитета у Србији., 12(2), 39-51. conv_2591
Utvić M. Анотација Корпуса савременог српског језика. in Инфотека : часопис за дигиталну хуманистику. 2011;12(2):39-51. conv_2591 .
Utvić, Miloš, "Анотација Корпуса савременог српског језика" in Инфотека : часопис за дигиталну хуманистику, 12, no. 2 (2011):39-51, conv_2591 .