@phdthesis{
author = "Utvić, Miloš",
year = "2014",
abstract = "U ovom radu se razmatra problem metoda i alata za konstrukciju korpusa savremenog srpskog jezika kao referentnog jezičkog resursa. Rad se sastoji od tri dela. U prvom delu rada se razmatraju opšta pitanja koja se odnose na definiciju, istorijat, parametre i klasifikaciju korpusa, kao i na korpusnu lingvistiku kao metodologiju istraživanja jezika. Posebna pažnja je posvećena pitanjima reprezentativnosti i balansiranosti korpusa kao uzorka jezika. Takođe je detaljno razmotren i uticaj Interneta, odnosno veba, na kritičko preispitivanje definicije korpusa. Kao parametri korpusa, posebno su analizirani nosač, domen i namena, obim (veličina), period, izvor/medijum, anotacija i višejezičnost. Na osnovu tih parametara su opisane moguće klasifikacije korpusa i posebno su izdvojeni nacionalni korpusi kao opšti, referentni korpusi koji pretenduju da reprezentuju jezik jedne zemlje. Detaljno su analizirani nacionalni korpusi slovenskih jezika. Poseban odeljak je posvećen istorijatu srpske korpusne lingvistike. Na kraju prvog dela rada su navedeni ciljevi rada: razmatranje mogućnosti izgradnje opšteg korpusa srpskog jezika koji bi bio elektronski, dinamički, sinhroni, balansiran, anotiran (morfološki, strukturno, bibliografski), kao i mogućnosti izgradnje pratećih višejezičnih paralelnih korpusa u kojima je srpski izvorni ili ciljni jezik..., The problem regarding the methods and tools to construct a corpus of contemporary Serbian as a reference language resource is considered in this thesis. The thesis consists of three parts. General questions related to definition, history, parameters and classification of corpora, as well as to corpus linguistics as a methodology in language research, are considered in the first part of the thesis. The special attention is paid to questions regarding representativeness and balance of corpus as a language sample. The affect of Internet/Web on critical review of corpus definition is considered in detail, too. Corpus parameters (storage medium, domain/purpose, size, time span, mode of communication, annotation and multilinguality) are particularly analysed. Possible classifications of corpora, based on these parameters, are described with emphasis on national corpora as general reference corpora which are supposed to represent the national language of a country. National corpora of Slavic languages are analysed exhaustively. A special section is dedicated to the history of Serbian corpus linguistics. The goals of thesis are listed in the end of the first part of the thesis: considering possibilities for construction of general, electronic, dynamic, synchronous, balanced, morphosyntactically and bibliographically-annotated corpus, as well as the possibilities for construction of multilingual parallel corpora with Serbian as source or target language...",
publisher = "Универзитет у Београду, Филолошки факултет",
title = "Izgradnja referentnog korpusa savremenog srpskog jezika, The construction of reference corpus of contemporary Serbian",
url = "t-5195"
}