Dolnoserbski tekstowy korpus

(standardne pytanje w starem korpusu)

Informacije

Dolnoserbski tekstowy korpus wopśimjejo tuchylu pismojstwo we wobměrje wěcej ako 23 milionow tokenow (běžnych słownych formow). Něźi 15 milionow z nich su něnto online pśistupne. Digitalna zběrka tekstow jo produkt dłujkolětnego źěła Chóśebuskeje wótnožki Serbskego instituta. Głowny akcent źěłabnosći jo dotychměst lažał na samem digitalizěrowanju tekstow, z wótmyslenim, aby wóni se mógali elektroniski cytaś a pśeźěłowaś. Tak jo se mógał wjeliki źěl dolnoserbskego pismojstwa za wědomnostne slěźenje spśistupniś, což jo było dotychměst wósebnje za wobšyrne leksikografiske projekty wótźělenja wužytne.

Dokulaž jo originalne pisanje w tekstach se wobchowało, jo korpus markěrowany pśez kradu wšake a teke we wobłuku jadnogo spisa nic pśecej jadnotne (pšawo)pisańske konwencije tekstow. Mimo togo njejo było na zakłaźe personalneje situacije móžno, wšykne teksty dokorigěrowaś, tak až dej wótergi z (wótpisowańskimi) zmólkami se licyś.

W Dolnoserbskem tekstowem korpusu móžo se z pomocu regularnych wurazow pytaś.

Online-wersija Dolnoserbskego tekstowego korpusa jo se zmóžniła z techniskeju pódpěru Ústava Českego národnego korpusa Praskeje Karloweje uniwersity. Z internetowych bokow teje institucije póbitujo se tejerownosći pśistup na dolnoserbske teksty. Pókšacanym wužywarjam staja toś ten pśistup dodatne funkcije (filtry, wótpšašowanje kolokacijow atd.) k dispoziciji, kótarež tuchylu na našom seśowem boce hyšći se njepóbituju.

Wót 27.9.2023 póbitujo se pśez Praske boki teke rozšyrjona, pśez źěło SI kwalitatiwnje wobźěłana, rozmjej normalizěrowana a lematizěrowana wersija korpusa.