Dolnoserbski tekstowy korpus

Regularne wuraze

Njeglědajucy na to, až wobstoj dolnoserbska rěc, tak ako kužda rěc, z towzyntow kradu rozdźělnych słow, namakajo se weto mań regularnych wóspjetowanjow. Tak kóńce se wšykne formy ako cytajśo, chwatajśo, dawajśo na ‑ajśo. Njeby móžno było, z korpusa wšykne take formy wupytaś, gaby dejali je za kuždy werb ekstra wótpšašowaś. W takich padach su regularne wuraze wjelika pomoc. Jich nałožowanje wujasnijo se w slědujucej tabeli.

wuraz wujasnjenje wuznam pśikład namakajo (na pś.)
. Dypk narownajo kuždežkuli znamuško. někake znamuško .uby luby, zuby, ruby
[] W rožkatyma spinkoma stoj definěrowany rěd pytanych znamuškow, z kótarychž se musy jadno nakamaś. někake w nima stojece znamuško [dsR]om dom, som, Rom
[-] W rožkatyma spinkoma móžo se teke interwal pódaś. To gótujo se z pomocu lažeceje smužki. interwal pismikow abo licbow [a-z] někaki pismik wót a do z (bźez diakritiki)
[a-zčćěłńóŕšśžź] kuždy dsb. pismik
[0-9] 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
[j-m]už juž, kuž, luž, muž (jolic až take formy w korpusu dajo)
[^] Kšywko (cirkumfleks) wuzamkujo znamuška, ako stoje w rožkatyma spinkoma. žedno z toś tych znamuškow [^dl]uby zuby, ruby atd., ale nic duby, luby
[^0-9] kuždežkuli znamuško, ako njejo cyfra
(|) W jadnoryma spinkoma stoj lisćina alternatiwnych wurazow abo znamuškow, kótarež su pśez padorownu smužku wót se źělone. alternatiwy (D|d)om Dom, dom
([Ss]|[Tt])am Sam, sam, Tam, tam
\ Wobrośona nakóśna smužka (backslash) pśed znamuškami, ako maju w regularnych wurazach specielny wóznam (na pś. ?*+()[]{}. a teke blackslash sam), gótujo, až toś te znamuška pśi pytanju se wobglěduju ako normalne jadnotki teksta. specielny wóznam znamuška ignorěrowaś \.\.\.\? ...?
awtor\*ki awtor*ki
[j\-m]už juž, -už, muž (jolic až take formy w korpusu dajo)
\\ wobrośonu nakósnu smužku \
Wobrośona nakóśna smužka (backslash) pśed někotarymi znamuškami, ako w regularnych wurazach njamaju specielny wóznam (na pś. jadnore pismiki a licby), gótujo, až toś te znamuška dostanu specielny wóznam. znamuškoju specielny wóznam daś \d cyfru (engelski „digit“)
0, 1, 2, 3, 4, 5, 6, 7, 8, 9
\D něco mimo cyfry
\w pismik wót a do z (engelski „word character“)
\W něco mimo pismika wót a do z
\s prozne znamuško ako proznotu, tabulator, łamanje smugi (engelski „white space“)
\S něco mimo proznego znamuška
wóspjetowanja (kwantifikatory)
? Pśed pšašakom stojece znamuško wustupujo nul abo jaden raz. 0 abo 1 raz za? z, za
* Pśed gwězdku (asteriskom) stojece znamuško wustupujo nul abo wěcej razow. 0 abo wěcej razow hm* h, hm, hmm, hmmm
+ Pśed znamuškom plus stojece znamuško wustupujo nanejmjenjej jaden raz. 1 abo wěcej razow hm+ hm, hmm, hmmm
{n} W kśidłatyma spinkoma zapisana licba n groni, wjele razow wuraz abo znamuško pśed spinkoma wustupujo. n razow dom.{3} domowy, domcyk
{m,n} W kśidłatyma spinkoma zapisanej a pśez koma wót se źělonej licbje m a n gronitej, wjele razow wuraz abo znamuško pśed spinkoma musy nanejmjenjej a smějo maksimalnje wustupowaś. m do n razow .{3,7} kuždy rěd znamuškow, kenž wobstoj z tśich do sedym znamuškow, na pś. kužde słowo, ako ma tśi do sedym pismikow
hm{2,4} hmm, hmmm, hmmmm

Na něco daś se how hyšći pokažo: Gaž zapišo se pśi pytanju wuraz z małymi pismikami, njenamakaju se formy z wjelikim pismikom. Jolic až pyta na pśikład něchten formu „ten“, njenamakajo se „Ten“ abo „TEN“. Aby se toś to rozeznawanje mjazy wjelikimi a małymi pismikami ignorěrowało, móžo se pśed pytanej formu pisaś „(?i)“. Tak namakajo „(?i)dom“ formy Dom, dom, DOM atd.

Někotare pśikłady za pytanje

dom.*
namakajo wšykne słowa, ako zachopiju na dom-, na pś. dom, domašk, domoj, domowina atd.
dom[auy]*
namakajo dom, doma, domu, domy
dom[auy]+
namakajo doma, domu, domy
ru[kc][aieu]
namakajo ruka, ruki, ruce, ruku (ale teke: ruci, rucu atd.)
ru(ka|ki|ce|ku|koma|kowu)
namakajo ruka, ruki, ruce, ruku, rukoma, rukowu (ale nic: ruk, rukow, rukom, rukam atd.)
.+owu.+
namakajo wšykne słowa, ako maju we srjejźi (ale nic na zachopjeńku abo kóńcu) -owu-, na pś. głowubólenje, wótnowujo, Nowuš atd.
[zſ]a(s|ſſ|ß)ej
namakajo zasej, ſaſſej, ſaßej (ale teke: zaſſej, zaßej, ſasej) namaka
w?(š|ſch|ſ̷ch)[iyü]kno
namakajo wšykno, šykno, wſchykno, ſchykno, wſ̷chykno, ſ̷chykno, wšikno, šikno, wſchikno, ſchikno, wſ̷chikno, ſ̷chikno, wšükno, šükno, wſchükno, ſchükno, wſ̷chükno, ſ̷chükno
.*a[rŕ]ski
namakajo wšykne słowa, ako kóńce se na -arski abo -aŕski, na pś. pšosarski, pšosaŕski atd.
.*arskemu
namakajo wšykne słowa, ako kóńce se na -arskemu, na pś. wójarskemu, bergarskemu, pšosarskemu atd.
.*arske[gm][ou]
namakajo wšykne słowa, ako kóńce se na -arskego, -arskemu, ale teke -arskegu, -arskemo
.*arsk(ego|emu|ogo|omu)
namakajo wšykne słowa, ako kóńce se na -arskego, -arskemu, -arskogo, -arskomu