Sõnaartikli otsimine
Kõigepealt määra, kas otsitakse ühest konkreetsest
köitest või kõigist (köidete valik ülal vasakul). Sõnaartiklit saab otsida kõigi struktuurielementide (ja nende sisude) järgi,
Otsitav element määratakse artikli struktuuri näitava menüü abil (ülal vasakul, köitevaliku all):
Otsitava elemendi menüüst paremale jääb
otsiaken, kuhu sisesta elemendis sisalduv tähejärjend või avaldis (vt allpool). Antud näites on otsitud kõiki g-ga algavaid sõnu - avaldis g*. Sellest edasi neli on linnukest:
- linnuke Otsing on tõstutundetu
- linnuke Otsitakse kõiki märke
- linnuke Otsitakse ka fakultatiivseid järjendeid
- linnuke Otsitakse kogu artiklist.
Otsingu käivitab nupp Otsing.
Sõnaartiklite otsimiseks on võimalik kasutada
- nn tavaotsingut,
- otsingut XPath süntaksi järgi
- otsingut regulaaravaldiste süntaksiga
- päringut XML süntaksi järgi.
Neid otsinguliike eristatakse otsitava teksti lahtris oleva teksti esisümbolite järgi:
- kui tekst algab kahe paragrahvi sümboliga (§§), siis kasutatakse regulaaravaldiste süntaksit;
- kui tekst algab ühe paragrahvi sümboliga (§), siis kasutatakse XPath süntaksit;
- ülejäänud juhtudel tavaotsingut.
XML süntaksi järgi otsimiseks kasuta otsingu käimitamiseks Otsi-nupu asemel nuppu XML (Otsi-nupust paremal).
TavaotsingTavaotsingul kasutatakse tekstijärjendeid ja metasümboleid. Metasümboliteks tavaotsingus on tärn (*) ja küsimärk (?). Tärn (*) tähistab suvalist järjendit, küsimärk (?) üksikut tähte. Tavaotsingu näiteid vt tabelist, liitsõnapiiri tähistab püstkriips (|).
Otsitav element
|
Otsitav tekst
|
Kommentaar
|
Vastus
|
märksõna
|
abikäsi
|
TÄPNE OTSING: leitakse kõik märksõnad "abikäsi"
|
abi|käsi
|
näiterühm: stiil
|
kõne
|
TÄPNE OTSING: leitakse kõik näiterühmades esinevad stiilimärgendid "kõnek"
|
breik .. Breiki tegema, panema. kõnek.
|
märksõna
|
abi*
|
SÕNA ALGUSE OTSING: leitakse kõik märksõnad, mis algavad järjendiga "abi"
|
abi|aine, abielu|akt, abielulahutus|akt ...
|
märksõna
|
*abi
|
SÕNA LÕPU OTSING: leitakse kõik märksõnad, mis lõpevad järjendiga "abi"
|
humanitaar|abi
|
märksõna
|
*ndus*
|
OTSING SÕNA SEEST: leitakse kõik märksõnad, mis sisaldavad järjendit "ndus"
|
agraar|-industriaalne, ajakirjandus|vabadus, asendus|teenistus, auto|ärandus ...
|
märksõna
|
a*v
|
SÕNA ALGUSE JA LÕPU OTSING: leitakse kõik märksõnad, mis algavad a-ga ja lõpevad v-ga
|
anne|päev
|
sagedus
|
(lahter jäetakse tühjaks)
|
NB! Kuna salvestamisel kustutatakse alati tühjad väljad, siis tavaliselt tulemus puudub
|
|
liitsõnade plokk
|
=NULL
|
PUUDUVA VÄLJA OTSING: leitakse artiklid, kus valitud otsinguväli puudub
|
aaderdama, aaderdus, aasta|intress ...
|
märksõna
|
*
|
KÕIKIDE SÕNADE OTSING: leitakse kõik märksõnad (kui ei ületata otsingutulemuste limiiti)
|
(sõnade loend)
|
märksõna
|
*|*
|
leitakse märksõnad, milles sisaldub liitsõnapiir '|'
|
aasta|intress …
|
märksõna
|
*|*|*
|
leitakse märksõnad, milles on kaks liitsõnapiiri '|'
|
halogeen|(hõõg)|lamp, kõne|post|kast
|
märksõna
|
bt
|
leitakse neljatähelised märksõnad, mis algavad tähega 'b' ja lõpevad tähega 't'
|
bait, balt
|
märksõna
|
|
leitakse ainult kahetähelised märksõnad
|
ca, CD, CV …
|
märksõna
|
b__
|
leitakse viietähelised märksõnad, mille kolmas täht on 'b'
|
album, kebab
|
Otsing regulaaravaldistega
Regulaaravaldiste kasutamine tekstiotsinguis võimaldab määrata üksikute tähtede või tervete järjendite korduvust; märkida otsingus täheklasse nagu kirjatäht/mittekirjatäht, suurtäht/väiketäht; otsida sümboleid loetelust; märkida sõnapiiri, teksti algust, lõppu jne. Regulaaravaldistega otsinguks peab otsitingimus algama kahe paragrahvimärgiga §§. Võib kasutada kõiki regulaaravaldiste süntaksi märke.
- ^ - teksti algus; $ - teksti lõpp
- \u – suurtäht
- \l – väiketäht
- \v – vokaal, täishäälik
- \k – konsonant, kaashäälik
- \b – sõnapiir
- [xyz] – vähemalt üks märk loetelust
- [A-Z] – vahemik A kuni Z
- \p{L} – suvaline Unicode täht suvalises keeles/kultuuris
- \p{Lu} – suvaline Unicode suurtäht suvalises keeles/kultuuris
- \p{N} – suvaline numbritäht suvalises keeles/kultuuris
- edasi vt Regular Expression Wikipedias
Otsing XPathi moodulit kasutades
Kui tekst otsingulahtris algab ühe paragrahvi sümboliga (§), siis mõistab süsteem seda kui XPath-i avaldist. Vaja on teada sõnastiku nimeruumi ja elementide silte (need saab järgi vaadata kas sõnastiku skeemifailist või otsitava elemendi määramise menüüst elemendi nime järel olevast veerust).
XPathi kohta vaata lisaks
XPath Tutoriali W3Schoolsis.
Otsing XML moodulit kasutades
Nupp XML (nupust Otsi paremal). XML kohta vaata täpsemalt
XML Tutorial.
Ühised märksõnad teiste EELexi sõnastikega
Toimetamisala kohalt märksõna/termini lahtrist avanevas menüüs on ülemine valik
Ühised märksõnad 'sõnastiku id' ja ... ning paremale avanevas menüüs saad valida, millise teise sõnastikuga ühisosa otsida. Eeldus: sõnastik on paralleelselt MySQL andmebaasis.
Sõna otsimine veebist
On veel võimalus minna vaatama sama sõna
teiste sõnastike veebiversioonidest või guuglist. Paremklõps elemendi nimel - menüüst
Välised lingid / Guuglisse. Välised lingid avab allikate menüü, mida saab ka ise täiendada.
Sarnaste sõnaartiklite otsimine
Sarnaste sõnaartiklite leidmise tööriist otsib sõnastiku sees sarnase tähtkoostisega märksõnu (sh artikli sees olevaid märksõnu). Selle abil saab näiteks kontrollida, kas sõnaartiklitele on vaja lisada homonüüminumber (otsingutulemuste tabelis on viimased näha) või ongi tegu kahe sisult sama sõnaartikliga, millest üks siis kustutada, vms. Eeldus: sõnastik peab olema ka MySQL-is.
Vali
Sõnastiku tööriistad -- Sarnased märksõnad. Leiud kuvatakse tulemuste tabelis.
NB! Kui sõnastik on jaotatud mitme köite vahel, siis on mõistlik enne sarnaste märksõnade leidmist valida Toimetamisala kohalt köidete valikust
Kõik köited
Näidispäringuid
A. Sõnastikutöö kulgu jälgivad päringud
Küsimus
|
Otsitav element
|
Tekst otsilahtrisse
|
Kommentaar
|
Kasutaja ’ EReinsalu’ poolt salvestatud (toimetatud) artiklid
|
artikli toimetaja
|
EReinsalu
|
|
2012. a veebruaris salvestatud (toimetatud) artiklid
|
artikkel
|
§starts-with(c:TA, '2012-02')
|
TA on toimetamise aeg
|
Toimetaja ’JKallas’ poolt salvestatud artiklid septembris 2012:
|
artikkel
|
§c:T='JKallas' and starts-with(c:TA, '2012-09')
|
T on toimetaja, TA toimetamise aeg.
|
Novembris või detsembris 2011 salvestatud artiklid (keskel olev punkt tähistab üht sümbolit, antud juhul ’-’; ees olev katus ^ tähendab järjendi algust)
|
toimetamisaeg
|
§§^2011.(11|12)
|
|
Artiklid, mille toimetamine on lõpetatud
|
artikkel
|
§c:TL
|
TL on toimetamise lõpu märge
|
Artiklid, mille toimetamine on lõpetatud (teine võimalus)
|
toimetamise lõpp
|
*
|
|
Kõik artiklid, mille koostaja on MJyrviste
|
artikkel
|
§c:K = 'MJyrviste'
|
|
Kõik toimetatud artiklid (pandud on toimetamise lõpu märge TL)
|
artikkel
|
§c:TL
|
|
MTuuliku koostatud ja koostamine lõpetatud, aga toimetamata (TL panemata)
|
artikkel
|
§c:K='MTuulik' and c:KL and not(c:TL)
|
|
Koostamise lõpu järgi otsimine
|
artikkel
|
§.//c:K='MJyrviste' and .//c:KL[starts-with (., '2011-01')]
|
|
Kuupäeva järgi otsimine (KL - koostamise lõpp)
|
artikkel
|
§c:K='MJyrviste' and .c:KL[starts-with (., '2011-03-05')]
|
|
Artiklid, mille koostaja MJyrviste, koostamine lõpetatud kas veeburaris 2011 või 1. märtsil 2011 või 3. märtsil 2011
|
artikkel
|
§.//c:K='MJyrviste' and .//c:KL[starts-with(., '2011-02') or starts-with(., '2011-03-01') or starts-with(., '2011-03-03')]
|
|
Artiklid, mille koostaja on MJyrviste ja koostamise lõpu märgi pandi 2011 aprillis või mais
|
artikkel
|
§.//c:K='MJyrviste' and .//c:KL[starts-with(., '2011-04') or starts-with(., '2011-05')]
|
|
Artiklid, millel puudub morfoloogia plokk
|
morfoloogia plokk
|
=NULL
|
|
Artiklid, millel puudub morfoloogia plokk (teine võimalus)
|
artikkel
|
§not(.//c:mfp)
|
|
Artiklid, millel pole koostamise lõppu ega toimetamise lõppu
|
artikkel
|
§not(c:KL) and not(c:TL)
|
|
|
|
|
|
B. Päringud sõnastiku sisu kohta
Küsimus
|
Otsitav element
|
Tekst otsilahtrisse
|
Kommentaar
|
|
Artiklid, milles termin, mis sisaldab sõna 'lantanoid'
|
termin
|
*lantanoid*
|
|
|
Artiklid, milles vaste on sõna 'mine'
|
vaste
|
mine
|
|
|
Artiklid, milles vaste sisaldab 'rock'
|
vaste
|
*rock*
|
|
|
Artiklid, millel soome keeles ei ole vasteid.
|
vastete plokk
|
§@xml:lang='fi' and not(.//h:hg/h:x)
|
|
|
Artiklid, mille märksõna sisaldab tühikut
|
märksõna
|
*
|
linnuke Otsi kõiki märke. Tühik pane otsilahtrisse kahe tärni vahele.
|
|
Artiklid, mille märksõna sisaldab tühikut või liitsõnapiiri:
|
märksõna
|
§§[ /]
|
|
|
Artiklid, millel soome keeles ei ole vasteid
|
vastete plokk
|
§@xml:lang='fi' and not(.//h:hg/h:x)
|
|
|
Artiklid, millel puudub sisu plokk S
|
artikkel
|
§not(s:S)
|
|
|
Leia kasutaja MLangemets poolt koostatud artiklid, mis on lõpetatud (s.t on olemas KL e koostamise lõpu märge) ja kus vald (v) ei ole märgitud ab-ks
|
artikkel
|
§s:K='MLangemets' and s:KL and .//s:v[not(@s:as='ab')]
|
|
|
Artiklid, mille vene keele vastete plokid ON lõpetatud (eeldusel, et eri keelte vastete plokis on toimetamise lõpu märget võimalik lisada)
|
vastete plokk
|
$@xml:lang='ru' and @h:aKL
|
|
|
Artiklid, mille vene keele vastete plokid EI OLE lõpetatud (eeldusel, et eri keelte vastete plokis on toimetamise lõpu märget võimalik lisada)
|
vastete plokk
|
$@xml:lang='ru' and not(@h:aKL)
|
|
|
Kuidas leida neid artikleid, millekoostamine on lõpetatud, vene keeles pole veel vasteid või puudub koostamise lõpu märge
|
artikkel
|
§h:KL and (not(.//h:xp[@xml:lang = 'ru']) or .//h:xp[@xml:lang = 'ru' and not(@h:aKL)])
|
|
|
Artiklid, millel vene keeles pole veel vasteid
|
artikkel
|
§not(.//h:xp[@xml:lang = 'ru'])
|
|
|
Artiklid, kus on saksa plokk, aga pole määratud sugu (xzde)
|
artikkel
|
§(.//h:xp[@xml:lang = 'de'] and not(.//h:xzde))
|
|
|
kõik terminikirjed, millel ei ole ühtki valdkonnamärgendit
|
artikkel
|
§not(.//h:v)
|
v - valdkond
|
|
Valdkonna märgend on KASV või KASV + muu (v.a PSÜHH ja SOPE)
|
|
§(.//h:v="kasv" and not(.//h:v="sope") and not(.//h:v="psühh"))
|
Päringus tuleb valdkonna nimed pannna väikeste tähtedega
|
|
Valdkonna märgend on ainult KASV
|
artikkel
|
§(.//h:v="kasv" and count(.//h:v)=1)
|
|
|
Valdkonna märgend on KASV + kindlasti veel mõni valdkond (v.a PSÜHH ja SOPE)
|
artikkel
|
§(.//h:v="kasv" and not(.//h:v="sope") and not(.//h:v="psühh") and count(.//h:v)>1)
|
|
|
Valdkonna märgend on KASV + veel mõni valdkond (ilma piiranguteta)
|
artikkel
|
§(.//h:v="kasv" and count(.//h:v)>1)
|
|
|
Võimalikud lahendused, kuidas leida kokkulangeva sõnaga (märksõnaga, vastega) artiklid.
- Märksõnade puhul aitab sarnaste märksõnade otsing (Sõnastiku tööriistad -- Sarnased märksõnad), aga sõnastik peab olema kantud ka MySQL-i baasi.
- Hädapärast saab kokkulangevaid vasteid leida vasteid sorteerides:
Otsitav element = märksõna ja otsilahtrisse tärn * (või a* või muud sarnast, et tulemusi oleks vähem) ja päringu käivitamiseks mitte Otsi-nupp vaid nupp XML (otsib XML baasist, mitte MySQL baasist). Nüüd saab tulemuste tabeli Leidude veergu sortida (veeru päisele klõpsates). Puudus: lahtris võib olla mitu vastet, aga veeru sortimine arvestab ainult esimest. Väike leevendus: sordi lahtrite sisud ka ära, hoides paremklõpsamisel all ctrl+shift). Puudus: ikkagi ei käsitle kõiki vasteid võrdsena. Vt edasi.
Vastete kaupa sortida saab järgmisel moel.
Leia näiteks kõik olemasolevad soome vasted.
otsitav element = vastete plokk ja otsilahtrisse:
§<@xml:lang='fi' and .//h:hg/h:x
Vajuta nuppu
Muuda tabelit tabeli kohal paremal, pane linnuke vaste ette ja Ok. Avaneb muudetud tabel, kus kaks veergu – märksõna ja vaste (ühe märksõna mitu erinevat soomekeelset vastet on nüüd eraldi ridadel). Kopeeri tabel nupu
Kopeeri tabel abil (tulemuste tabeli kohal paremal) ja ava mõni MS Word ja kleebi tühjale dokumendile (ctrl + V). Wordis saab seda tabelit sortida veergude kaupa.