Unakrsne reference koje u bazi postoje predstavljaju dobru osnovu za uspostavljanje veza između različitih odrednica kao i veza unutar teksta iste odrednice. Potencijalno se mogu uspostavljati i nove vrste veza koje se nazivaju leksičke veze. One potiču iz jednostavne činjenice da pošto je OED knjiga koja definiše večinu engleskih reči, svaka reč teksta iz OED (iz bilo kog polja) može biti početak veze čiji je kraj njena definicija. Treba ipak imati u vidu da automatsko određivanje početka i kraja leksičke veze nije ni malo jednostavno. Na primer, može se razmotriti definicija značenje 1. za Fossic, v.(Primer je iz Darrell R. Raymond and Frank WM. Tompa: Hypertext and the Oxford English Dictionary, Communications of the ACM, Vol. 31, No. 7, pp. 871–879): |
To search for gold by digging out crevices with knife and pick, or by working in washing-places and abandoned workings in hope of finding particles or small nuggets overlooked by others. Also, to fossick about.
Prvo treba odrediti koju leksičku jedinicu treba vezati za njenu definiciju. Na primer, treba li povezati digging, out ili frazu digging out ili možda sve tri zajedno? Treća alternativa svodi se na izolovanje takozvanih otvorenih složenica što je u opštem slučaju težak problem. Kada se utvrdi šta je početak veze treba je svesti na oblik rečniče odrednice: na primer, crevices treba svesti na crevice a others na other, odnosno treba izvršti morfološku analizu. S druge strane, digging se eksplicitno definiše u OED pa ga ne treba svesti na dig. Za razliku od većine drugih rečnika engleskog, OED sadrži zasebne odrednice za sve derivacione oblike. U sledećem koraku treba odrediti cilj veze, a to može da bude cela odrednica, pododrednica za derivacioni oblik ili možda određeno značenje unutar odrednice. U gornjem primeru, washing-place je navedeno uz washing vbl. sb. kao derivaciona kombinacija ali se može primeniti samo podznačenje «(b) a place where gold is washed out from send or earth». Izbor pravilnog cilja veze uključuje određivanje vrste reči i etimološkog korena da bi se utvrdila odrednica a zatim treba izvršiti dezambiguaciju značenja da bi se odabralo odgovarajuće značenje. Na primer, da bi se identifikovao cilj pick, prvo treba utvrditi da li se radi o imenici ili glagolu a zatim da se radi od prvoj od četiri odrednice Pick sb. a na kraju treba odabrati korektno značenje među osam ponuđenih. |
Dokument: | URL: | Autor: | Cvetana Krstev | Poslednja izmena: | |