arvutiteaduse instituudi lõputööderegister


"Histoloogiasõnastiku" teisendamine TBX kujule
Nimi Siim Viiklaid
Kokkuvõte TBX (TermBase eXchange) on XML-põhine standard terminoloogilise informatsiooni vahendamiseks erinevate arvutikeskkondade vahel. Töö eesmärkideks oli teisendada algselt TeX formaadis olev „Histoloogiasõnastik” TBX standardi spetsifikatsioonile vastavaks XML dokumendiks ning tekitada sõnastiku sissekannete vahele ristviited. TBX formaat lubab sõnastikku lihtsasti teisendada erinevatesse esitusvormidesse, ristviited teevad sõnastiku kasutamise lõppkasutajale mugavamaks. TBX dokument on terminibaas ehk terminoloogiline andmebaas. Terminibaas peaks olema kavandatud teatud mudeli järgi, mis lubab selle teisendamist erinevatesse formaatidesse ja hoiab ära terminibaasi haldamisega seotud probleeme. "Histoloogiasõnastik" peegeldab seda mudelit ja sobib seega TBX formaati teisendamiseks. Sõnastiku algandmed on TeX formaadis ning sissekandeid on neljas erinevas keeles: eesti, inglise, saksa ja vene keeles, lisaks ladinakeelsed mõisted. Algandmete ülesehitus on küllaltki lihtne kuid teisenduse tegid keeruliseks suur hulk sissekannete variatsioone ja erandeid. Teisenduseks valiti evolutsioonilise prototüüpimise metoodika. See tähendab, et alguses valmis töötav, kuid puuduliku funktsionaalsusega rakendus, mida vastavalt uutele leitud vajadustele edasi arendati. Teisendus hõlmas endas nelja erinevat etappi: * Vajaliku informatsiooni sõelumine algandmetest, väljundiks lihtne XML dokument * Ristviidete leidmine ja lõpptulemuse genereerimine, väljundiks TBX dokument * Lõpptulemuse esitamine inimesele kergestiloetaval HTML kujul, et märgata tegemata jäänud nüansse * Vigade ja erandite parandamine algandmetes Teisenduse lõpptulem on TBX spetsifikatsioonile vastav XML dokument. Seda kasutatakse "Histoloogiasõnastiku" avaldamisel Keeleveebi portaalis.
Lõputöö keel eesti
Lõputöö tüüp Bakalaureus - Informaatika
Juhendaja(d) Heiki-Jaan Kaalep
Kaitsmise aasta 2011
PDF