Teadmuse eraldamine ChatGPT-st
Organisatsiooni nimi
EstNLTK
Kokkuvõte
Töö eesmärgiks on kasutada ChatGPT-d arvutuslikult efektiivsemate spetsiifilise fakteraldusmudelite loomiseks. Töö konkreetne eesmärk on asesõnadele vastavate lauseosade tuvastaja loomine (anafoorituvastus). Selleks on plaanis kasutada
automaatse süntaksianalüüsiga rikastatud Eestikeele koondkorpust. Töös tuleb hinnata ChatGPT sobilikkust seda tüüpi märgenduülesande lahendamiseks ning optimeerida mudelile antud instruktsioone (prompt engineering).
Üks alameesmärkidest on uurida, kas ChatGPT saab samamoodi hakkama sagedaste ja haruldaste anafoorikandidaatide käsitlemisega. Lisaks oleks hea uurida, kuidas on ChatGPT-d mõistlik rakendada kontekstis, kus me saame kasutada süntaksipuu kujust lähtuvat informatsiooni -- näiteks katta reeglitega ära lihtsamad
konstruktsioonid ning kas anafoorituvastuse saab taandada veel lihtsamateks alamülesanneteks. Näiteks, kas elusate nimisõnade teadmine aitab leida asesõnale ta vastavat nimisõna.
automaatse süntaksianalüüsiga rikastatud Eestikeele koondkorpust. Töös tuleb hinnata ChatGPT sobilikkust seda tüüpi märgenduülesande lahendamiseks ning optimeerida mudelile antud instruktsioone (prompt engineering).
Üks alameesmärkidest on uurida, kas ChatGPT saab samamoodi hakkama sagedaste ja haruldaste anafoorikandidaatide käsitlemisega. Lisaks oleks hea uurida, kuidas on ChatGPT-d mõistlik rakendada kontekstis, kus me saame kasutada süntaksipuu kujust lähtuvat informatsiooni -- näiteks katta reeglitega ära lihtsamad
konstruktsioonid ning kas anafoorituvastuse saab taandada veel lihtsamateks alamülesanneteks. Näiteks, kas elusate nimisõnade teadmine aitab leida asesõnale ta vastavat nimisõna.
Lõputöö kaitsmise aasta
2023-2024
Juhendaja
Sven Laur
Suhtlemiskeel(ed)
eesti keel
Nõuded kandideerijale
Tase
Magister
Märksõnad
Kandideerimise kontakt
Nimi
Sven Laur
Tel
E-mail