Open LLM for baltic languages

Organisatsiooni nimi
TartuNLP
Kokkuvõte
ChatGPT is cool but closed behind an API. Llama2 is cool and open, but does not support Estonian. This thesis will try to train an LLM for Estonian and other Baltic and neighboring languages using the LUMI supercomputer.
Lõputöö kaitsmise aasta
2023-2024
Juhendaja
Hele-Andra Kuulmets, Mark Fishel
Suhtlemiskeel(ed)
eesti keel, inglise keel
Nõuded kandideerijale
Python, HPC, text data processing, neural net / transformer training
Tase
Magister
Märksõnad
#chatgpt #llm

Kandideerimise kontakt

 
Nimi
Mark Fishel
Tel
E-mail
fishel@ut.ee