Pētniecība valodu tehnoloģiju (VT) jomā
Darbības ietvaros tiks īstenota pētniecība valodu tehnoloģiju jomā, paredzot attīstību visos piecos prioritāro pielietojamo zināšanu un prasmju virzienos tautsaimniecības atveseļošanai un transformācijai:
-
nacionālie valodas resursi un to izmantošanas un analīzes platformas;
-
valodas modeļi un rīkkopas teksta automātiskai analīzei un sintēzei;
-
valodas tehnoloģijas audiovizuālo materiālu apstrādei;
-
tehnoloģijas, rīki un infrastruktūras valodas tehnoloģiju prasmju apguvei un iekļaujošas izglītības sekmēšanai;
-
tulkošanas procesa automatizācijas platforma tulkošanas tehnoloģiju izstrādes un izmantošanai apmācībai.
Nacionālie valodas resursi un to izmantošanas un analīzes platformas
Pētījuma mērķis ir nodrošināt VT izstrādes un izmantošanas prasmju apguvei nepieciešamos valodas resursus (datu kopas) ņemot vērā Latvijas specifiku, kā arī programmatūras platformas valodas kvantitatīvai un kvalitatīvai analīzei šajos resursos.
Pētījums tiks īstenots trīs galvenajos virzienos, izstrādājot, attīstot un paplašinot:
-
Reprezentatīvus latviešu valodas teksta un runas korpusus;
-
Plaša pārklājuma latviešu valodas mašīnlasāmos un skaitļojamos leksiskos resursus;
-
Brīvas pieejas platformas (programmrīku un darbplūsmu kopumus) valodas datu izmantošanai un analīzei.
Valodas modeļi un rīkkopas teksta automātiskai analīzei un sintēzei
Pētījuma mērķis ir izstrādāt un attīstīt plaša lietojuma skaitļojamus latviešu valodas modeļus, gramatikas un leksikonus (daudzvalodu kontekstā), kā arī universāli kombinējamas programmatūras bāzes.
Pētījumā plānoti trīs galvenie virzieni:
-
Izmantojot dziļās mašīnmācīšanās metodes, attīstīt teksta analīzei un sintēzei pielāgotus valodas modeļus un VT programmatūras komponentes.
-
Tehnoloģiskā nodrošinājuma pilnveide un paplašināšana.
-
Mērogojamas programmatūras platformas attīstīšana.
Valodas tehnoloģijas audiovizuālo materiālu apstrādei
Pētījuma mērķis ir izstrādāt inovatīvas valodu tehnoloģijas monolingvālu un multilingvālu audiovizuālo datu apstrādei, kas sekmētu VT prasmju apguvi un tādējādi arī plašāku VT lietojumu dažādu produktu un pakalpojumu attīstībā.
Pētījumā plānoti divi galvenie virzieni:
-
Latviešu valodas runas atpazīšanas un runas sintēzes modeļu izstrāde.
-
Svešvalodu audiovizuālo materiālu tulkošanas un lokalizēšanas rīki un to izveides metodes tehnoloģijas mācību materiālu lokalizēšanai, dažādu lokalizācijas stratēģiju novērtēšana ar empīriskām metodēm.
Tehnoloģijas, rīki un infrastruktūras valodas tehnoloģiju prasmju apguvei un iekļaujošas izglītības sekmēšanai
Pētījuma mērķis ir radīt un uzkrāt valodas resursus un rīkus, kas nodrošinātu atbalstu sekmīgai valodas tehnoloģiju apguvei, izmantojot mūsdienīgus satura un prasmju apguves rīkus, sekmējot iekļaujošu izglītību un nodrošinot izglītībai un pētniecībai nepieciešamo valodas resursu un rīku infrastruktūru.
Pētījumā plānoti trīs galvenie virzieni:
-
Virtuālo asistentu izveides principi un tehnoloģijas.
-
Valodu tehnoloģijas studējošajiem ar īpašām vajadzībām.
-
Pētniecības aktivitātēs un studiju procesā radīto valodas resursu un rīku integrācija Eiropas pētniecības infrastruktūrā, sekmējot valodu tehnoloģiju apguvi un nodrošinot projekta rezultātu ilgtspēju.
Tulkošanas procesa automatizācijas platforma tulkošanas tehnoloģiju izstrādes un izmantošanas apmācībai
Pētījuma mērķis ir izveidot tehnoloģiskos līdzekļus, kas ļauj studējošajiem izveidot mašīntulkošanas sistēmas un kalpo par apmācības vidi tulkošanas tehnoloģiju izmantošanai.
Pētījumi plānoti trīs galvenajos virzienos:
-
Rīki un tehnoloģijas neironu mašīntulkošanas sistēmu izveidei.
-
Datorizētas tulkošanas rīki, mašīntulkošanas un terminoloģijas atbalsts datorizētā mašīntulkošanā.
-
Vienotas tulkošanas atmiņas sistēma, kas nodrošina tulkojamo datu uzkrāšanu, koplietošanu un tālākizmantošanu.