Prihrani čas, povečaj svojo produktivnost

Vroče teme in uporabni namigi direktno v inbox.

SloGPT: ChatGPT-ju podoben slovenski jezikovni model

  • Feb 19, 2024

SloGPT: ChatGPT-ju podoben slovenski jezikovni model, ki na vprašanja odgovarja v slovenščini

  • 0 comments

Novembra 2022 je bila javnosti predstavljena tehnologija umetne inteligence z imenom ChatGPT, sposobna odgovarjati na obsežen spekter vprašanj. ChatGPT v slovenščini dela številne napake, kar je spodbudilo slovenske raziskovalce k razvoju lastnega jezikovnega modela, ki bi deloval v slovenščini.

Novembra 2022 je bila javnosti predstavljena tehnologija umetne inteligence z imenom ChatGPT, sposobna odgovarjati na obsežen spekter vprašanj. ChatGPT v slovenščini dela številne napake, kar je spodbudilo slovenske raziskovalce k razvoju lastnega jezikovnega modela, ki bi deloval v slovenščini.

Trenutno je zbranih 10 milijard besed, cilj pa je doseči vsaj 40 milijard

Za uspešno implementacijo slovenskega modela je potrebno zajeti obsežno količino slovenskih besedil. "Učimo model, da proizvaja odgovore, ki so na nek način primerljivi s tistimi, ki jih generira ChatGPT," je povedal Simon Krek, vodja Centra za jezikovne vire in tehnologije (CJVT), v intervjuju za Televizijo Slovenija.

Do sedaj so zbrali približno 10 milijard besed, vendar je za njihov cilj potrebno štirikrat toliko. V procesu zbiranja gradiva načrtujejo sodelovanje z Narodno in univerzitetno knjižnico, RTV Slovenija in drugimi ustanovami. Krek je poudaril, da je pomembno zagotoviti nadzor nad vsebino besedil, tudi z etičnega vidika, kar prispeva k jezikovni suverenosti.

Zaključek projekta je predviden v manj kot treh letih

Projekt se financira v okviru Načrta za okrevanje in odpornost, ki je del nacionalnega programa reform in investicij. Razvoj slovenskega jezikovnega modela nadaljuje delo na že obstoječih orodjih, kot so orodje za preverjanje pravilnosti postavitve vejic, strojni prevajalnik in program za prepoznavanje govora. Prav tako razvijajo sistem za simultano prevajanje, ki omogoča prevod iz angleščine v slovenščino v realnem času, je poročala Darja Zupan za TV Slovenija.

CJVT, ki spada pod Univerzo v Ljubljani, se osredotoča na znanstvene raziskave, razvoj in vzdrževanje ključnih digitalnih jezikovnih virov in orodij za sodobni slovenski jezik, dostopnih na spletu. Deluje v okviru Mreže raziskovalnih infrastrukturnih centrov in je povezan s petimi fakultetami Univerze v Ljubljani.

0 comments

Sign upor login to leave a comment