Trăim într-un prezent cu o digitalizare accelerată, motiv pentru care inteligența artificială (AI) devine un instrument esențial pentru dezvoltarea economică și tehnologică. Recent un pas semnificativ în această direcție a fost făcut de o echipă de cercetători români care au dezvoltat primele modele de limbaj dedicat limbii române. Aceste modele de inteligență artificială de tip „Large Language Model” (LLM) sunt acum disponibile ca resurse open source, oferind posibilitatea tuturor celor interesați de a dezvolta unelte și platforme AI în diverse domenii și industrii să le acceseze și să le utilizeze.Aceste modele lingvistice dedicate limbii române sunt rezultatul colaborării unor cercetători de la POLITEHNICA București, Universitatea din București și Institutul de Logică și Știința Datelor, având ca partener principal BRD Groupe Société Générale. Inițiatorii proiectului doresc să îi aducă împreună pe toți cei interesați de dezvoltarea AI pentru limba română.

Mulți dintre noi interacționăm deja în meseriile noastre și în viața de zi cu zi cu roboți conversaționali, precum ChatGPT (produs de OpenAI), Copilot (dezvoltat de Microsoft), Gemini (dezvoltat de Google) etc. Majoritatea acestor modele au fost antrenate predominant pe date în limba engleză. Noile modele pentru limba română promit să îmbunătățească considerabil acuratețea și relevanța interacțiunilor în limba română, fiind antrenate pe milioane de documente, asigurând o înțelegere profundă a nuanțelor și a contextului specific, a spus Alin Ștefănescu, directorul Departamentului de Informatică din cadrul Universității din București și vicepreședintele Institutului de Logică și Știința Datelor.

Astfel, companiile și instituțiile vor putea implementa soluții locale, securizate și adaptate nevoilor specifice precum:

  • Roboți conversaționali: Utilizați în companii și instituții pentru a ghida clienții în procesul de utilizare a produselor și serviciilor.
  • Căutare de informații: În baze de cunoștințe interne ale organizațiilor, pentru acces rapid și precis la ghiduri și proceduri de lucru.

Pentru ca mediul economic și/sau instituțional din România să poată folosi această nouă tehnologie atât de promițătoare, este nevoie de modele specializate care să fi întâlnit o mulțime de conversații și documente în limba română. Motivul este simplu: pentru a ne putea oferi informațiile de care avem nevoie. În BRD lucrăm în mod constant la soluții care să ne îmbunătățească procesele de lucru, folosind cele mai noi tehnologii care pot aduce valoare adăugată în primul rând clienților noștri. Însă înțelegem totodată că nevoile noastre sunt comune cu ale multor altor actori instituționali și ne-am asumat misiunea de a sprijini timpuriu inovația în domeniul inteligenței artificiale. Implicându-ne în peisajul extrem de animat al acesteia, putem ajuta ca cele mai noi tehnologii să aibă un impact pozitiv în societatea românească aproape în același ritm cu evoluțiile din domeniu la nivel internațional“, a declarat Horia Velicu, Head of Innovation Lab în cadrul BRD Groupe Société Générale.

Comunitatea OpenLLM-Ro

Pentru a sprijini dezvoltarea continuă a tehnologiei AI pentru limba română, a fost lansată și comunitatea OpenLLM-Ro. Aceasta își propune să reunească cercetători, dezvoltatori și entități interesate să contribuie la evoluția și perfecționarea acestui model, într-un mediu open source. Inițiatorii comunității speră ca astfel vor accelera crearea unor modele mai performante, implementate în companiile sau instituțiile românești, ceea ce va rezulta într-un plus de productivitate per ansamblu a întregii societăți.

Sperăm ca lansarea acestui model să fie doar începutul unui efort de lungă durată din care să rezulte LLM-uri mai bune pentru limba română. Deja am descoperit o metodă pe care am aplicat-o altor modele lansate recent (Llama-3 și Mistral) și care au performanțe în general mai bune decât cel de la care am pornit (Llama-2). Totuși, pentru a avea modele performante pentru limba română avem nevoie de 2 tipuri de resurse: colecții de date mari și curatoriate, de calitate bună, precum și resurse hardware (în special, GPU-uri pentru antrenarea modelelor). Sperăm ca atât entitățile private, cât și cele publice să înțeleagă importanța dezvoltării modelelor mari de limbaj și multimodale (text-imagini) pentru limba română. Pe toți îi așteptăm să ni se alăture în cadrul inițiativei OpenLLM-Ro și a proiectelor de cercetare care o vor sprijini“, a declarat Traian Rebedea, conferențiar la POLITEHNICA București și cercetător principal la NVIDIA, unul dintre coordonatorii tehnici ai inițiativei OpenLLM-Ro.

Raportul tehnic al proiectului poate fi găsit aici: https://arxiv.org/abs/2405.07703

Modelele LLM pot fi descărcate de pe platforma Hugging Face: https://huggingface.co/OpenLLM-Ro

Codul asociat modelului poate fi descărcat de pe GitHub: https://github.com/OpenLLM-Ro

Alte detalii despre proiect: https://ilds.ro/llm-for-romanian

Echipa Biziday nu a solicitat și nu a acceptat nicio formă de finanțare din fonduri guvernamentale. Spațiile de publicitate sunt limitate, iar reclama neinvazivă.

Dacă îți place ce facem, poți contribui tu pentru susținerea echipei Biziday.

Susține echipa Biziday