MestersĂŠges intelligencia tĂśkĂŠletes magyarsĂĄggal?

2024. januĂĄr 31.

Az elmúlt évek a mesterséges intelligencia térhódításáról szóltak, hazánkban is mind a vállalatok, mind a lakosság egyre szélesebb körben használja az MI-t. Jelenleg azonban az alkalmazások többsége nem képes magyar nyelvĹą utasításokat megérteni vagy információkat elemezni, és amelyik igen, ott sok a pontatlanság.

Miért szükséges, hogy hibátlanul fussanak magyarul az alkalmazások?

A magyar köztudottan az egyik legnehezebb nyelv a világon, amit csak a tízmillió magyar beszél, így világnyelvnek sem tekinthetĹ. Ráadásul más nemzetekkel összehasonlítva a magyar társadalom töredéke beszél idegen nyelveket. A fiatalok nyelvtanulási kedve erĹsebb és a mesterséges intelligenciával felszerelt fordítóprogramok is sokat javítottak ezen a hátrányos helyzeten, de kiugró fejlĹdés az angol vagy más nyelvek terén nem történt.

Minden profitorientált céges fejlesztésnél szempont a megtérülés, jelen esetben, hogy az adott nyelvet mennyi felhasználó beszéli. Továbbá az új szoftverek, a megnövekedett számítási teljesítmény mellett az is meghatározza, hogy a mesterséges intelligencia milyen ütemben fejlĹdik, hogy az adott nyelven mekkora adatmennyiség áll rendelkezésre. A most elérhetĹ, az életünkbe viharos gyorsasággal beépülĹ mesterséges intelligencia alapú alkalmazások ezért futnak a nagy világnyelveken tökéletesen, míg a magyar kérdésekre, nagyon sok hibás válasz érkezik.

Anyanyelvünk használata nincs a nemzetközi technológiai cégek fejlesztéseinek fókuszában, így kiemelten fontos, hogy megĹrizzük a magyar nyelv gazdagságát és a lehetĹ legnagyobb magyar nyelvĹą szöveges adatbázis felhasználásával elkészítsük a magyar nyelvi modellt, mely beépülhet a mesterséges intelligencia alapú alkalmazásokba. Minél több lesz a hiteles magyar nyelvĹą szövegrész, annál pontosabbak és választékosabbak az MI válaszai.

De mi is az a nagy nyelvi modell? A nagy nyelvi modell (angolul large language modell, vagy rövidítve LLM) olyan mesterséges intelligencia alapú algoritmus, amit hatalmas mennyiségĹą szöveges adaton, ún. korpuszon tanítottak be, és képes megérteni, feldolgozni az emberi beszélt és írott nyelv sajátosságait.

Hazánkban két nagy projekt zajlik, mely a magyar nyelvi modell kifejlesztésén és tökéletesítésén dolgozik.

• A Nyelvtudományi Intézet munkatársai kifejlesztették a magyar ChatGPT-t, egy mesterséges intelligencia-alapú szövegszerkesztĹ és nyelvelemzĹ szoftvert, mely jelenleg csevegésre még nem képes, viszont meg tudja találni a szövegekben lévĹ összefüggéseket, alkalmas médiatartalom elemzésre. A Puli-GPT nevet viselĹ alkalmazás kidolgozásakor 41 milliárd szóból álló magyar (és 62 mrd szóból álló angol) szövegállományt tápláltak be a kutatók, összehasonlításul az OpenAI Chat GPT 120-130 millió magyar (és 180 mrd angol) szóból tanult. A Puli a közeljövĹben bĹvül majd csevegési funkcióval, de már most képes megadott szavak alapján összefüggĹ szövegeket írni, vagy össze tudja foglalni egy cikk vagy egy könyv tartalmát.

• A magyar állam és az OTP bank közös finanszírozásában, hazai egyetemek bevonásával zajlik 2021 óta egy magyar mesterséges intelligencia nyelvi modell létrehozása. ElsĹ lépésben elkészült az alap nyelvi modell, mely 1,5 milliárd paramétert használt, most zajlik a 30 milliárd paraméterre bĹvítés. A projekt célja, hogy olyan nyelvi modellt hozzanak létre, ami segíti a vállalati és a magán ügyfelek kiszolgálását, növeli a hatékonyságot, és hosszú hosszú távú versenyelĹnyt biztosít nemcsak a banknak, hanem az egész magyar gazdaságnak.

„A nyelvi modelleken alapuló alkalmazások már megjelentek mind a köznevelésben, mind a felsĹoktatásban. Ezek készségszintĹą, tudatos használata mind az egyén, mind a társadalom számára a jövĹképesség, a siker feltétele. Jól mĹąködĹ magyar nyelvi modell, nemcsak szuverenitási, hanem jóléti kérdés is, mivel növeli az MI magyar haszonélvezĹinek a körét. Gábor Dénes Egyetemen ezért, nemcsak az oktatásunkban, hanem a kutatásainkban is kiemelt terület a nyelvi modell használata” – mondta Dr. Dietz Ferenc, a Mesterséges Intelligencia Koalíció oktatási és tudatosítási munkacsoportjának a vezetĹje, a Gábor Dénes Egyetem elnöke.

Business Online

MestersĂŠges intelligencia tĂśkĂŠletes magyarsĂĄggal?

2024. januĂĄr 31.

KapcsolĂłdĂł cikkek

BelĂŠpĂŠs

Business Online

MestersĂŠges intelligencia tĂśkĂŠletes magyarsĂĄggal?

level('hirek', 'prim.hu', 'forrĂĄs: PrĂ­m Online');

2024. januĂĄr 31.

KapcsolĂłdĂł cikkek

BelĂŠpĂŠs