AI vagy ember? Új magyar fejlesztés hoz áttörést a szövegfelismerésben

Egyre nehezebb eldönteni, hogy egy szöveget ember vagy mesterséges intelligencia írt-e, miközben a magyar nyelvre eddig nem létezett igazán megbízható AI-detektor. Ezen változtatna Kiss Mihály, a Szegedi Tudományegyetem programtervező informatikus mesterszakos hallgatója, aki egy kifejezetten magyar nyelvre optimalizált AI-szövegfelismerőt fejlesztett.

 

A projekt 2023-ban indult szakdolgozati kutatásként, de hamar gyakorlati alkalmazássá vált. A rendszer egy encoder alapú, osztályozásra specializált modellt használ, amely nem szöveget generál, hanem százalékos valószínűséget ad arra, hogy egy adott szöveg AI által készült-e. A modell tanításához több mint 350 ezer, sokféle forrásból származó magyar nyelvű szöveget gyűjtött össze, pótolva ezzel a korábban hiányzó adatbázist.

 

Forrás: SZTE

 

A fejlesztés tesztek alapján kiemelkedően pontos: 0,98-as pontosságot ért el, miközben más, magyar nyelvet támogató detektorok jóval gyengébben teljesítettek. Különösen fontos az alacsony fals pozitív arány, ami az oktatásban elengedhetetlen. Az eszköz napi három alkalommal ingyenesen használható, akár rövid online szövegek elemzésére is.

 

Kiss Mihály szerint az AI-t nem tiltani kell, hanem megérteni és átláthatóvá tenni a használatát. Az eszköz nemcsak az oktatásban, hanem a médiában, kiadóknál, jogi és HR-területeken is hasznos lehet. A fejlesztés elnyerte az SZTE Hallgatói Innovációs Díját, az éles indulást 2026 elejére tervezik, hosszabb távon pedig további nyelvek bevonása is cél.

 

 

English Summary

Kiss Mihály, a graduate student at the University of Szeged, has developed a Hungarian-language AI text detector capable of reliably distinguishing between human-written and AI-generated content. The project began as a thesis in 2023 but quickly evolved into a practical, market-ready solution due to the growing impact of large language models. Trained on a dataset of over 350,000 diverse Hungarian texts, the system achieves outstanding accuracy while maintaining a very low false positive rate, which is especially important in education. Unlike generative models, the detector uses an encoder-based classification approach to estimate the probability that a text was created by AI. The tool can be applied not only in academic settings but also in media, publishing, legal, and HR environments.

 

 
 
 

Kapcsolódó cikkek

 

Belépés

 

 

Regisztráció