FelelĹssĂŠgteljes mestersĂŠges intelligencia fejlesztĂŠs â jĂł Ăşton jĂĄrunk?

2023. ĂĄprilis 24.

Az utóbbi idĹszakban különösen nagy figyelmet kapott a különféle mesterséges intelligencia modellek nagyközönség számára való elindítása. A generatív mesterséges intelligencia használatával kapcsolatos potenciális kockázatok megnövekedtek, különösen a szerzĹi jogi kérdések területén, de az ilyen eszközöket alkalmazó vállalatoknak olyan kockázatokra is komoly figyelmet kell fordítaniuk, mint a rendszer-kimenetek helyessége és megmagyarázhatósága, vagy a negatív elĹítéletek kiszĹąrése.

A ChatGPT (társalgási nyelvi-rendszer) és a DALL-E (szöveget képpé alakító alkalmazás) elindításával a generatív mesterséges intelligencia (MI) különösen nagy figyelmet kap, és egyre népszerĹąbb. A generatív MI gépi tanulást használ új tartalmak, pl. szövegek, képek, programkódok, költemények vagy grafikák, elĹállításához. A legtöbb munkavállaló attól tart, hogy a DALL-E átalakíthatja a hirdetések, a filmkészítés, valamint a játékok világát, a ChatGPT pedig munkahelyeket válthat ki tartalom- és szöveggyártás, oktatás, szoftverfejlesztés és újságírás bizonyos területein.

Dr. Barta GergĹ

„Ezek az aggodalmak nem alaptalanok, de nem is ennyire fekete-fehér a történet: a munkahelyek biztosan átalakulóban vannak, azonban továbbra is versenyben marad az, aki megtanulja az MI eszközöket jól és az elĹnyére használni, együtt élni velük, jól alkalmazni azokat munkájában, saját területén – aki az új eszközökkel együtt tud dolgozni, nem nélkülözhetetlen, hanem keresett szakember lesz.” – mondta Dr. Barta GergĹ, a Deloitte VezetĹ MI szakértĹje.

Vannak vállalatok, melyek a szerzĹi jogok megsértésével kapcsolatos aggályok és felelĹsségek miatt nem engedélyezik az MI által létrehozott tartalmak felhasználását. Számos, stock-fotót gyĹąjtĹ platform pedig a mĹąvészek és fotósok kérésére MI által létrehozott képek használatát tiltotta be. A ChatGPT alkalmazásának terjedésével megnĹtt az oktatásban a plágium kockázata, ezért bizonyos városok állami iskoláiban tilos a nyelvi modell használata.

Bizonytalanság az MI-ben: mennyire lehetünk benne biztosak, hogy helyes a kimenet?

Mit nevezünk kimenetnek? Amikor egy feltett kérdésre választ adunk, gyakran kezdjük mondatunkat azzal, hogy „Nem vagyok biztos benne, de…”, vagy „Ez csak egy sejtés, de…” – attól függĹen, hogy mennyire vagyunk biztosak válaszunk helyességében. Ezzel szemben a ChatGPT gyakran szabadkozás nélkül kimenetet produkál. A ChatGPT korlátait sorolva az Open AI így fogalmaz: „A ChatGPT néha hihetĹen hangzó, ugyanakkor helytelen válaszokat ad.” Egy kódolással foglalkozó Q&A platform éppen ezért tiltotta be a ChatGPT használatát: „A ChatGPT által generált válaszok közzététele kifejezetten káros az oldalra nézve… mivel ezen válaszok jónak tĹąnhetnek, mégis nagy arányban tévesek”. Több olyan esetrĹl is tudunk, amikor a ChatGPT nevetséges hibát vétett a matematika és a logika területein, elĹfordult, hogy az algebrai jelöléseket használta rosszul, illetve olyan területeken, amilyen pl. a sakk is, ahol a számítógépek köztudottan képesek felülmúlni az emberi teljesítményt, a ChatGPT irracionális lépéseket hajtott végre, tökéletes pókerarccal.

A chatbot hamis önbizalmán keresztül megnĹ a téves információ terjesztésének, a félretájékoztatásnak a kockázata. A ChatGPT információs oldala kifejti, hogy ez kihívást jelent, mivel „jelenleg a biztonságos információforrás nem áll rendelkezésre” és „ha a modellt nagyobb óvatosságra tanítják, elutasíthatja azoknak a kérdések megválaszolását, amelyekre egyébként helyesen tudna válaszolni”.

„Ugyan tesztelési célokból érdemes lehet inkább helytelenül megválaszolni egy kérdést, mint a választ megtagadni, valós helyzetben történĹ alkalmazás esetén a rossz válasz nagyobb károkkal és költségekkel járhat, mint a semmilyen válasz. Az elĹvigyázatosság szükséges mértéke téma- és feladatkörönként eltérĹ lehet. Annak érdekében, hogy a felhasználók megbízhassanak a generált szöveg tartalmában, a létrehozott szöveg nem lehet egyformán magabiztos minden témában. Az olyan nagy nyelvi modelleknek – Large Language Models, LLM – , amilyen a ChatGPT is, jelenlegi formájukban fontolóra kellene venniük, hogy tisztázó kérdéseket tegyenek fel, ismerjék fel a tudásbázisuk korlátait, kis mértékĹą bizonyossággal adják meg a válaszokat és adott esetben egy egyszerĹą „nem tudom a választ” szöveggel térjenek vissza.” – mondta Barta GergĹ.

pexels.com

Megmagyarázhatóság: honnan származik a generált információ?

A fĹ kihívás a ChatGPT kimenetelének azonosításában az, hogy nem rendelkezik egy egyértelmĹą információforrással. Ellentétben más MI alapú személyi asszisztensekkel, amilyen a Siri vagy az Alexa, melyek internetes keresĹmotorok segítségével keresik a választ, a ChatGPT-t úgy tanították, hogy a mondatokat a következĹ, statisztikailag valószínĹą nyelvi egységre vonatkozó találgatások sorozatával alkossa meg. Emiatt nevezik az LLM-eket néha „sztochasztikus papagájoknak” is.

A tudományos kutatások során minden információ megbízhatóságát annak forrása alapján határozzák meg. Egyes nyelvi modellek, több különbözĹ forrást szintetizálnak annak érdekében, hogy megadjanak egyetlen választ. Ezek a rendszerek különbözĹ megbízhatósági szinteket rendelhetnek a különbözĹ forrásokhoz azok reputációja alapján. Például, ha az információ megkérdĹjelezhetĹ forrásból származik módosíthatják válaszukat oly módon, hogy a felmerült kételyt kifejezzék, vagy több lehetséges választ is bemutathatnak, ha a különbözĹ források nem értenek egyet egy bizonyos témában. Érdemes lehet megfontolni ezeknek a típusú modelleknek a használatát egy-egy speciálisabb téma során.

PuskĂĄs Attila

„A megmagyarázhatóság kritériuma nélkülözhetetlen lesz, hiszen abban az esetben, ha az eredmény megkérdĹjelezhetĹ, az lehetĹvé teszi az információ befogadója számára, hogy felmérje a kontextust, és betekintést nyerjen a további feltételezésekbe, vagy az alkalmazott logikába.” – mondta Puskás Attila, a Deloitte Kockázatkezelési Tanácsadás VezetĹ Tanácsadója.

Ennek hiánya többek között a képgenerátorokat is érinti. A szintetikus, szöveget képpé alakító programok az interneten elérhetĹ képekbĹl tanulnak. Egy vizuális médiával foglalkozó cég beperelte az egyik MI eszköz létrehozóit, amiért megfelelĹ engedély nélkül használták fel képeiket. MĹąvészek egy csoportja korábban a szerzĹi jogok megsértéseként értékelt, ezért bojkottált egy MI által generált képeket tartalmazó alkalmazást, mivel az MI egy valós mĹąvész stílusát utánzó képeket generált. Bár a jogi kihívások összetettek, az MI által generált mĹąalkotások inspirációforrásának azonosítása – tehát annak a forrásnak, ahonnan az MI nagyrészben másolta a meglévĹ mĹąalkotást, lehetĹvé teszi a pénzügyi kompenzációt és elszámolást.

ElĹítélet: mi történik, ha „rossz” forrásból tanul a rendszer?

Ha a modellt nagy volumenĹą, szöveget és képeket tartalmazó adathalmazon tanítják, akkor a modell természetesen megismétli a forrásban található torzításokat. Ez gyakorlatban azt jelenti, ha a felhasznált tanító adathalmaz pl. egy arcfelismerĹ rendszer esetében felül-reprezentált egy adott etnikai csoport tekintetében, akkor megvan a kockázata annak, hogy más csoportokat nem fog sikeresen felismerni, tehát elfogult lesz a tanító adatban szignifikánsan megjelenĹ mintákkal szemben – ez pedig igazságtalan kimenetet eredményezhet.

Bár a ChatGPT tartalommoderálási korlátokat alkalmaz a szexuális, gyĹąlöletkeltĹ, erĹszakos vagy káros tartalmak generálásának megelĹzése érdekében, ezeket a beépített szĹąrĹket könnyĹą megkerülni az utasítások átfogalmazásával. A Galactica, a ChatGPT elĹdje pl. 3 nap után állt le, mert hamis és rasszista tartalmakat generált. Sok munkát kell még elvégezni ahhoz, hogy a tanításra használt adatokban a torzításokat azonosítani és csökkenteni lehessen – nemcsak a generatív MI esetében, hanem az MI összességében. Egyes tudósok a tanításhoz használt adatok gondos összegyĹąjtése mellett érveltek a hatalmas mennyiségĹą és könnyen elérhetĹ internetes források használata helyett.

Összességében a generatív MI népszerĹąségének növekedése következtében jelentkezĹ potenciális kockázatokat és etikai megfontolásokat teljes mértékben figyelembe kell vennie az ilyen modellt implementálni kívánó vállalkozásnak. Ezeknek a technológiáknak új, izgalmas alkalmazási lehetĹségei vannak, fontos azonban ezeket a lépéseket összhangba hozni és arányosan mérlegelni a felmerült kockázatokkal, elszámoltathatósággal és az esetleges visszaélésekkel, mert így lehet korlátozni az elĹre nem látható negatív hatásokat.

„Átgondolt kockázatkezelésre és irányításra van szükség ahhoz, hogy biztonságosan és magabiztosan lehessen használni a generatív MI innovációit. A generatív MI kockázatait az olyan klasszikus vállalati kockázati tényezĹkkel, amilyen a mĹąködési, adatvédelmi, jogi, vagy technológiai kockázat is, együtt kell azonosítani és értékelni, annak biztosítása érdekében, hogy a maradványkockázatok ne jelentsenek fenyegetést se a vállalati mĹąködésre, se a társadalomra vagy a környezetre.” – mondta Barta GergĹ.

Business Online

FelelĹssĂŠgteljes mestersĂŠges intelligencia fejlesztĂŠs â jĂł Ăşton jĂĄrunk?

2023. ĂĄprilis 24.

KapcsolĂłdĂł cikkek

BelĂŠpĂŠs

Business Online

FelelĹssĂŠgteljes mestersĂŠges intelligencia fejlesztĂŠs â jĂł Ăşton jĂĄrunk?

level('hirek', 'prim.hu', 'forrĂĄs: PrĂ­m Online');

2023. ĂĄprilis 24.

KapcsolĂłdĂł cikkek

BelĂŠpĂŠs

FelelĹssĂŠgteljes mestersĂŠges intelligencia fejlesztĂŠs â jĂł Ăşton jĂĄrunk?