A GPT-4o („o” jelentése „omni”) egy lépés a sokkal természetesebb ember-számítógép interakció felé – bemenetként elfogadja a szöveg, hang és kép bármilyen kombinációját, és bármilyen szöveg-, hang- és képkimenetet generál. Akár 232 ezredmásodperc alatt képes reagálni az audio bemenetekre, átlagosan 320 ezredmásodperc alatt, ami hasonló az emberi válaszidőhöz egy beszélgetésben.
Köszönöm, hogy elolvastad a cikket, remélem hasznos volt számodra!
Barna László
esküvőmarketing specialista
