Mielőtt az emberiséget uralmába kerítené, talán előbb érdemes lenne a mesterséges intelligenciának elsajátítania az idő leolvasásának tudományát.


A mesterséges intelligencia tudása gyakran messze túlszárnyalja az egyéni képességeket, mégis előfordul, hogy olyan feladatokban akad el, amelyekkel a nagyobb gyerekek könnyedén megbirkóznak. Skót kutatók felfedték, hogy a legújabb MI-modellek nem mindig tudják pontosan értelmezni az analóg órák mutatóinak pozícióját, és gyakran téves válaszokat adnak a naptárak dátumaival kapcsolatos kérdésekre.

A fejlett mesterséges intelligencia modellek képesek esszék írására, programozásra és akár kvantumfizikai problémák megoldására is, mindezt szédítő sebességgel. Ennek ellenére akadnak olyan feladatok, amelyek látszólag egyszerűek, mégis megküzdenek velük. Ilyenek például az analóg órák számlapjának leolvasása vagy a naptárak helyes értelmezése. Ezt a meglepő jelenséget egy skót kutatás tette nyilvánvalóvá, rámutatva arra, hogy a gépek számára az emberi mindennapok apró, de bonyolult részletei gyakran kihívást jelentenek.

Az Edinburghi Egyetem kutatói a leginnovatívabb multimodális nyelvi modellek teljesítményét vizsgálták, beleértve a Google DeepMind Gemini 2.0-t, az Anthropic Claude 3.5 Sonnet-t, a Meta Llama 3.2-11B-Vision-Instructot, az Alibaba Qwen2-VL7B-Instructot, a ModelBest MiniCPM-V-2.6-ot, valamint a GPT-4o és GPT-o1 modelleket. A kutatás során különböző típusú órák képeit használták: voltak közöttük arab és római számokkal, valamint másodpercmutatóval vagy anélkül készült órák, amelyek különféle színű számlapokkal rendelkeztek. A kutatók meglepődtek, amikor kiderült, hogy a modellek csupán az idő leolvasások 25%-át tudták helyesen értelmezni. Különösen nehézséget okoztak számukra a római számokkal és stilizált mutatókkal felszerelt órák. A másodpercmutató eltávolítása sem javított a helyzeten, így a kutatók arra a következtetésre jutottak, hogy a problémák az órák mutatóinak és az óralap szögeinek észleléséből erednek.

Ezután elérkeztünk a naptár-kísérlethez. A kutatók tíz éven át gyűjtött naptári adatok segítségével olyan izgalmas kérdéseket tettek fel, mint például, hogy melyik napra esik az újév, vagy hogy pontosan melyik a 153. napja az évnek. Még a legfejlettebb mesterséges intelligencia modellek is meglepően gyakran hibáztak, az esetek 20%-ában.

A sikerességi arány a különböző mesterséges intelligencia rendszerek teljesítményétől függően eltérő eredményeket mutatott. A Gemini-2.0 kiemelkedett az órateszt során, hiszen ő érte el a legjobb eredményt, míg a GPT-01 a naptárral kapcsolatos kérdések megválaszolásában 80%-os pontossággal teljesített.

Az analóg órák és naptárak megértéséhez szükséges térbeli tudatosság, a kontextus és az alapvető matematikai ismeretek összhangja továbbra is kihívást jelent a mesterséges intelligencia számára. Eredményeink azt mutatják, hogy a MI jelenlegi állapotában nem képes az emberek számára alapvető készségeket elsajátítani. Ezen hiányosságok kiküszöbölése elengedhetetlen ahhoz, hogy a mesterséges intelligenciát sikeresen integrálhassuk az időérzékeny, valós alkalmazásokba, mint például az ütemezés, az automatizálás és a kisegítő technológiák. Rohit Saxena, az Edinburghi Egyetem Informatikai Karának munkatársa, a közelmúltban elkészült, jóváhagyásra váró tanulmány vezető szerzője hangsúlyozza ezt a problémát. Aryo Gema, a kutatócsoport másik tagja pedig hozzáteszi, hogy a jelenlegi mesterséges intelligencia-kutatás gyakran az összetett érvelési feladatokra fókuszál, miközben ironikus módon sok MI-rendszer még mindig nehezen boldogul a mindennapi, egyszerűbb feladatokkal.

Related posts