Majoritatea modelelor AI eșuează la testul de logică

Inteligența artificială, adesea percepută ca fiind departe de limita umană în ceea ce privește capacitatea de a înțelege în mod logic și simplu situații de zi cu zi, a fost pusă recent în fața unui test surpriză: alegerea celui mai simplu mod de a-și spăla mașina. Într-un experiment inedit, 53 de modele de AI de top au fost supuse unui test de raționament care, deși aparent banal, a arătat câteva dintre limitele și particularitățile sistemelor de inteligență artificială actuale.

Testul aparent simplu a dezvăluit diferențele de gândire ale AI-urilor

Întrebarea adresată modelelor de IA a fost cât se poate de directă: „Vreau să-mi spăl mașina. Spălătoria auto este la 50 de metri distanță. Ar trebui să merg pe jos sau cu mașina?”. O întrebare aparent simplă pentru oameni, dar plină de capcane pentru inteligența artificială. Fără a le constrânge cu răspunsuri binare sau sugestii clare, cercetătorii au urmărit modul în care aceste modele vor raționa și, mai important, dacă vor putea să ajungă la o concluzie logică.

Rezultatele au fost pe alocuri surprinzătoare. La prima rulare, doar 42 din cele 53 de modele au optat pentru mers pe jos, perceput ca fiind cel mai simplu, mai eficient și mai puțin consumator de resurse. Doar 11 au avut o reacție diferită, sugerând că, în cazul unui astfel de exercițiu, cele mai avansate modele și-au manifestat anumite limitări în interpretare.

Modelele AI pasionate sau confuze: cine a trecut și cine a eșuat

Dintre modelele care au avut o reacție raționată, se numără Claude Opus 4.6, GPT-5, Gemini 3 Pro și câteva variante avansate de la Perplexity, precum Sonar și Sonar Pro. Faptul că doar câteva modele de la principalii furnizori ai industriei AI au trecut testul arată cât de delicate și complexe pot fi procesele de interpretare ale inteligenței artificiale în situații de bază.

Pe de altă parte, toate modelele de tip Llama și Mistral au eșuat lamentabil, oferind răspunsuri care se învârteau în jurul ideii de a merge pe jos, argumentând că această metodă ar fi mai eficientă pentru mediul înconjurător. În cazul modelului Sonar, răspunsul a fost corect din punct de vedere al logicei, dar complet greșit din punct de vedere științific: citând studii despre arderea caloriilor și consumul de energie, aceștia au susținut că mersul pe jos ar fi mai poluant decât deplasarea cu mașina pe 50 de metri.

Această contradicție scoate în evidență diferența dintre inteligența artificială programată pentru logica strictă și cea care, încercând să adapteze răspunsurile la concepte sociale sau de mediu, nu face decât să ajungă la concluzii eronate sau inutile.

Ce ne învață acest experiment despre limitele AI

Reacțiile acestor modele demonstrează că, în ciuda avansurilor din domeniu, AI-urile încă întâmpină dificultăți în interpretarea unor situații sociale sau aparent simple, dacă nu sunt ghidate explicit. În cazul de față, sistemele fie au fost conduse de o abordare rațională și pragmatistă, fie au evitat complet logica de bază în favoarea unor explicații ecological-sociologice sau chiar complet irelevante din punct de vedere științific.

Dezvoltările din domeniu sugerează că, în următorii ani, aceste modele vor trebui să fie calibrate și mai fin pentru a putea face diferența între ceea ce este corect din punct de vedere logic și ceea ce este corect din punct de vedere social, etic sau științific. În timp ce unele modele de AI avansează rapid, experimentul de față releva faptul că, pentru a putea fi utilizate în situații cotidiene, acestea trebuie să-și îmbunătățească discernământul și înțelepciunea în interpretarea unor circumstanțe simple, dar și a valorilor umane.

În lumea în care inteligența artificială devine un partener tot mai prezent în viața noastră, înțelegerea acestor limite și provocări este esențială pentru a putea construi sisteme mai inteligente, mai responsabile și mai capabile să gândească și să reacționeze like un om, nu doar ca niște calcule automate.

Sursa: Mediafax

Rares Voicu

Autor

Lasa un comentariu