Oamenii de știință au creat o companie cu angajați dotați doar cu inteligență artificială: rezultatul a fost amuzant

Publicat: 01 mai 2025, 19:42, de Nitulescu Gabriel, în ECONOMIE

Angajații AI nu au reușit cel mai adesea să își îndeplinească sarcinile de serviciu.

Unii oameni se tem că inteligența artificială (AI) va prelua toate locurile de muncă în viitor, privându-ne de câștigurile noastre. Totuși, este puțin probabil ca acest lucru să se întâmple în viitorul apropiat, după cum confirmă rezultatele unui experiment îndrăzneț, scrie Futurism.

Oamenii de știință de la Universitatea Carnegie Mellon au creat o companie pilot, numită TheAgentCompany, care se se ocupe cu dezvoltarea de software. Toți angajații săi sunt modele de inteligență artificială concepute pentru a îndeplini sarcini independent. Rezultatele acestui experiment s-au dovedit a fi destul amuzante, dar nu și eficiente.

TheAgentCompany a fost dotată cu lucrători în inteligență artificială de la Google, OpenAI, Anthropic și Meta. Aceștia au jucat roluri de analiști financiari, ingineri software și manageri de proiect, lucrând alături de colegi simulați, cum ar fi un departament de resurse umane fals și un CTO (controlul calității).

Oamenii de știință le-au stabilit „angajaților” companiei TheAgentCompany sarcini bazate pe munca zilnică a unei companii reale din domeniul tehnologiei informației. Modelele de inteligență artificială au navigat prin directoare de fișiere, au vizitat virtual noi spații de birouri și au scris recenzii ale lucrărilor inginerilor software pe baza feedback-ului colectat.

Doar 24% din sarcini, finalizate… în cel mai bun caz. Au și trișat

Publicația a precizat că modelul Claude 3.5 Sonnet de la Anthropic a avut cele mai bune performanțe. Cu toate acestea, a reușit să îndeplinească doar 24% din sarcinile care i-au fost atribuite. Pentru a finaliza o sarcină, modelul a trebuit să parcurgă aproximativ 30 de pași.

Modelul Gemini 2.0 Flash de la Google a parcurs în medie 40 de pași per sarcină finalizată. Dar, doar 11,4% dintre acestea au fost finalizate cu succes.

Cel mai slab funcționar bazat pe inteligență artificială a fost modelul Nova Pro v1 de la Amazon. El a făcut în medie 20 de pași pentru a finaliza o sarcină, dar rata de succes a fost de doar 1,7%.

Oamenii de știință au afirmat că agenții AI suferă de o lipsă de un intuitiv bun simț, de abilități sociale slabe și au o înțelegere deficitară a modului de navigare pe internet. De asemenea, rețelele neuronale și-au creat adesea propriile obstacole, încercând să construiască scurtături pentru îndeplinirea sarcinilor.

„De exemplu, în timp ce executa o sarcină, agentul de inteligență artificială nu a putut găsi persoana potrivită pentru a pune o întrebare pentru a finaliza sarcina. Drept urmare, a decis să creeze o scurtătură prin redenumirea unui alt utilizator cu numele persoanei de care avea nevoie”, au spus oamenii de știință.

Rețeaua neuronală a Google inventează proverbe inexistente

Anterior, pe rețeaua de socializare X (fosta Twitter), unul dintre utilizatori a descoperit o eroare amuzantă în Google. Este suficient să introduceți în căutare un set aleatoriu de cuvinte cu cuvântul „semnificație” adăugat, iar sistemul AI Overviews bazat pe rețeaua neuronală Gemini va produce explicații și povești complet fictive despre acesta.

Autorul descoperirii a oferit un exemplu: o întrebare despre o „umbrelă de măgar” a dus la explicația că era argou irlandez, și s-ar fi tradus prin „refuz categoric”.

Vrei să fii mereu la curent cu toate știrile? Urmărește Puterea.ro și pe canalul de WhatsApp