Unii oameni se tem că inteligența artificială (AI) va prelua toate locurile de muncă în viitor, privându-ne de câștigurile noastre. Totuși, este puțin probabil ca acest lucru să se întâmple în viitorul apropiat, după cum confirmă rezultatele unui experiment îndrăzneț, scrie Futurism.
Oamenii de știință de la Universitatea Carnegie Mellon au creat o companie pilot, numită TheAgentCompany, care se se ocupe cu dezvoltarea de software. Toți angajații săi sunt modele de inteligență artificială concepute pentru a îndeplini sarcini independent. Rezultatele acestui experiment s-au dovedit a fi destul amuzante, dar nu și eficiente.
TheAgentCompany a fost dotată cu lucrători în inteligență artificială de la Google, OpenAI, Anthropic și Meta. Aceștia au jucat roluri de analiști financiari, ingineri software și manageri de proiect, lucrând alături de colegi simulați, cum ar fi un departament de resurse umane fals și un CTO (controlul calității).
Doar 24% din sarcini, finalizate… în cel mai bun caz. Au și trișat
Publicația a precizat că modelul Claude 3.5 Sonnet de la Anthropic a avut cele mai bune performanțe. Cu toate acestea, a reușit să îndeplinească doar 24% din sarcinile care i-au fost atribuite. Pentru a finaliza o sarcină, modelul a trebuit să parcurgă aproximativ 30 de pași.
Modelul Gemini 2.0 Flash de la Google a parcurs în medie 40 de pași per sarcină finalizată. Dar, doar 11,4% dintre acestea au fost finalizate cu succes.
„De exemplu, în timp ce executa o sarcină, agentul de inteligență artificială nu a putut găsi persoana potrivită pentru a pune o întrebare pentru a finaliza sarcina. Drept urmare, a decis să creeze o scurtătură prin redenumirea unui alt utilizator cu numele persoanei de care avea nevoie”, au spus oamenii de știință.
Rețeaua neuronală a Google inventează proverbe inexistente
Anterior, pe rețeaua de socializare X (fosta Twitter), unul dintre utilizatori a descoperit o eroare amuzantă în Google. Este suficient să introduceți în căutare un set aleatoriu de cuvinte cu cuvântul „semnificație” adăugat, iar sistemul AI Overviews bazat pe rețeaua neuronală Gemini va produce explicații și povești complet fictive despre acesta.
Autorul descoperirii a oferit un exemplu: o întrebare despre o „umbrelă de măgar” a dus la explicația că era argou irlandez, și s-ar fi tradus prin „refuz categoric”.