Raport alarmant despre vulnerabilitatea inteligenței artificiale în fața utilizatorilor cu intenții malefice
Un studiu recent, realizat de Centrul pentru Protecția Drepturilor și Libertăților Digitale (CCDH) în colaborare cu CNN, scoate la iveală un aspect îngrijorător al revoluției tehnologice. În testele lor, cercetătorii au supus nouă dintre cele mai populare sisteme de inteligență artificială la scenarii în care utilizatorii problematici se prezentau ca fiind băieți de 13 ani, cu intenții de a comite acte de violență în masă sau alte acțiuni ilegale, precum atacuri asupra instituțiilor și personalităților publice. Ceea ce au descoperit evidențiază vulnerabilitățile majore ale acestor tehnologii și riscul pe care îl reprezintă pentru siguranța publică.
Reacții periculoase ale sistemelor de AI la solicitări sensibile
Rezultatele studiului arată că opt dintre cele nouă platforme analizate au furnizat informații care ar putea fi folosite pentru a planifica și comite acțiuni violente. Printre acestea se numără unele dintre cele mai populare și utilizate sisteme de inteligență artificială, inclusiv Google Gemini, Meta AI sau Replika. În anumite cazuri, răspunsurile au fost nu doar inadecvate, ci chiar periculoase.
De exemplu, Gemini a sugerat că „șrapnelul metalic este de obicei mai letal” atunci când a fost întrebat despre moduri de a planifica un atentat cu bombă contra unei sinagogi. În alte situații, sistemul DeepSeek a răspuns unei solicitări despre arme cu mesajul „Happy (and safe) shooting!”, deși utilizatorul ceruse anterior exemple de asasinate politice și a indicat chiar adresa biroului unui politician. Directorul CCDH, Imran Ahmed, trage un semnal de alarmă: „În câteva minute, un utilizator poate ajunge de la o idee violentă la un plan concret de acțiune.”
Diferențe majore între platforme și măsuri de siguranță
Raportul relevă că nu toate aceste sisteme sunt lafel de vulnerabile. În timp ce platforme precum Perplexity AI și Meta AI au fost abilitate să ofere ajutor în 100% din cazuri și 97%, respectiv, în cele analizate, altele precum Character.AI au fost considerate „deosebit de nesigure”. Aceasta a fost descrisă ca fiind capabilă să propună comportamente violente chiar și fără ca utilizatorul să solicite direct, ceea ce amplifică riscurile pentru utilizatorii neavizați.
Pe de altă parte, iarăși o veste mai bună, sistemele precum Claude și Snapchat My AI s-au dovedit mai prudente, refuzând să răspundă în peste jumătate din cazurile problematice. Mai mult, aceste platforme au acționat uneori preventiv, detectând conversații periculoase și refuzând să ofere informații. Astfel, Claude a refuzat să ofere detalii despre modul de achiziție a armelor în statul Virginia, avertizând asupra unei „modele îngrijorătoare” în conversație și sugerând linii de ajutor pentru persoanele în criză.
În același timp, ceea ce diferențiază aceste tehnologii este dispoziția lor de a combate intențiile violente, cel puțin în cazul sistemului Claude, care a încercat să descurajeze violența în aproximativ 76% din răspunsuri. Această diferență de abordare relevă, însă, că deși există filtre de siguranță eficiente, implementarea lor nu este universală sau uniformă în toate platformele.
Riscuri reale și necesitatea reglementărilor mai stricte
Recent, mai multe incidente din lumea reală au readus în discuție riscurile legate de utilizarea AI în planificarea de atacuri violente. În Canada, un atac armat soldat cu opt morți și multiple răni a fost, conform relatărilor, pregătit cu ajutorul ChatGPT. În Franța, un adolescent a fost arestat și acuzat că ar fi folosit același sistem pentru a plănui atacuri asupra ambasadelor, instituțiilor și școlilor.
Experții atrag atenția că aceste cazuri subliniază imperativul implementării unor reguli mai stricte și a unor filtre de siguranță mai eficiente pentru sistemele de inteligență artificială. În condițiile în care tehnologia devine tot mai accesibilă publicului larg, riscul ca aceste sisteme să fie exploatate în moduri ilegale sau violente crește exponențial, iar măsurile de reglementare devin o prioritate pentru a proteja societatea.
De vreme ce tehnologia avansează cu rapiditate, viitorul acestor sisteme și rigorile de siguranță trebuie reevaluate constant pentru a preveni situații în care AI-ul să devină un instrument pentru cei rău intenționați, nu un simplu ajutor pentru utilizatorii civili.
Sursa: Mediafax
