Istraživanje: AI asistenti pogrešno prikazuju vijesti u gotovo polovini odgovora

 (Foto: Pexels/Pixabay)
(Foto: Pexels/Pixabay)

Vodeći AI asistenti pogrešno prikazuju sadržaj vijesti u skoro polovini svojih odgovora, pokazalo je istraživanje objavljeno u srijedu koje su sproveli Evropska radiodifuzna unija (EBU) i BiBiSi (BBC).

Međunarodno istraživanje analiziralo je tri hiljade odgovora na pitanja o vijestima postavljena najpoznatijim AI asistentima – softverskim aplikacijama koje koriste vještačku inteligenciju za razumijevanje prirodnog jezika i obavljanje zadataka za korisnika.

Procijenjeni su AI asistenti na 14 jezika prema kriterijumima tačnosti, navođenja izvora i sposobnosti razlikovanja mišljenja od činjenica, među kojima su ChatGPT, Copilot, Gemini i Perplexity.

Ukupno je 45 odsto analiziranih AI odgovora sadržalo barem jednu ozbiljnu grešku, dok je 81 odsto imalo neki oblik problema, pokazalo je istraživanje.

Rojters je kontaktirao kompanije uključene u istraživanje kako bi zatražio njihov komentar o rezultatima.

Gemini, Gugl-ov AI asistent, ranije je na svojoj internet stranici naveo da pozdravlja povratne informacije korisnika kako bi se platforma mogla nastaviti poboljšavati i postati korisnija.

OpenAI i Majkrosoft su prethodno izjavili da su takozvane „halucinacije“, situacije u kojima AI model generiše netačne ili obmanjujuće informacije zbog, na primjer, nedostatka podataka – problem na kojem aktivno rade kako bi ga otklonili.

Perplexity na svojoj stranici navodi da jedan od njegovih načina rada, nazvan „Deep Research“, ima tačnost od 93,9 odsto u pogledu činjenica.

Greške u navođenju izvora

Trećina odgovora AI asistenata pokazala je ozbiljne greške u navođenju izvora, poput izostanka izvora, pogrešnog ili netačnog navođenja, navodi se u istraživanju.

Čak 72 odsto odgovora Geminija, Gugl-ovog AI asistenta, imalo je značajne probleme s izvorima, u poređenju s manje od 25 odsto kod svih ostalih asistenata.

Problemi s tačnošću utvrđeni su u 20 odsto svih analiziranih odgovora, uključujući slučajeve zastarjelih informacija.

Primjeri navedeni u istraživanju uključuju situaciju u kojoj je Gemini pogrešno naveo izmjene zakona o jednokratnim e-cigaretama te slučaj kada je ChatGPT nekoliko mjeseci nakon smrti pape Franje i dalje naveo da je on aktuelni papa.

U istraživanju je učestvovalo 22 javna medijska servisa iz 18 zemalja, među kojima su Francuska, Njemačka, Španija, Ukrajina, Velika Britanija i Sjedinjene Američke Države.

Kako AI asistenti sve više zamjenjuju tradicionalne internet pretraživače u pristupu vijestima, javno povjerenje moglo bi biti ozbiljno narušeno, upozorio je EBU.

- Kada ljudi više ne znaju čemu mogu vjerovati, na kraju ne vjeruju ničemu, a to može obeshrabriti učešće u demokratskim procesima - izjavio je direktor EBU-a za medije Žan Filip de Tender.

Prema izvještaju Digital News Report 2025 Rojtersovog instituta, oko sedam odsto svih korisnika interneta koji prate vijesti i čak 15 odsto onih mlađih od 25 godina koristi AI asistente za informisanje o aktuelnostima.

Novi izvještaj poziv je AI kompanijama na veću odgovornost i poboljšanje načina na koji njihovi asistenti odgovaraju na pitanja povezana s vijestima.