Нове дослідження показує, що багато AI-інструментів, які обіцяють швидко допомагати з пошуком інформації або відповідями на складні питання, не завжди заслуговують на довіру.
Команда дослідників з підрозділу Salesforce AI Research протестувала сервіси Perplexity, You.com, Bing Chat та GPT-4.5 за спеціальним фреймворком DeepTRACE. Він оцінював вісім ключових параметрів, серед яких точність цитувань, якість доказів, схильність до однобокості та рівень «самовпевненості». Результати виявилися невтішними: приблизно третина тверджень, які наводили ці системи, не мала належного підтвердження з боку зазначених джерел. Для GPT-4.5 показник проблемних відповідей сягнув майже половини всіх перевірених випадків.
Ще одна тривожна знахідка стосується тем, що мають кілька точок зору. На питання, де важливо представити різні аргументи, штучний інтелект часто обирав лише один бік дискусії й подавав його як беззаперечну істину. Дослідники відзначили, що така однобокість поєднується з високою впевненістю у відповідях, що може вводити користувачів в оману. Крім того, значна частина наведених посилань виявилася некоректною або нерелевантною: залежно від сервісу правильними були лише 40–80 відсотків цитувань.
Якщо коротко то:
Автори дослідження закликають до більшої прозорості в роботі таких систем, удосконалення механізмів перевірки фактів і забезпечення балансу різних точок зору. Без цих кроків, кажуть вони, зростатиме ризик поширення дезінформації навіть у середовищах, які здаються технологічно прогресивними й надійними.
Підсумки року від Google «Year in Search 2024» показують, які стрічки найбільше хвилювали глядачів в…
Перегляд кіно англійською — це не просто розвага, а й один з найефективніших способів відточити…
Група науковців з Університету Сіань Цзятунг у Китаї зробила відкриття, яке може змінити уявлення про…
Марсохід Perseverance зробив нові цікаві відкриття під час досліджень кратера Джезеро, які можуть допомогти відновити…
За останніми науковими дослідженнями, дим від лісових пожеж, посилених змінами клімату, може спричинити значно більше…
Найближчими днями два газові гіганти — Сатурн і Нептун — досягнуть максимальної яскравості, і любителям…