Исследование показывает, что модели искусственного интеллекта искажают новостные события почти в половине случаев

Исследование показало, что модели искусственного интеллекта, такие как ChatGPT, регулярно искажают новостные события, давая неверные ответы на вопросы почти в половине случаев.

В исследовании, опубликованном в среду Европейским вещательным союзом (EBU) и BBC, оценивалась точность более 2700 ответов, предоставленных OpenAI ChatGPT, Google Gemini, Microsoft Copilot и Perplexity.

Рекомендованные истории список из 4 пунктов конец списка

В рамках исследования 22 государственных средства массовой информации из 18 стран и 14 языков в период с конца мая по начало июня задали помощникам на основе искусственного интеллекта одинаковый набор вопросов.

В целом, согласно исследованию, в 45 процентах ответов упоминалась как минимум одна «значительная» проблема.

Наиболее распространенной проблемой были источники: в 31 проценте ответов, помимо прочих проблем, содержалась информация, не подтвержденная цитируемым источником, или указание неверного или непроверяемого источника.

Следующей по значимости причиной неверных ответов стала неточность — 20 процентов ответов, за ней следует отсутствие соответствующего контекста — 14 процентов.

По данным исследования, наиболее существенные проблемы были у Gemini, в основном связанные с поиском поставщиков: они затронули 76 процентов ответов.

Согласно исследованию, все изученные модели ИИ допускали элементарные фактические ошибки.

В число упомянутых ошибок входит утверждение Perplexity о том, что суррогатное материнство в Чехии является незаконным, и указание ChatGPT Папы Франциска действующим понтификом спустя несколько месяцев после его смерти.

OpenAI, Google, Microsoft и Perplexity пока не отреагировали на просьбы прокомментировать ситуацию.

В предисловии к отчету Жан Филип Де Тендер, заместитель генерального директора EBU, и Пит Арчер, руководитель отдела искусственного интеллекта в BBC, призвали технологические компании прилагать больше усилий для сокращения количества ошибок в своих продуктах.

«Они не считали этот вопрос приоритетным и должны сделать это сейчас», — заявили Де Тендер и Арчер.

«Им также необходимо быть прозрачными, регулярно публикуя свои результаты по языкам и рынкам».

Al Jazeera

Рекомендованные истории список из 4 пунктов конец списка

В целом, согласно исследованию, в 45 процентах ответов упоминалась как минимум одна «значительная» проблема.

Согласно исследованию, все изученные модели ИИ допускали элементарные фактические ошибки.

OpenAI, Google, Microsoft и Perplexity пока не отреагировали на просьбы прокомментировать ситуацию.

«Они не считали этот вопрос приоритетным и должны сделать это сейчас», — заявили Де Тендер и Арчер.

«Им также необходимо быть прозрачными, регулярно публикуя свои результаты по языкам и рынкам».

Al Jazeera

Исследование показывает, что модели искусственного интеллекта искажают новостные события почти в половине случаев

Похожие новости

Исследование показывает, что модели искусственного интеллекта искажают новостные события почти в половине случаев

Похожие новости

Федерация волейбола Ирана работает над трансфером находящегося без сознания игрока Сабера Каземи из Катара

Более трети арендной платы в Испании превышает 1500 евро в месяц

Протест в Дублине в прямом эфире: Ирландия готовится к новым беспорядкам в отелях для просителей убежища после бурной демонстрации

Запрос PETA на создание мемориала курам, погибшим в результате пожара в грузовике, отклонен

Почему пациенты с быстрорастущим раком в Великобритании говорят, что «после» хуже, чем лечение