- 16:25Марокко и Словения укрепляют стратегическое партнерство в различных областях
- 15:38Casablanca Finance City: стратегический рычаг для укрепления марокканско-ирландского экономического партнерства
- 14:50Международный отчет: Марокко становится растущей державой в экспорте фруктов и овощей, несмотря на проблемы климата.
- 14:15Словения вновь заявляет о своей поддержке марокканской инициативы автономии для Сахары
- 11:57Марокко среди крупнейших получателей: Россия увеличивает экспорт сельскохозяйственной продукции в страны Ближнего Востока и Северной Африки
- 10:34ХАМАС стремится к всеобъемлющему соглашению по урегулированию войны в Газе
- 09:38План автономии Марокко меняет динамику Сахары
- 09:13Третья выставка GITEX Africa Morocco 2025 в Марракеше прошла с ошеломляющим успехом.
- 08:33Онлайн-реклама: федеральный судья США признал Google виновным в монополии
Следите за нами в Facebook
У стареющих чат-ботов, как и у людей, наблюдаются признаки слабоумия!
Новое исследование показывает, что некоторые ведущие чат-боты с искусственным интеллектом демонстрируют явные признаки легких когнитивных нарушений.
Как и в случае с людьми, эффекты становятся более выраженными по мере старения чат-ботов, при этом более старые и более крупные языковые модели работают менее эффективно.
Исследование было опубликовано в журнале «The BMJ» и направлено на то, чтобы прояснить, что технология недостаточно эффективна для использования в области медицины, особенно в диагностике, говорится в сообщении сайта «Футуризм».
Исследователи, стоящие за исследованием, заявили, что результаты ставят под сомнение «гипотезу о том, что искусственный интеллект скоро заменит врачей-людей, поскольку очевидные когнитивные слабости ведущих чат-ботов могут повлиять на их диагностическую надежность с медицинской точки зрения».
В этом исследовании протестировались чат-боты «GPT-4» и «GPT-4o» от OpenAI, «Claude 3.5 Sonnet» от Anthropic и «Gemini 1.0» и «Gemini 1.5» от Google.
Эти чат-боты использовались для Монреальской когнитивной оценки (MoCA) — теста, предназначенного для выявления ранних признаков деменции, в котором более высокие баллы указывают на более высокие когнитивные способности.
«GPT-4o» получил высший балл (26 баллов из 30, что практически является нижней границей нормы), а роботы «Gemini» получили самый низкий балл (16 баллов из 30).
Хотя все чат-боты преуспели в большинстве типов задач, каждый из них плохо справлялся с зрительно-пространственными и исполнительными задачами, такими как рисование линии между круговыми числами в возрастающем порядке.
Также было показано, что искусственному интеллекту очень сложно нарисовать часы, показывающие точное время. Модели Близнецов полностью провалили довольно простое задание на отложенное запоминание, которое предполагало запоминание последовательности из пяти слов.
Комментарии (0)