- 17:10Биткоин достиг исторического максимума, превысив $118 000
- 16:30Газа: ООН осуждает сотни смертей вблизи пунктов гуманитарной помощи
- 15:45Вашингтон рассматривает тарифные льготы для Юго-Восточной Азии как часть своей торговой войны
- 15:00США вводят 35%-ную пошлину на канадский импорт в связи с обострением торговой напряжённости
- 14:15Новый Марокко - Парламентский саммит ЕС запланирован в Рабате в октябре
- 13:30Лавров указывает на растущие риски, угрожающие перспективам создания палестинского государства
- 12:15ОПЕК+ планирует приостановить увеличение производства после запланированного увеличения в сентябре
- 12:02Песков защищает подавление российских СМИ, называя это частью «информационной войны»
- 11:30Взрывное потребление энергии ИИ угрожает стабильности мировых поставок
Следите за нами в Facebook
У стареющих чат-ботов, как и у людей, наблюдаются признаки слабоумия!
Новое исследование показывает, что некоторые ведущие чат-боты с искусственным интеллектом демонстрируют явные признаки легких когнитивных нарушений.
Как и в случае с людьми, эффекты становятся более выраженными по мере старения чат-ботов, при этом более старые и более крупные языковые модели работают менее эффективно.
Исследование было опубликовано в журнале «The BMJ» и направлено на то, чтобы прояснить, что технология недостаточно эффективна для использования в области медицины, особенно в диагностике, говорится в сообщении сайта «Футуризм».
Исследователи, стоящие за исследованием, заявили, что результаты ставят под сомнение «гипотезу о том, что искусственный интеллект скоро заменит врачей-людей, поскольку очевидные когнитивные слабости ведущих чат-ботов могут повлиять на их диагностическую надежность с медицинской точки зрения».
В этом исследовании протестировались чат-боты «GPT-4» и «GPT-4o» от OpenAI, «Claude 3.5 Sonnet» от Anthropic и «Gemini 1.0» и «Gemini 1.5» от Google.
Эти чат-боты использовались для Монреальской когнитивной оценки (MoCA) — теста, предназначенного для выявления ранних признаков деменции, в котором более высокие баллы указывают на более высокие когнитивные способности.
«GPT-4o» получил высший балл (26 баллов из 30, что практически является нижней границей нормы), а роботы «Gemini» получили самый низкий балл (16 баллов из 30).
Хотя все чат-боты преуспели в большинстве типов задач, каждый из них плохо справлялся с зрительно-пространственными и исполнительными задачами, такими как рисование линии между круговыми числами в возрастающем порядке.
Также было показано, что искусственному интеллекту очень сложно нарисовать часы, показывающие точное время. Модели Близнецов полностью провалили довольно простое задание на отложенное запоминание, которое предполагало запоминание последовательности из пяти слов.