- 12:05Tesla столкнулась с судебным иском из-за предполагаемого несанкционированного использования образов из «Бегущего по лезвию»
- 11:30«Одинокая планета»: американская романтическая комедия, снятая в самом сердце Марокко
- 11:00COP16: коренные народы Амазонки требуют защиты своих территорий
- 10:20WhatsApp официально объявляет, что перестанет работать на этих телефонах после 31 декабря.
- 09:55ByteDance увольняет стажера из-за предполагаемого саботажа проекта искусственного интеллекта
- 09:45Шон «Дидди» Комбс, которому предъявили еще 7 исков, протестует против «новой волны публичности»
- 09:30При участии Марокко в Риме начинается работа пятьдесят второй сессии Комитета по продовольственной безопасности.
- 09:10Старт саммита БРИКС в Казани... «Укрепление многосторонности для справедливого глобального развития и безопасности»
- 08:45Meta запускает модель искусственного интеллекта Spirit LM для имитации человеческих голосов
Следите за нами в Facebook
Meta запускает модель искусственного интеллекта Spirit LM для имитации человеческих голосов
Meta запустила свою новую модель с открытым исходным кодом «Spirit LM», которая решает проблемы, связанные с мультимодальными моделями искусственного интеллекта при генерации звука.
Новая модель призвана обеспечить более естественное и выразительное звучание, что является продвинутым шагом в разработке интеллектуальных роботов, способных к голосовому общению более сложными и реалистичными способами.
Модель «Spirit LM» основана на предварительно обученной языковой модели, содержащей 7 миллиардов параметров, и отличается способностью обрабатывать звук иначе, чем традиционные модели, опирающиеся на технологии автоматического распознавания речи (ASR).
Мета отмечает, что традиционный подход приводит к утрате многих естественных выражений голоса. Поэтому Spirit LM полагается на использование фонем, тонов и высоты тона для преодоления этих ограничений, что позволяет ему воспроизводить естественные звуки и изучать новые задачи, включая распознавание речи, преобразование текста в текст и классификацию голоса.
Meta раскрыла эту модель в исследовательской работе, а также упомянула детали исследования, которые привели к разработке «Spirit LM», а также образцы аудиопроизводительности модели, дающие четкое представление о ее будущих возможностях.
Модель теперь доступна как проект с открытым исходным кодом, который разработчики и исследователи могут использовать и расширять. Ожидается, что в будущем она будет использоваться в мета-приложениях, таких как WhatsApp, Instagram и Facebook, что позволит пользователям взаимодействовать с искусственным интеллектом посредством естественного голоса. . разговоры, полные выражений, похожие на расширенный голосовой режим, недавно представленный OpenAI.