- 20:54Siel 2025: чествование культуры и литературного наследия в Рабате
- 13:52Вашингтон предупреждает о «неминуемых атаках» в Сирии
- 13:18Подтверждение поддержки Соединенными Штатами суверенитета Марокко над его Сахарой является «решительным» и «недвусмысленным».
- 12:28Марокко делает ставку на автомобильные аккумуляторы, чтобы укрепить свои позиции в автомобильной промышленности.
- 11:07Нигерийский штат Кано заключил стратегическое соглашение с Марокко в сфере солнечной энергетики и сельского хозяйства
- 10:18Верховный суд США приостановил депортацию венесуэльских иммигрантов.
- 09:45Международная поддержка инициативы Марокко по автономии в Сахаре достигает поворотного момента
- 09:01Почему прибытие Apache AH-64E в Марокко меняет военную ситуацию?
- 16:25Марокко и Словения укрепляют стратегическое партнерство в различных областях
Следите за нами в Facebook
Meta запускает модель искусственного интеллекта Spirit LM для имитации человеческих голосов
Meta запустила свою новую модель с открытым исходным кодом «Spirit LM», которая решает проблемы, связанные с мультимодальными моделями искусственного интеллекта при генерации звука.
Новая модель призвана обеспечить более естественное и выразительное звучание, что является продвинутым шагом в разработке интеллектуальных роботов, способных к голосовому общению более сложными и реалистичными способами.
Модель «Spirit LM» основана на предварительно обученной языковой модели, содержащей 7 миллиардов параметров, и отличается способностью обрабатывать звук иначе, чем традиционные модели, опирающиеся на технологии автоматического распознавания речи (ASR).
Мета отмечает, что традиционный подход приводит к утрате многих естественных выражений голоса. Поэтому Spirit LM полагается на использование фонем, тонов и высоты тона для преодоления этих ограничений, что позволяет ему воспроизводить естественные звуки и изучать новые задачи, включая распознавание речи, преобразование текста в текст и классификацию голоса.
Meta раскрыла эту модель в исследовательской работе, а также упомянула детали исследования, которые привели к разработке «Spirit LM», а также образцы аудиопроизводительности модели, дающие четкое представление о ее будущих возможностях.
Модель теперь доступна как проект с открытым исходным кодом, который разработчики и исследователи могут использовать и расширять. Ожидается, что в будущем она будет использоваться в мета-приложениях, таких как WhatsApp, Instagram и Facebook, что позволит пользователям взаимодействовать с искусственным интеллектом посредством естественного голоса. . разговоры, полные выражений, похожие на расширенный голосовой режим, недавно представленный OpenAI.
Комментарии (0)