- 17:00Yahoo запускает новое приложение для обмена сообщениями на базе искусственного интеллекта для улучшения пользовательского опыта
- 16:30Россия запустила ракету-носитель на Международную космическую станцию
- 16:20Нефть растет на фоне обострения конфликта на Украине
- 16:00Основные события: стратегический рычаг привлекательности Марокко
- 15:10Турецкий самолет «Акинджи» представляет собой «качественный прогресс» в военном потенциале Марокко.
- 14:35Wi-Fi 8: новые функции обеспечивают более быстрое и стабильное подключение к Интернету
- 14:05Исследование показывает, что ChatGPT превосходит врачей в диагностике заболеваний.
- 13:30Марокко подписывает контракт с Министерством обороны США на поддержку систем планирования миссий для самолетов F-16
- 13:05Датская компания Green Energy открывает офис в Дахле в рамках своих инвестиций в возобновляемые источники энергии в Марокко.
Следите за нами в Facebook
Meta запускает модель искусственного интеллекта Spirit LM для имитации человеческих голосов
Meta запустила свою новую модель с открытым исходным кодом «Spirit LM», которая решает проблемы, связанные с мультимодальными моделями искусственного интеллекта при генерации звука.
Новая модель призвана обеспечить более естественное и выразительное звучание, что является продвинутым шагом в разработке интеллектуальных роботов, способных к голосовому общению более сложными и реалистичными способами.
Модель «Spirit LM» основана на предварительно обученной языковой модели, содержащей 7 миллиардов параметров, и отличается способностью обрабатывать звук иначе, чем традиционные модели, опирающиеся на технологии автоматического распознавания речи (ASR).
Мета отмечает, что традиционный подход приводит к утрате многих естественных выражений голоса. Поэтому Spirit LM полагается на использование фонем, тонов и высоты тона для преодоления этих ограничений, что позволяет ему воспроизводить естественные звуки и изучать новые задачи, включая распознавание речи, преобразование текста в текст и классификацию голоса.
Meta раскрыла эту модель в исследовательской работе, а также упомянула детали исследования, которые привели к разработке «Spirit LM», а также образцы аудиопроизводительности модели, дающие четкое представление о ее будущих возможностях.
Модель теперь доступна как проект с открытым исходным кодом, который разработчики и исследователи могут использовать и расширять. Ожидается, что в будущем она будет использоваться в мета-приложениях, таких как WhatsApp, Instagram и Facebook, что позволит пользователям взаимодействовать с искусственным интеллектом посредством естественного голоса. . разговоры, полные выражений, похожие на расширенный голосовой режим, недавно представленный OpenAI.