Google разработала нейросеть, которая генерирует музыку в любом жанре из текстового описания

Автор Антон Курилов 10:00 28.01.2023
- 2 +  11 576 0
Google разработала нейросеть, которая генерирует музыку в любом жанре из текстового описания

Специалисты Google Research представили нейросетевую модель MusicLM, которая генерирует «высококачественную» музыку на основе текстового описания. Примеры её работы можно услышать на специальной странице.

MusicLM обучена на наборе данных из 280 000 часов музыки. Нейросеть способна создать аудиокомпозицию в 24 кГц и в любом жанре, уловив описанные в аннотации нюансы: например, «динамичный и оптимистичный саундтрек аркадной игры с запоминающимся риффом электрогитары».

Кроме того, MusicLM может объединить несколько последовательных аннотаций и создать «музыкальную историю», в которой один фрагмент перетекает в другой. А ещё модели можно задать уровень музыканта: например, на запросы «начинающий пианист» и «пианист-виртуоз» MusicLM выдаст совершенно разные результаты.

Тем не менее, в некоторых представленных примерах заметно искажённое качество. Уязвимое место MusicLM — генерация вокала: в большинстве случаев синтезированная речь больше похожа на тарабарщину.

Подписывайтесь на Rozetked в Telegram, во «ВКонтакте» и обязательно в YouTube.

14.05.2024
Google I/O 2024
21.05.2024
Microsoft Build 2024
Нет событий
04.04.2025
«Форсаж 11»
Все события





Реклама на сайте



Комментарии

14.05.2024
Google I/O 2024
21.05.2024
Microsoft Build 2024
Нет событий
04.04.2025
«Форсаж 11»
Все события





Реклама на сайте