Существует множество нейросетевых продуктов для музыки. Одни лучше справляются с вокалом на русском, другие сильны в создании фона без слов. Рассмотрим самые известные нейросети для создания песен – их особенности, плюсы и минусы.
Suno AI – полноценные песни с вокалом
Интерфейс Suno: результат генерации джингла про йогурт – нейросеть выдала два трека («Йогуртовая мечта» и «Йогуртовая радость») с уникальными мелодиями, текстом и обложками.
Suno считается одной из лучших музыкальных нейросетей на сегодняшний день. Она умеет генерировать полноценную песню – от мелодии и аранжировки до стиха и пения – по простому текстовому описанию. Достаточно ввести в поле пару фраз о настроении или сюжете композиции, при желании указать жанр, и Suno создаст две версии трека продолжительностью ~1,5 минуты каждая. Причём сервис хорошо понимает запросы на русском языке, чего не умеют многие конкуренты. В тестах Suno показала впечатляющее качество: голос нейросети звучит почти как настоящий певец, текст (если генерируется автоматически) получается связным, пусть иногда и хромает рифма. Мелодию порой сложно отличить от музыки, написанной человеком. Приятный бонус – для каждого сгенерированного трека Suno автоматически предлагает обложку альбома, созданную другим ИИ.
В бесплатном режиме Suno доступно около 5–10 генераций песен (новые пользователи получают ограниченные кредиты). Этого хватит, чтобы оценить возможности. За $10 в месяц можно оформить подписку и генерировать до 500 песен в месяц, плюс откроется коммерческая лицензия на их использование. Самый продвинутый план за $30/мес расширяет лимит до 2000 композиций. Также Suno позволяет тонко настраивать процесс: есть режим Custom для ввода своего текста (Lyrics) и отдельного описания стиля музыки. Можно переключиться в Instrumental, если нужна только музыка без вокала. По умолчанию генерация идёт моделью версии 3.5, но в настройках можно выбрать Suno v4 – она даёт ещё более натуральное звучание, особенно в интонациях голоса. В целом, Suno AI – отличный выбор, если вы хотите быстро получить песню с голосом на русском или английском. Сервис прост в использовании: ввели промпт – через минуту слушаете готовый трек.
Udio – генератор песен с тонкими настройками
Udio (udio.com) – молодой AI-сервис, уже полюбившийся тем, кто хочет больше контроля над результатом. Его нередко сравнивают с Suno, и по самой идее работы они схожи: Udio тоже генерирует вокальную песню по описанию, поддерживает русский язык, предлагает два варианта трека на запрос. Однако Udio позволяет детально указать параметры будущей музыки. Интерфейс этого сервиса наполнен настройками: можно выбрать жанр, инструменты, темп, настроение композиции отдельными кнопками еще до генерации. Если не хочется детально конфигурировать – достаточно просто описать идею песни в одном поле, а система сама проставит жанровые теги. Udio может работать в режимах Instrumental (только минусовка) или с вокалом, а для текста песни доступны опции Auto-generated (нейросеть сама пишет слова) либо Custom (вы задаёте свой текст).
Главный плюс Udio – гибкость и возможности редактирования. После генерации 30-секундного трека (столько длится бесплатный фрагмент) вы можете нажать Extend, чтобы дописать продолжение, или Edit – внести правки в уже созданный фрагмент. Также доступно автоматическое создание видеоряда к песне (фича Generate Video). Фактически, Udio даёт платформу для пошагового сочинения песни, где пользователь направляет ИИ на каждом этапе. Бесплатно сервис выдаёт 10 кредитов в день (этого хватит примерно на 5 генераций) плюс при регистрации может подарить бонус на первые недели. Этого достаточно, чтобы попробовать сделать несколько треков. Обращаем внимание: Udio пока в бета-версии, поэтому иногда генерация может занимать несколько минут или подвисать. Кроме того, качество русскоязычных текстов здесь хуже, чем у Suno – нейросеть может придумывать несуществующие слова или «жевать» окончания. Создатели сами рекомендуют использовать английский для лучшего результата. Тем не менее, если разобраться в настройках, Udio позволяет добиться отличного звучания. Платные планы Udio дают большой запас кредитов (например, 1200 в месяц на стандартном тарифе) – этого хватит на сотни песен.
Boomy – создание музыки за минуту (инструментал)
Boomy – это нейросеть-битмейкер, которая генерирует мелодии без вокала по заданным параметрам. Идеально подходит для тех, кому нужен фон, бит или инструментальная дорожка. Процесс максимально простой: вы выбираете стиль/жанр (например, «Lo-Fi», «Global Groove», «Electronic Dance» и т.д.), затем Boomy одним кликом создаёт трек длительностью до ~2 минут. Есть и продвинутый режим Custom, где композицию можно собрать с нуля: вручную задать жанр, инструменты, ритмику ударных, эффекты, темп и прочие детали звучания. Таким образом, Boomy полезен как новичкам (быстрый результат из шаблона), так и более опытным пользователям, которые хотят поиграть с формой.
На выходе получается авторский трек в выбранном стиле – по сути, уникальный бит. Бесплатно его можно прослушать и поделиться ссылкой. Однако скачивание трека на устройство требует оплату – здесь Boomy уступает конкурентам. Сервис сразу ориентирован на подписочную модель: тариф Creator ($9,99 в месяц) даёт сохранить до 500 композиций, скачивать до 10 треков в месяц и даже публиковать до 15 релизов на стриминговых платформах. Более дорогой план Pro ($29,99) расширяет лимиты и включает коммерческую лицензию на использование музыки. Фишка Boomy в том, что он интегрирован с музыкальными площадками – можно буквально за пару кликов выложить сгенерированный трек на Spotify, YouTube и прочие сервисы, монетизировать его. Это делает Boomy привлекательным для начинающих электронных музыкантов: вы получаете и инструмент для творчества, и платформу для дистрибуции. Имейте в виду, вокал Boomy не сгенерирует (только музыка), зато никто не мешает вам добавить собственное пение или рап на получившийся бит.
Другие нейросети для музыки и песен
Помимо лидеров вроде Suno, Udio и Boomy, существуют десятки других AI-инструментов для музыкального творчества. Кратко перечислим самые интересные:
Mubert. Генеративный аудиостриминговый сервис, создающий бесконечную музыку по заданным тегам и настроению. Отлично подходит для фоновой музыки, подкастов, стримов. Пользователь выбирает жанр/вибрацию (например, Ambient, Chill, House), и Mubert бесконечно генерирует в этом стиле. Бесплатно можно слушать и даже скачать короткие сэмплы треков, но для коммерческого использования нужна подписка. Mubert славится тем, что его музыка не повторяется и не нарушает авторских прав – удобный источник нейросетевого саундтрека на все случаи жизни.
AIVA. Один из первых AI-композиторов, специализируется на академической музыке. AIVA умеет писать симфонии, саундтреки, джазовые пьесы, близкие по стилю к человеческим произведениям. Уникальная возможность – экспорт партитуры: сервис может представить сгенерированную музыку в виде нот или MIDI-файла. В бесплатном режиме AIVA предлагает несколько пробных композиций и доступ к ограниченному набору стилей. Подписка открывает больше жанров и увеличивает лимит скачивания треков. Если вам нужна инструментальная музыка для фильма, игры или оркестровка песни – AIVA стоящий вариант.
Soundraw, Loudly, Beatoven, Soundful. Это семейство близких по идеологии сервисов, создающих трек по описанию для дальнейшего использования в видео или других проектах. Они не генерируют вокал, зато позволяют подобрать продолжительность трека, структуру (нарастание, спад), отстраивать громкость инструментов. Например, Loudly генерирует около 30 секунд музыки на бесплатном плане и предоставляет удобный микшер для правок. Beatoven выдаёт сразу четыре одноминутных сэмпла на заданную тему, позволяет отключать инструменты или редактировать трек через текстовые подсказки (например, «сделай гитару тише»). Многие из этих сервисов имеют бесплатный лимит генераций в месяц, далее потребуют оплату, особенно для скачивания WAV-файлов высокого качества.
Musicfy и со-vits-svc. Отдельное направление – нейросети для изменения голоса, создания каверов. Musicfy не пишет мелодии, но позволяет взять любую готовую песню и «пропеть» её голосом выбранной знаменитости или персонажа. В библиотеке есть вокалы мировых поп-звезд, рэперов и даже героев мультфильмов, причём поют они на любом языке. Это скорее развлечение: можно представить, как звучал бы ваш трек, исполненный Билли Айлиш или Шреком. Качество таких каверов среднее (иногда голос едва узнаваем), особенно если оригинальная песня на русском. Для более продвинутого эксперимента энтузиасты используют open-source модель So-VITS-SVC, чтобы клонировать голоса любимых артистов с высоким качеством, но это требует навыков работы с Google Colab и т.п.. В любом случае, направление AI-каверов активно развивается – возможно, скоро нейросеть споёт песню вашим голосом или голосом кумира так, что не отличить от оригинала.