Музыка
11 августа 2022
Поделиться

Музыка нас связала — с помощью искусственного интеллекта

Искусственный интеллект завоевывает все больше и больше пространства в нашей жизни. Пока одни спорят с тем, когда же нейросети заменят человека, а другие с этим не соглашаются, третьи ищут баланс между реальными человеческими достижениями и тем хорошим, что может привнести в нашу жизнь система алгоритмов. Конечно, талант, которым человека наградила природа, никто и никогда не сможет заменить, а технологии как раз и нужны для того, чтобы помочь сделать жизнь качественно лучше: креаторам — научиться монетизировать свое дело, бизнесменам — привлечь больше клиентов, а обычных городских жителей сделать чуть счастливее. IPQuorum поговорил с генеральным директором сервиса FONMIX Валерией Брусникиной и ее заместителем Олегом Пролубщиковым, которые знают все про системы мониторинга музыки, считывание эмоций при прослушивании песен и могущество искусственного интеллекта в музыкальной сфере.

Музыка нас связала — с помощью искусственного интеллекта

Иллюстрация: IPQuorum

— Начнем с базовых вещей: расскажите про свой сервис. Что такое FONMIX и чем вы занимаетесь?

Брусникина: Давайте я начну с того, что сейчас главная задача любого владельца бизнеса — повысить продажи, вложив в это минимальное количество средств. Мы живем в очень конкурентной среде, поэтому важен каждый клиент. Возвращаюсь к вашему вопросу: чем мы занимаемся? FONMIX как раз и является тем ресурсом, который помогает повысить продажи. Что конкретно мы делаем? Помогаем бизнесу работать эффективнее с помощью музыки.

Невозможно представить ресторан, магазин или салон красоты, где люди бы находились в тишине. Звук такой же важный маркетинговый инструмент, как интерьер, аромат и прочие вещи, которые создают атмосферу вашего бренда. Это отличный и недорогой способ невербального влияния на клиента: если ему было хорошо в вашем пространстве, согласитесь, вероятность того, что он вернется к вам и расскажет о вас своим знакомым, куда больше.

Мы работаем с 2017 года, и за это время нашими клиентами стали более 45 000 предприятий в девяти странах, включая Россию. С 2020 года FONMIX усиленно развивается как одна из ведущих международных IT-компаний в музыкальной сфере: искусственный интеллект, машинное обучение, Big Data, системы распределенного реестра. Мы проводим большое количество исследований на тему музыкального потребления разнообразного контента, поэтому, когда я рассказываю вам про возможности увеличить продажи, это не просто слова, а большая аналитическая работа нашей команды.

— Кто ваша аудитория и насколько она широка?

Брусникина: По большому счету, нашу целевую аудиторию можно поделить на две большие группы: представители бизнеса и правообладатели — создатели и/или обладатели прав музыкального контента — те самые представители творческих, или креативных, индустрий.

Владельцы бизнеса приходят к нам, потому что в нашем каталоге более 15 млн абсолютно легальных музыкальных фонограмм, что позволяет нам сделать индивидуальное аудиооформление под задачи каждого конкретного клиента. При этом FONMIX практически единственный сервис, который может предложить услуги бизнесу, расположенному в разных странах, но которые хотели бы централизованно управлять аудио- и видеооформлением своих заведений. У нас нет ограничений — мы можем работать с любым видом вашей деятельности: салоны красоты, спортивные клубы, торговые центры, рестораны, магазины, АЗС, банки, гостиницы — все что хотите.

Приведу пример. Представим, что у вас шоурум одежды. Девушка приходит, рассматривает вещи, подбирает много разных образов, сомневается, выбирает. Прошел час, она все еще не решила, что хочет, а она после работы, или с парнем рассталась, или еще что-то. Она пришла к вам отвлечься от своих мыслей. Ей нужно помочь — создать настроение. Классная музыка — самый простой способ. Клиент отлично провел время в вашем шоуруме, он с большим удовольствием отблагодарит вас рублем, еще и подруге вас посоветует. Так это и работает. Уже давно никто не продает просто продукт, продают эмоции и настроение.

— Интересно Вы рассказываете… Я визуализировал картину и теперь тоже улыбаюсь. Но давайте вернемся к вопросу. Вы говорили, что часть вашей аудитории — создатели контента. Как вы с ними взаимодействуете?

Брусникина: Давайте сразу подчеркнем, что мы говорим о тех создателях контента, которые являются правообладателями. Это важно. FONMIX позволяет формировать очень детализированную отчетность об использовании музыкальных фонограмм. Мы имеем прямые договоры с правообладателями, на основании которых получаем контент для нашего каталога и осуществляем регулярную выплату роялти. А также у нас есть договоры с обществами по коллективному управлению правами — Российское Авторское Общество (РАО) и Всероссийская организация интеллектуальной собственности (ВОИС). В нашей стране действует система коллективного управления правами. РАО и ВОИС выплачивают авторам и артистам вознаграждения, основанные на информации о фактическом использовании фонограмм. Разумеется, музыкантам важно, чтобы статистика на этот счет была максимально прозрачной, а это наш сервис гарантирует. Мы храним всю информацию в распределенном реестре IPChain, где данные невозможно изменить или подделать.

— Расскажите, пожалуйста, подробнее про глобальную систему мониторинга музыки. Для чего, если говорить просто, она требуется?

Брусникина: Каждый день появляется большое количество музыки, и весь этот объем необходимо отслушать, распределить по категориям. Это внутренняя задача музыкальной редакции FONMIX. Тут нам, к счастью, помогают технологии искусственного интеллекта. Также есть задача рынка и правообладателей по мониторингу разнообразных источников, где может звучать музыка: это радио-, телеканалы, стриминговые сервисы, подкасты и т.д. Есть два момента: первый — система мониторинга необходима для получения точной статистики. От нее зависит размер вознаграждения правообладателя. Данные строятся на основе информации по использованию музыки, причем неважно где: офлайн в заведениях, по радио, на телевидении, в онлайн-сервисах и проч.

Второй момент, система мониторинга — это еще и огромный пласт ценной информации для аналитики. Например, благодаря этим данным мы знаем, что при озвучке бизнес-пространств лучше использовать популярные треки. Таким образом, мы можем отслеживать музыкальные тренды, чтобы добавлять в каталог новые перспективные композиции.

— Давайте поговорим про искусственный интеллект. Что в целом сегодня могут нейросети в музыкальной индустрии?

Брусникина: За последние несколько лет искусственный интеллект сделал бешеный скачок в функционале. FONMIX использует нейросети для отбора совершенно гигантского количества музыки, которая появляется ежедневно. Мы как бизнес заинтересованы в обновлении плейлистов: важно, чтобы музыка не приедалась не только посетителям ресторана или салона красоты, но и их работникам, которые слушают эти песни круглые сутки. ИИ способен отбирать композиции и распределять их по множеству категорий: жанр, темп, скорость и др. На рынке B2C подобная схема работает уже давно: система анализирует, какие треки человек лайкнул или добавил в свой плейлист, и на этих данных «обучает» свой рекомендательный механизм. FONMIX делает так же, но только для B2B-рынка: клиент может дать пять композиций, нажать на кнопку, и система подберет ему шестичасовой плейлист с очень схожими треками. Более того: у FONMIX есть разработка, которая позволяет отследить и прогнозировать эмоции слушателя в определенный момент времени. Соответственно, мы можем сформировать плейлист, который будет вызывать у клиента определенный спектр эмоций: радость, умиротворение, восторг и множество других.

Пролубщиков: Система работает на основе нейрокогнитивного отклика: человек слышит какой-то звук, и он вызывает в определенный момент времени какую-то эмоцию. Это история из медицины: так же, как при проведении электроэнцефалограммы, на голову крепятся датчики, и они считывают изменения в мозге. В медицине, кстати, как показывает практика, происходит активное внедрение нейронных сетей для диагностики болезней. У них точность прогноза выше, чем у человека. И в музыке примерно то же самое — можно получить от нейросети некий прогноз, который необходимо затем валидировать. При этом важно помнить, что все подобные инструменты носят ретроспективный характер: мы всегда анализируем прошлое. Как сложится будущее, никто не знает. Любая нейросеть обучается на исторических данных. Но мир меняется, люди меняются, а значит, нейросети нужно непрерывно переобучать, иначе качество прогнозов начнет падать.

— Сравнится ли музыка, созданная ИИ, с музыкой Бетховена или Моцарта по качеству?

Брусникина: Конечно, с шедеврами композиторов сгенерированная нейросетью музыка в сравнение не идет, но здесь есть свои нюансы. Не всегда в жизни нам хочется слушать Девятую симфонию. Каждая музыка, неважно кем созданная, найдет своего поклонника и слушателя. Давайте здесь разделим аудиторию. Не факт, что музыка, написанная искусственным интеллектом, подойдет тем, кто слушает ее для удовольствия — чтобы просто помечтать или подумать о чем-нибудь важном. Но при этом музыка, созданная ИИ, может отлично закрывать вспомогательные функции — создавать настроение во время шопинга, задавать ритм на тренировке, расслаблять во время косметических процедур. Музыки много, и она разная, но и у нас большой спектр потребностей и задач. Самое главное здесь — то, что есть возможность выбрать, что нужно именно нам в соответствии с настроением и видом деятельности.

— На «Российской креативной неделе» вы рассказывали, что примерно 20% музыки на стримингах никогда не проигрывалось. Причина — несовершенные рекомендательные алгоритмы. А зачем их вообще нужно совершенствовать?

Брусникина: Да хотя бы просто для разнообразия! Мы же не слушаем всю жизнь одно и то же. Вкусы потребителя меняются, причем достаточно активно. Любой музыкальный рекомендательный сервис стремится максимально удовлетворить интерес потребителя. Если пойти от гипотезы, что у каждого из нас свой индивидуальный вкус, то эту задачу никак не решить без огромного разнообразия музыки. Сегодня музыкального контента на самом деле не хватает, а скоро его потребуется куда больше.

— На форуме вы затрагивали понятие «период полураспада» музыкального трека. Расскажите поподробнее.

Пролубщиков: Этот термин пришел из физики: радиоактивные вещества непостоянны, они быстро распадаются на составные части. В музыкальном мире эта метафора означает время, сколько тот или иной трек был в топе, некий период славы. В среднем, по подсчетам, он длится 59 дней.

— Получается, в этот «период славы» трек на стримингах добавляют, скачивают, больше прослушивают. Из-за этого он чаще других показывается рекомендательными алгоритмами?

Пролубщиков: Да, хотя и не всегда: это вопрос конкретного алгоритма. Безусловно, количество прослушиваний учитывается, но у популярных стримингов механизм рекомендаций более сложный. Например, что значит прослушивание? Можно весь трек проиграть, можно 70%, а можно вообще только 30 секунд. Во всех случаях формально композиция была проиграна, ее правообладатель даже получил с этого отчисления. Но для сложного рекомендательного сервиса только прослушивания мало, обычно используется несколько метрик. В каждом конкретном случае рекомендации треков зависят от того, какую именно информацию сервис собирает о пользователях.

— Вы как-то упоминали про сервис hits prediction — механизм искусственного интеллекта, способный предугадывать вероятность попадания трека в топы. Расскажите, как он работает.

Пролубщиков: Механизмы hits prediction, основанные на искусственном интеллекте, работают по принципу нейронных сетей. Эти сети отражают модель работы нейронов в реальном человеческом мозге: на них так же поступают определенные сигналы, распределенные по параметрам. В музыке, например, первым параметром может быть тембр, вторым — длительность трека, третьим — эмоция, которую этот трек вызывает, и т. д. Вся эта информация подается на вход тому, что мы называем нейросетью, и дальше она проходит процесс обучения. Сегодня эти нейросети в основном многослойные, то есть нужная информация передается от слоя к слою. А на выходе получается прогноз — с такой-то вероятностью, например, трек будет хитом и попадет в чарты. По сути, нам нужно обучить нейросеть решать простую бинарную задачу: попадет в топ или не попадет. Есть механизмы, способные с вероятностью 98% сказать, какой трек точно не станет хитом. Однако сказать противоположное, то есть какой трек станет хитом, можно пока лишь с вероятностью 55%.

— FONMIX уже использует hits prediction?

Брусникина: Пока что сервис находится на уровне внутренней разработки. Мы знаем, что на него точно будет спрос от музыкантов, продюсеров и менеджеров, но FONMIX пока не работает напрямую с физлицами, он больше про B2B. Но мы уже думаем над тем, как можно сделать продукт более доступным для обычных пользователей.

— Недавно была новость о том, что ИИ написал о самом себе научную статью. Нейросети уже способны сами успешно создавать музыку?

Брусникина: Тут нужно понять, что значит «успешно». Говорить сейчас, что ИИ сочиняет песни, тексты или музыку в целом на уровне человека, нельзя. Скорее, это хороший инструмент для музыканта, то же самое, как hits prediction — хороший инструмент для продюсера или лейбла. Искусственный интеллект совершенно не исключает наличия человека в цепочке создания музыки, так что это точно не приведет к тому, что музыканты или продюсеры не будут нужны. Возможно, процентное соотношение будет меняться в сторону ИИ.

Пролубщиков: Например, есть сервис Vocaloid, где существенная часть задач по созданию музыки решается нейросетью. Но вообще музыку ведь можно синтезировать и без нейросетей: например осуществить чистый синтез и строго по формуле создать оригинальную звуковую волну. А можно сделать на основе сэмплов, которые, в свою очередь, первоначально были придуманы человеком. Все, опять-таки, зависит от подхода. Мир всем этим активно занимается, и сейчас это плотный симбиоз человека и компьютерных технологий.

— Напоследок философский вопрос: может ли искусственный интеллект, как в «Матрице», захватить власть над своим создателем-человеком?

Брусникина: Чем ближе к технологиям, тем сильнее понимаешь, что мы от этого пока  далеко. Мы еще не находимся на той стадии, когда произойдет переход к цифровой сингулярности. Мы можем долго моделировать работу мозга, но с нейрофизиологической точки зрения то, что сейчас есть на рынке, все эти нейросети моделируют довольно примитивные процессы. Человеческий мозг в разы, может, и в миллионы раз, сложнее этого. В мозге ведь кроме электрических процессов, которые имитируются искусственной нейронной сетью, есть куча других процессов, биологических и химических. На сегодняшний день нейросети никак эту часть не моделируют.

Пролубщиков: Другие исследователи придерживаются мнения, например, что и не надо человеческий мозг копировать. Нужен новый, особенный, машинный интеллект. Это уже не совсем про нейросети, это будет некий НЛО, с иным разумом. Тут вряд ли что-то можно спрогнозировать. Тут же возникает и более глобальная проблема: где вообще возникает мысль при когнитивном процессе? Ни медицина, ни биология, ни компьютерные технологии не понимают, откуда берется мысль у человека. То, что ее дальше мозг обрабатывает, это понятно, но кто сказал мозгу, зачем это вообще нужно делать?

Брусникина: Вот человек сочиняет музыку — где формируется стимул, посыл? В музыкальной школе учат, чтобы пальцы правильно выдавали аккорд или звукоряд. Это все механика, это можно воспроизвести технически. Но человечество даже близко не подошло к проблеме, где возникает вся эта история с мыслями и мотивами! Более того, ученые до сих пор не могут ответить на вопрос: чисто анатомически точно мозг этим всем занимается? Приведем аналогию с компьютером: вот есть центральный процессор, который сам по себе ничего не делает. Нужен некий программист, который его на что-то запрограммировал. Пока эта «невидимая рука программиста» не заложила определенный алгоритм, толку от всего компьютера нет. Так же и с мозгом. 

Поэтому, пока человечество не подобралось к решению этой задачи, говорить, что ИИ заменит человека, некорректно. 

 

Автор: Борис Поженин

Следите за событиями в нашем новостном телеграм-канале