podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2
AddThis Social Bookmark Button
Версия для печати Блоггерам

Музыкальные сервисы в Интернете: опознание музыки

Музыкальные рекомендательные сервисы хороши, когда надо найти что-то новое. Но наш потребитель не всегда «не знает, чего хочет». Часто он знает, но не может вспомнить или помнит только на слух.

Каждый из нас бывал в такой ситуации, когда в голове вертится какая-то мелодия, но название никак не вспоминается. Или услышал песню по радио или просто на улице, а кто поет и как называется – не знаешь. В таких случаях очень кстати бы пришелся сервис по опознанию музыки.

В мире музыкальных интернет-сервисов решение задачи правильно опознать песню очень важно. Во-первых, сколько продаж не происходит из-за того, что люди не могут найти понравившуюся песню, они не знают или забыли, как она называется. Во-вторых, даже если человек не купит опознанную композицию, а скачает где-то бесплатно, он, тем не менее, воспользуется сервисом по опознанию, что можно монетаризовать, например, через рекламу.

Существует несколько техник в опознании песни, применение каждой из них зависит от того, что, собственно, знает человек об искомой композиции.

У каждого трека есть два главных идентификатора – название и исполнитель.

Это как имя и фамилия. В принципе, есть еще название альбома, но альбомы постепенно выходят из моды, да и у какого исполнителя есть две песни с одинаковым названием? Так что комбинации «исполнитель + название» вполне достаточно.

Другое дело, что с комбинацией этой далеко не всегда все ясно. Даже вполне официальные источники порой путаются в правильном написании названий музыкальных групп или их песен. Чего уж говорить об обычных людях.

Простейший случай – человек помнит название песни, но не помнит исполнителя. Или наоборот. В этом случае музыкальный сервис должен иметь доступ к базам данных по исполнителям и их творчеству. Пользователь посмотрит предложенные варианты, послушает их фрагменты в потоковом формате и выберет нужное.

Первый шаг опросника поисковой системы одного из рекорд-лейблов:
Помните ли Вы: 1) Часть имени исполнителя; 2) Часть названия альбома; 3) Часть названия композиции; 4) Музыкальный стиль композиции

Вообще, возможность предпрослушивания очень важна при опознании, поэтому подобные сервисы обязательно должны быть оснащены проигрывателем потокового аудио, по крайней мере, фрагментов композиций, достаточных для опознания.

Другая похожая задача – проверка правильности написания. Как часто мы неверно запоминаем имя исполнителя, название песни, особенно если это неродной язык! А ведь далеко не все сервисы принимают это во внимание, огорчая очередным «По вашему запросу ничего не найдено».

Ряд музыкальных сайтов, однако, организован с пониманием этих сложностей и имеет систему проверки написания, сводящую подобные ошибки минимуму. Естественно, для этого им тоже необходимо иметь обширную базу наименований исполнителей и композиций.

Проверка музыкальной грамотности на сайте myplaylist.biz

Для создания подобной базы точкой опоры пока даже в Интернете остаются музыкальные CD. Ведь подавляющее число аудиозаписей по-прежнему выходит в первую очередь в этом формате. Официальный релиз аудио-CD – мероприятие ответственное, оно должно соответствовать определенным стандартам. Все выпущенные диски каталогизируются, заносятся в классификаторы. Это создает первичную информацию о записи.

В Интернете уже довольно долго существуют онлайн-базы подобных данных. Это, так сказать, первичная информационная основа всей «музыкосферы». В таких базах содержится справочная информация о множестве исполнителей, альбомов, композиций. Их называют CDDB, CD Data Base – базы данных CD. Большинство музыкальных сервисов использует эти первичные данные.

Владелец крупнейшей CDDB (собственно, сама аббревиатура является зарегистрированной торговой маркой этой компании) – американская Gracenote.

Информацией Gracenote пользуются множество программ (Winamp, Windows Media Player, iTunes) и сервисов.

Совсем недавно Gracenote была приобретена компанией Sony. На фоне фиаско музыкального интернет-проекта последней – сервиса Connect – это выглядит интересным контрходом.

Таким образом, если есть договор с хорошей CDDB, то для проверки написания от музыкальных сервисов требуется лишь создание хорошей автокорректирующей системы при введении запроса.

Если сравнивать песню с человеком, то информацию, содержащуюся в базах CDDB, можно сравнить с паспортными данными. Название композиции, альбом, компиляция или сингл, в состав которого она входит, имя исполнителя или название группы – это ее ФИО. Но нужен номер паспорта. Его роль играет уникальный идентификатор CD, с тем отличием, что он относится не к одному треку, а к их группе.

Откуда берется этот идентификатор? Так как создатели стандарта аудио-CD в свое время никак не могли планировать существования треков с CD вне самого CD, то они не предусмотрели на диске никакой идентификационной информации. Таким образом, компакт-диск по умолчанию – человек без паспорта. Его самого надо опознать.

Если продолжить аналогию с человеком, то сделать это можно по его приметам. Для CD это будет сочетание числа треков и их продолжительности. Вместе они дают достаточно уникальную картину. Так и работают CDDB – в их базах хранятся уникальные идентификаторы CD, рассчитанные на основании данных о числе, последовательности и продолжительности треков – «фоторобот» диска. Программа-клиент на ПК пользователя создает такой «фоторобот» для диска, подлежащего идентификации, соединяется через Интернет с базой и ищет в ней совпадающий по приметам диск. Подобным образом могут опознаваться как физические CD-диски, так и их сжатые в MP3 и другие форматы копии, главное, чтобы сохранилась уникальная структура.

В идеале у музыки должны быть «устанавливающие личность документы» или «особые приметы». Для композиций на носителе – CD – это уникальные параметры диска, позволяющие восстановить все данные по базам CDDB. Для оцифрованной музыки это метаданные, теги.

В реальности же все не так просто. Что делать, если трек лишен каких-либо примет? Таких ситуаций может быть немало: запись с радио, безвестный файл, выкачанный из Интернета, запись с диктофона, оцифрованная аналоговая запись.

В случае с человеком на помощь приходят отпечатки пальцев. Это работает и для песен.

Акустические отпечатки пальцев – это выжимка из цифрового аудиофайла, минимальный объем информации, по которой его можно достоверно установить. Обычно это небольшой массив данных, до 10 КБ. Принципиально, что отпечатки, содержат чисто музыкальные характеристики – ритм, окраску звучания, информацию о мелодии – и не зависят от конкретного файла, с которого получены.

Далее все делается очень похоже на технологии CDDB: программа-клиент через Интернет сверяет «скармливаемую» ей композицию с базой данных таких отпечатков. Если обнаруживается совпадение, значит, файл опознан.

В настоящее время в Интернете доступно несколько таких баз данных отпечатков.

Gracenote MusicID

Главная CDDB – Gracenote – также владеет собственной технологией акустических отпечатков пальцев, называемой MusicID. Чаще всего с ней встречаются в популярном программном плеере Winamp, который может обратиться к базе отпечатков Gracenote по запросу пользователя. Другой клиент компании – производитель мобильных телефонов Sony Ericsson, что неудивительно. В базе Gracenote содержатся акустические отпечатки более 7 миллионов композиций.

AudioID Fraunhofer

Изобретатели MP3 также разработали и свою технологию акустических отпечатков пальцев. В 2004 году они создали отдельную компанию для раскрутки этой технологии, в 2007 году для этого предприятия было выбрано название Mufin (сокращенно MUsic FINd). Пока эта технология все еще менее заметна на рынке, чем продукты главных конкурентов, Gracenote и Shazam.

Last.fm Fingerprinter

Компания с такими амбициями на рынке музыкальных услуг, как Last.fm, не может зависеть от сторонних провайдеров данных, в том числе акустических отпечатков пальцев. Поэтому Last.fm разрабатывает свою технологию, используя внушительное комьюнити как источник данных и рабочую силу. Пока технология находится в бета-версии, но компания заявляет, что ее база уже содержит свыше 10 миллионов отпечатков.

Shazam

Эта английская компания предоставляет сервис опознавания музыки для сотовых телефонов. Она владеет собственной технологией акустических отпечатков пальцев, в ее базе данных информация по более чем 4 миллионам композиций. Еще с 2002 года Shazam предлагает жителям Великобритании оригинальную услугу – позвонив по определенному номеру и поднеся трубку к источнику звука, вы немедленно получаете SMS с именем исполнителя и названием композиции, если, конечно, ее удалось распознать. Компания старается расширить свою деятельность, создав поисковую систему музыки. Кроме того, она использует данные, полученные при опознании множества песен для создания своеобразного чарта – какую музыку пользователи хотели распознать чаще всего. В настоящее время сервис Shazam доступен в 45 странах у 50 операторов для более чем 500 миллионов используемых в мире мобильных телефонов.

MusicDNS

Сравнительно недавно, в январе 2007 года, американская компания MusicIP представила свою систему опознания музыки, названную MusicDNS. Базируется она в том числе и на технологии акустических отпечатков пальцев. По заявлениям компании, в настоящее время в ее базе содержатся отпечатки не менее 26 миллионов композиций.

Помимо рекомендательных сервисов, акустические отпечатки пальцев используются и в других сферах. К примеру, для защиты интеллектуальной собственности. По отпечаткам сервис может, к примеру, определить, относится ли композиция к числу лицензированных. Это применяется на сервисах с возможностью загрузки аудиофайлов пользователем.

Порой, причем нередко, «тело» песни находится в столь печальном состоянии, что никакое снятие отпечатков пальцев невозможно. Композиция осталась лишь в памяти человека в виде обрывков мелодии, слов. Но это не значит, что ее совершенно невозможно опознать.

Сервисы, способные опознавать песни по обрывкам мотива, уже существуют, хоть и в крайне сыром состоянии. Мелодия может вводиться пользователем через некий музыкальный интерфейс, например, наэкранную клавиатуру пианино. Конечно, это потребует некой музыкальной подготовки от пользователя. Или это может быть анализ аудиоданных, к примеру, напетых в микрофон, которым сегодня оборудованы очень многие ПК. Чудес от таких систем пока ждать не следует, но эти системы распознания музыки, аналогично системам распознания речи, прогрессируют.

Изобретатель MP3 Fraunhofer также работает над системой распознавания музыки по устному вводу

Сервис midomi.com предлагает опознание музыки по устному вводу

Другая, пожалуй, более надежная система поиска, – по словам песни. Тема слов песни, Lyrics, сама по себе очень обширна. В контексте данного материала достаточно упомянуть, что в Интернете существуют базы данных слов песен, оснащенные поиском по отдельным фразам. Это хорошее подспорье в опознании композиции, особенно при качественном алгоритме поиска и, опять, системе автокоррекции ошибок.

Пример поиска по словам песни

С человеком, когда все методы опознания оказываются бессильны, прибегают к анализу ДНК. И тут нам сразу вспоминается Pandora с ее Music Genome Project. Возможно ли использовать накопленную там информацию или общий подход этой компании при опознании? Вовсе не исключено. Как анализ ДНК делается с использованием генного материала родственников, так и музыкальную композицию можно попытаться опознать по ее «родственникам» в музыкальном отношении. Ведь часто, пытаясь вспомнить ту или иную песню, мы ощущаем, что она похожа на что-то, что мы уже слышали ранее.

В идеале хотелось бы иметь возможность при «генетической экспертизе» задавать сложные запросы: «Вокал, как в такой-то песне, гитарный риф, как в такой-то, проигрыш напоминает то-то, есть еще такие-то и такие-то элементы – что это может быть?»

В итоге мы можем алгоритмизировать процесс опознания музыки и разбить его на степени сложности.

  • 1-ая степень – известно имя песни и/или автор, но неточно. Здесь вполне может помочь система автокоррекции ошибок, поиск по базам CDDB по названию - чтобы найти исполнителя или наоборот.
  • 2-ая – нет информации о песне, но есть аудиоматериал. Это запись с радио, диктофона, оцифровка аналога. Здесь на помощь придет опознание по акустическим отпечаткам пальцев.
  • 3-я степень – есть лишь отрывочный образ музыки в памяти человека - мотив, слова. Здесь подойдут различные программы опознания музыки, поиск по словам песен.
  • Наконец, 4-ая, высшая сложность – образ песни в памяти настолько смутен, что вспоминается лишь, на что она примерно похожа. Здесь можно попытаться провести «генетическую экспертизу».

Таким образом, к настоящему времени в Интернете накопилось уже достаточное количество данных и механизмов, которые можно использовать для создания мощной системы опознания музыки. Такой системы, которая помогала бы в ситуациях типа «песня крутится в голове, но никак не вспомнить какая». Дело за малым: создать подобную единую систему, придать ей удобный пользовательский интерфейс. Будучи реализованной, она стала бы мощным элементом 360-градусной музыкальной стратегии в Интернете.

Алексей Дорожин (adoro@list.ru)
Опубликовано - 01 июля 2008 г.

Есть, что добавить?! Пишите... eldar@mobile-review.com

 
Новости:

23.03.2017 Fossil представила более 300 моделей умных часов

23.03.2017 Le XiubaleR получит Helio X20 и Android 7.1.2

23.03.2017 LG Pay будет запущен в Корее в июне

23.03.2017 Casio представила версию смарт-часов Pro Trek WSD F20 с сапфировым стеклом

23.03.2017 Два смартфона Meizu с быстрой зарядкой зарегистрированы в Китае

23.03.2017 Красный iPhone оказался аномально популярным в Китае

23.03.2017 Яндекс увидел угрозу для своих «Денег» в СП Сбербанка и Alibaba

23.03.2017 Apple запустила вебсайт «Бизнес» в России

Hit

23.03.2017 Видео на канале: Обзор Huawei P10

23.03.2017 «Связной» и «Евросеть» могут объединить

23.03.2017 Panasonic представил для тайваньского рынка новый смартфон – ELUGA PURE

23.03.2017 В Карты Google возвращается возможность делиться с друзьями своим местоположением

22.03.2017 ZTE представила обновление линейки Nubia в Китае

22.03.2017 Huawei представит смартфон линейки Honor 5 апреля

22.03.2017 OPPO F3 Plus представлен официально

22.03.2017 VAIO Phone A – первый Android-смартфон бренда

22.03.2017 LG представила свою платежную систему – LG Pay

22.03.2017 ФАС согласует с Google условия мирового соглашения в течение 10 дней

22.03.2017 J’son & Partners Consulting: текущее состояние российского рынка сотовой связи и прогноз

22.03.2017 ESET: мошенники зарабатывают на любопытных пользователях WhatsApp

22.03.2017 Анонсирована следующая версия Android O

21.03.2017 Новые iPhone SE получили вдвое больше памяти

21.03.2017 В следующем iPhone может появиться камера с дополненной реальностью

21.03.2017 Samsung рассчитывает на большую популярность Galaxy S8 в Южной Корее нежели Galaxy Note7

21.03.2017 Apple представила новый планшет iPad Retina с 9,7-дюймовым дисплеем Retina

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.