podcast quotes-left quotes-right search menu arrow-up arrow-up2 google-plus3 facebook2 instagram telegram twitter vk youtube android rss2
[an error occurred while processing this directive]
AddThis Social Bookmark Button
Версия для печати

Теги в аудиофайлах

История

Ранняя история сжатого цифрового аудио довольно необычна. Форматы MP2 и MP3 разрабатывались крупными компаниями и исследовательскими институтами для своих целей, в которые распространение музыки во всемирной сети Интернет никак не входило. Но случилось так, что результат их трудов известен нам сегодня именно в этом качестве.

Они внесли основной вклад в рождение MP3: компания Philips (Голландия), Центр исследования телевещания и телекоммуникации (CCETT, Франция), Институт радиовещательной техники (IRT, Германия), Институт интегральных схем им. Фраунгофера (Fraunhofer IIS, Германия), Германский аэрокосмический центр (DLR)

То, что разработки Фраунгофер ИИС сотоварищи первоначально предназначались вовсе не для хранения и обмена музыки, быстро проявилось в ряде неудобств работы с первыми аудиоформатами. Ведь теперь MP3-файлам пришлось взаимодействовать и с человеком, а не только с программой и оборудованием. А к этой задаче формат был приспособлен слабо.

Музыка для человека – это не просто массив данных. Это произведения искусства, имеющие собственные имена, исполненные людьми и коллективами со своими именами, объединенные в альбомы, сборники, также не безымянные. Связана с ней и другая информация, которую многие хотят знать и помнить: год выпуска, например, или музыкальный жанр. В эпоху носителей все это писалось на обложке и в буклете пластинки, CD или кассеты. Но компьютерный файл в обложку не обернешь! Часть информации можно включить в состав имени файла, но мы помним, что в середине 90-х длинные имена файлов в мире IBM-совместимых ПК только отвоевывали себе место под солнцем. А в восьми символах не очень-то и разгуляешься.

Буклет аудио-CD: подробная информация о композициях, слова, фотографии (для примера взят буклет болгарского исполнителя «Авеню»)

Решение напрашивалось простое – включить всю дополнительную информацию в состав самого файла. Это не было чем-то новым: метаданные, т.е. вспомогательные данные, дополняющие и поясняющие основные, использовались человечеством на протяжении тысячелетий. Подпись художника на картине – это те же метаданные.

Метаданные являются частью файла, их можно при желании увидеть с помощью самых простейших средств, к примеру, Блокнота

Надеяться, что решением этой задачи займутся Philips или IRT, не приходилось – им никакого дела не было до неудобств немногочисленных тогда пользователей MP3. Первые метаданные появились в MP3-файлах «снизу», руками пользователей-энтузиастов. Они получили название «тегов» (tag, англ. «ярлык» или «метка») – популярное в компьютерном мире короткое обозначение метаданных.

Функции тегов в чем-то пересекаются с функциями ярлыков

С тех пор прошло уже больше 11 лет. Сегодня без метаданных не может обойтись ни один аудиоформат. Они стали куда большим, чем простая замена CD-буклета. Медиабиблиотеки, системы навигации плееров и сотовых телефонов полагаются на теги как основной элемент построения своих баз данных.

Естественно, современные теги мало похожи на первый примитивный формат метаданных, использованный в далеком 1996 году. Концепция тегов впитала в себя множество идей, связанных с повышением гибкости и информационной емкости системы. Кроме того, разновидностей самих компрессированных аудиофайлов стало гораздо больше, и каждая из распространенных имеет свою теговую систему.

Распространенные аудиоформаты

Но базовые принципы остались неизменными. Тег – это информация, содержащаяся в мультимедийном файле (пока что чаще в аудиофайле), этот файл поясняющая, комментирующая и дополняющая. Важной особенностью тега является его структурность: информация в нем не свалена в одну кучу, но четко разбита на категории, чтобы с ней было удобно работать программам (проигрывателям, каталогизаторам). Ведь мало кто из пользователей сам полезет смотреть теги внутри файла – для просмотра метаданных и на персональном компьютере, и уж тем более на портативном устройстве гораздо удобнее использовать специализированное ПО.

Одна из многочисленных программ для просмотра и редактирования тегов, Tag&Rename

Тег делится на категории по предметному признаку, для каждого понятия, описывающего файл, выделяется отдельная категория. По отдельности они также могут называться тегами, например, тег «исполнитель», тег «альбом». Таким образом, для метаданных отдельного файла допустимо именование и в единственном числе – «ID3v1 тег находится в начале файла» и во множественном – «Я заполнил теги только что сжатой песни».

В разных аудиоформатах структура тегов, название и маркировка категорий в них различна. Общим сегодня является то, что число категорий, на которые разбита информация в теге, стараются сделать достаточно большим, как говорится, на все случаи жизни. CD-буклету, чтобы вместить весь объем информации, способный храниться в современном теге, пришлось бы превратиться в многотомное издание. Правда, использование потенциальных возможностей современных тегов обычно очень далеко от 100%. И это, пожалуй, к лучшему – кому нужен тег, по объему превосходящий сами данные?

Большая советская энциклопедия может уместиться в 256 мегабайт, доступных для современных тегов, практически полностью

Современный тег может включать в себя много типов информации. Это и текст, и служебная информация в удобном для программ двоичном виде, и изображения. Четкая структура тегов позволяет хранить различные типы информации в разных категориях. Программы заранее знают, как им считывать информацию из той или иной категории, – как картинку, как текст или как-то еще.

В тегах можно найти самую различную информацию

Люди, имеющие опыт работы с базами данных, увидят в структуре тегов знакомые черты. Фактически тег медиафайла можно представить как строку в базе данных с определенным числом информационных ячеек. Это делает удобным построение на основе тегов систем управления базами данных, позволяющих пользователям быстро и легко находить свои песни и фильмы, даже если их количество в аудиовидеотеке исчисляется десятками тысяч.

Медиабиблиотека Windows Media Player (скриншот с сайта winsupersite.com)

Никто их, правда, не называет СУБД, чаще используется название медиабиблиотека. Windows Media Player и iTunes можно привести в пример как наиболее распространенных представителей подобного ПО. Схожую функциональность предлагает и внутреннее ПО многих плееров, Apple iPod, Sony Network Walkman, Creative Zen являются здесь яркими представителями.

Обычно теги можно разделить на две группы – служебные, о которых пользователю, по идее, и знать не нужно, и информационные. Служебные теги, наподобие различных уникальных идентификаторов, создаются для нужд ПО. Информационные содержат информацию, важную для пользователя, это всем известные исполнитель, альбом и т.п.

Практическое использование

Сегодня метаданные аудиофайлов имеют две основные сферы применения.

Первая сфера – предоставление информации. Из тегов пользователь может узнать о своей записи много нового. Метаданные выступают здесь в уже упомянутой роли замены CD-буклета.

Из нескольких наиболее распространенных тегов самый обширный список категорий, а следовательно, самую полную информацию дает ID3v2 тег, применяющийся, как правило, в MP3-файлах. Но другие типы тегов содержат в себе категории, которых этот формат лишен, следовательно, назвать ID3v2 идеальным все же нельзя.

А некоторые типы тегов и вовсе позволяют создавать практически неограниченное количество категорий, давая возможность довести информационную насыщенность тега до максимальной. Но в результате значительный груз забот ложится на плечи конечного пользователя.

В любом случае, все типы современных тегов в теории предоставляют широкие возможности пользователю. Встает вопрос: с чем же мы сталкиваемся на практике? Наиболее распространены такие ситуации:

  • Вы приобрели аудиофайл в интернет-магазине с уже проставленными тегами.
  • Вы сжимаете аудио-CD. Здесь у вас есть выбор – проставить теги вручную или воспользоваться сервисами наподобие Gracenote. Последние способны идентифицировать CD-диск, найти его в своей базе данных и автоматически проставить теги в сжимаемом файле.
  • Наконец, вы можете получить файл из не вполне легального источника. Например, выкачать из P2P-сети, купить пиратский CD-MP3-диск. В любом случае, создатели этих контрафактных файлов должны были воспользоваться одним из двух вышеперечисленных способов для его получения.

Наиболее распространенные пути попадания сжатых аудиофайлов потребителю (использованы изображения с ergosign.de и ogoniok.com)

Вне зависимости от того, какой источник использовался, приходится констатировать, что то, что красиво звучит в спецификациях, увы, не столь впечатляюще в реальности. К сожалению, возможности метаданных в аудиофайлах не используются сегодня и наполовину. Да, теги наподобие «исполнитель», «альбом», «название» заполнены почти всегда даже в контрафактных треках. Номер трека в альбоме, год выпуска тоже попадаются. У честно купленных или сжатых с обращением к интернет-базам композиций попадается и Album Art. Но этим все обычно и ограничивается. Такие позиции, как темп, настроение, всевозможные ссылки, комментарии, слова песни в большинстве случаев остаются незаполненными даже в легально приобретенных файлах.

Advanced Tag Editor открыл WMA-файл, сжатый Window Media Player с audio-CD с обращением к Gracenote: большая часть тегов удручающе пусты

Тот же трек сжат с помощью iTunes – аналогичная картина

Также нередки противоречия между источниками, какую информацию вносить в тот или иной тег. Особенно это характерно для нелегального контента – здесь часты разночтения даже в таких пунктах, как название композиции или исполнителя. Если бы звукозаписывающие компании выпускали официальные образцы заполнения тегов выпускаемых композиций для всех пяти распространенных форматов, это могло бы серьезно помочь, но, к сожалению, этого не происходит. Приходится иметь дело с базами данных наподобие Gracenote, которые, хотя и сотрудничают с лейблами, предлагают довольно узкий ассортимент информации. К примеру, та же Gracenote начала ограниченно предлагать слова песен только с апреля 2007 года.

Все это серьезно снижает эффективность использования тегов. В программах наподобие Windows Media Player большая часть места, предлагаемого под информацию о проигрываемом треке, обычно остается незаполненным. Хотя нельзя сказать, чтобы такие проигрыватели пытались рассказать о песне так уж много: доступ к значительной части информации, которая может содержаться в тегах, возможен лишь через дебри меню.

Windows Media Player способен показать значительный объем информации о композиции во время проигрывания. К сожалению, в большинстве случаев все это место остается пустым.

Второе применение тегов – служебное. Программы – медиабиблиотеки – используют их как атрибуты при создании баз данных контента.

Теги как атрибуты в медиабиблиотеке iTunes

Многие современные медиапроигрыватели содержат функциональность медиабиблиотеки и используют простейшие механизмы СУБД в интерфейсе. Таким образом, в таких задачах, как поиск песен, составление различных списков композиций, теги используются самым интенсивным образом. Как пример использования подобного инструментария можно привести iTunes с его «умными» плей-листами, представляющими собой фактически сложные запросы к базе данных с использованием тегов как атрибутов.

Сложный запрос «умного» плей-листа iTunes поможет создать список проигрывания по вашему вкусу

В MP3-плеерах повышенной емкости базы данных на основе тегов используются еще с 1999 года.

Compaq/Hango Personal Jukebox – вероятно, первый MP3-плеер с базой данных на основе медиатегов (фото с сайта pc.watch.impress.co.jp)

Хотя существует альтернатива – стандартная файловая система с файлами и папками, базы на основе тегов пользуются все большей популярностью, особенно в продуктах, ориентированных на американский рынок.

iriver, Samsung, Creative, Sandisk – лишь некоторые из производителей, использующих базы данных по тегам в своих плеерах

Структура подобной базы данных обычно достаточно схожа у разных производителей. В качестве классифицирующих атрибутов обычно используются:

  • Название композиции
  • Альбом
  • Исполнитель
  • Жанр
  • Рейтинг

В основе музыкальной библиотеки iPod – метаданные (фото с сайта askdavetaylor.com)

Могут использоваться и некоторые другие категории, такие, как год выпуска, композитор. Кроме информации, входящей в теги, могут использоваться и данные из других источников, к примеру, базы данных медиабиблиотеки на ПК или плеере. В частности, отсюда могут браться атрибуты наподобие времени загрузки файла на плеер или количества проигрываний этого файла на ПК.

Потенциально теги являются очень хорошим источником атрибутов для базы медиаданных. В реальности же нас подстерегают все те же проблемы – для нормальной работы необходимо, чтобы все теги были проставлены четко, без расхождений, во всех файлах. В условиях, когда среднестатистический пользователь имеет в своей коллекции треки из самых разнообразных и не всегда легальных источников, это обычно недостижимо. И хотя существует немало программных продуктов, предназначенных для работы с тегами, этот самый пользователь едва ли возьмет на себя труд приведения всей своей коллекции в порядок. В результате работа с базами, основанными на тегах, получается далеко не такой комфортной, какой задумывалась. Одним из следствий этого является неувядающая популярность плееров, использующих в качестве структуры медиабиблиотеки стандартную файловую систему компьютера.

Будущее

Не приходится сомневаться, что роль медиаметаданных как важнейшего инструмента в мультимедиа-инфраструктуре будет только возрастать. Метаданные Microsoft Windows Media metadata и Apple iTunes tag уже являются тегами двойного назначения, применяемыми как для аудио, так и для видео. Медиатеги активно используются онлайн-сервисами, аудио, фото и видео. Большинство мультимедиа-устройств нового поколения используют базы медиаданных, построенные на основе тегов.

Всюду, где есть мультимедиа, мы видим теги или их родственников. Пример – категории видео на youtube.com

В будущем мы надеемся на дальнейшее развитие метаданных. Идеи open-source-тегов – сочетание богатого набора рекомендованных категорий и возможности создавать свои, произвольные – заслуживают использования и в метаданных «первой тройки»: MP3, Microsoft и Apple. Желательно появление удобных и функциональных и при этом доступных для рядового пользователя средств редактирования тегов, с лучшей и более функциональной интеграцией с базами данных в Интернете. Ожидаем увидеть больше мощных и гибких инструментов, основанных на метаданных, наподобие тех же «умных» плей-листов, но использующих больший набор атрибутов, в том числе произвольных, и более удобных в использовании.

Важным вопросом является и стандартизация тегов. Хотя бы для трех наиболее распространенных форматов хотелось бы более активного участия в создании метаданных музыкальных лейблов и даже самих исполнителей. В их руках теги могут стать дополнительными инструментами для творчества, средствами для обратной связи с поклонниками, использоваться для анонсов и промоушена. Хотя злоупотребления последним и превращения тегов в рекламный носитель, конечно, хотелось бы избежать.

Такого вот в тегах лучше, чтобы было поменьше

Проигрыватели, как компьютерные, так и портативные, также не должны отставать. Было бы хорошо, если бы в будущем пользователь мог получать как можно более полную информацию о песне или аудиокниге во время ее прослушивания, причем в изящной и ненавязчивой манере. Не повредит здесь и сотрудничество с онлайн-энциклопедиями – для интересующихся теги могут стать мостиками в историю музыки и литературы.

Теги могут объединять развлекательные и познавательные ресурсы Интернета, как обычные, так и user-generated

Еще одна тенденция, менее радостная для наиболее технически подкованной аудитории, – падение информационной прозрачности в этой области. Производители резонно полагают, что новое поколение потребителей не хочет забивать себе головы такими понятиями, как теги и метаданные. Популярные программы Windows Media Player и iTunes организованы так, чтобы упоминать эти слова не было необходимости.

iTunes показывает информацию о композиции, не употребляя терминов «тег» и «метаданные»

Скорее всего, в будущем понятие тега окончательно уйдет в область технических терминов, понятных только специалисту. Обычные пользователи не будут задумываться, откуда же берется вся эта информация о музыкальной композиции или фильме, для них все это будет частью единого целого.

С одной стороны, для простой публики такой вариант, безусловно, будет удобнее, с другой – доступ к технической информации для более любознательных будет затруднен. А хотелось бы, чтобы производители не забывали об этой небольшой, но авторитетной части целевой аудитории, которая сама создала самые первые медиатеги и всегда будет помнить, что это такое и для чего они нужны.

Алексей Дорожин (adoro@list.ru)
Опубликовано - 31 июля 2007 г.

Есть, что добавить?! Пишите... eldar@mobile-review.com

 
Новости:

24.03.2017 ZTE потерпела убытки в 4 квартале из-за штрафа в США

24.03.2017 Цены и варианты Xaiomi Mi 6 и Mi 6 Plus попали в сеть

24.03.2017 В сервисе Google Авиабилеты для России теперь можно планировать поездки и на поезде

24.03.2017 Samsung продемонстрировал концепты умных часов на базе Gear S3

24.03.2017 Meizu M621C-S прошел сертификацию TENAA

24.03.2017 EZVIZ представила на российском рынке полнофункциональную систему «умный дом»

24.03.2017 Флагман Nokia получит сдвоенную камеру с оптикой Carl Zeiss

Hit

24.03.2017 Видео на канале: Обзор смартфона 4Good R407

24.03.2017 В России представлены игровые ноутбуки Lenovo Legion Y520 и Legion Y720

24.03.2017 Google избавит Hangouts от поддержки SMS

24.03.2017 Panasonic сделает крупного испанского разработчика автомобильных систем своей дочерней компанией

23.03.2017 Fossil представила более 300 моделей умных часов

23.03.2017 Le XiubaleR получит Helio X20 и Android 7.1.2

23.03.2017 LG Pay будет запущен в Корее в июне

23.03.2017 Casio представила версию смарт-часов Pro Trek WSD F20 с сапфировым стеклом

23.03.2017 Два смартфона Meizu с быстрой зарядкой зарегистрированы в Китае

23.03.2017 Красный iPhone оказался аномально популярным в Китае

23.03.2017 Яндекс увидел угрозу для своих «Денег» в СП Сбербанка и Alibaba

23.03.2017 Apple запустила вебсайт «Бизнес» в России

Hit

23.03.2017 Видео на канале: Обзор Huawei P10

23.03.2017 «Связной» и «Евросеть» могут объединить

23.03.2017 Panasonic представил для тайваньского рынка новый смартфон – ELUGA PURE

23.03.2017 В Карты Google возвращается возможность делиться с друзьями своим местоположением

22.03.2017 ZTE представила обновление линейки Nubia в Китае

22.03.2017 Huawei представит смартфон линейки Honor 5 апреля

Подписка
 
© Mobile-review.com, 2002-2017. All rights reserved.