[an error occurred while processing this directive]
AddThis Social Bookmark Button
Версия для печати

Теги в аудиофайлах

История

Ранняя история сжатого цифрового аудио довольно необычна. Форматы MP2 и MP3 разрабатывались крупными компаниями и исследовательскими институтами для своих целей, в которые распространение музыки во всемирной сети Интернет никак не входило. Но случилось так, что результат их трудов известен нам сегодня именно в этом качестве.

Они внесли основной вклад в рождение MP3: компания Philips (Голландия), Центр исследования телевещания и телекоммуникации (CCETT, Франция), Институт радиовещательной техники (IRT, Германия), Институт интегральных схем им. Фраунгофера (Fraunhofer IIS, Германия), Германский аэрокосмический центр (DLR)

То, что разработки Фраунгофер ИИС сотоварищи первоначально предназначались вовсе не для хранения и обмена музыки, быстро проявилось в ряде неудобств работы с первыми аудиоформатами. Ведь теперь MP3-файлам пришлось взаимодействовать и с человеком, а не только с программой и оборудованием. А к этой задаче формат был приспособлен слабо.

Музыка для человека – это не просто массив данных. Это произведения искусства, имеющие собственные имена, исполненные людьми и коллективами со своими именами, объединенные в альбомы, сборники, также не безымянные. Связана с ней и другая информация, которую многие хотят знать и помнить: год выпуска, например, или музыкальный жанр. В эпоху носителей все это писалось на обложке и в буклете пластинки, CD или кассеты. Но компьютерный файл в обложку не обернешь! Часть информации можно включить в состав имени файла, но мы помним, что в середине 90-х длинные имена файлов в мире IBM-совместимых ПК только отвоевывали себе место под солнцем. А в восьми символах не очень-то и разгуляешься.

Буклет аудио-CD: подробная информация о композициях, слова, фотографии (для примера взят буклет болгарского исполнителя «Авеню»)

Решение напрашивалось простое – включить всю дополнительную информацию в состав самого файла. Это не было чем-то новым: метаданные, т.е. вспомогательные данные, дополняющие и поясняющие основные, использовались человечеством на протяжении тысячелетий. Подпись художника на картине – это те же метаданные.

Метаданные являются частью файла, их можно при желании увидеть с помощью самых простейших средств, к примеру, Блокнота

Надеяться, что решением этой задачи займутся Philips или IRT, не приходилось – им никакого дела не было до неудобств немногочисленных тогда пользователей MP3. Первые метаданные появились в MP3-файлах «снизу», руками пользователей-энтузиастов. Они получили название «тегов» (tag, англ. «ярлык» или «метка») – популярное в компьютерном мире короткое обозначение метаданных.

Функции тегов в чем-то пересекаются с функциями ярлыков

С тех пор прошло уже больше 11 лет. Сегодня без метаданных не может обойтись ни один аудиоформат. Они стали куда большим, чем простая замена CD-буклета. Медиабиблиотеки, системы навигации плееров и сотовых телефонов полагаются на теги как основной элемент построения своих баз данных.

Естественно, современные теги мало похожи на первый примитивный формат метаданных, использованный в далеком 1996 году. Концепция тегов впитала в себя множество идей, связанных с повышением гибкости и информационной емкости системы. Кроме того, разновидностей самих компрессированных аудиофайлов стало гораздо больше, и каждая из распространенных имеет свою теговую систему.

Распространенные аудиоформаты

Но базовые принципы остались неизменными. Тег – это информация, содержащаяся в мультимедийном файле (пока что чаще в аудиофайле), этот файл поясняющая, комментирующая и дополняющая. Важной особенностью тега является его структурность: информация в нем не свалена в одну кучу, но четко разбита на категории, чтобы с ней было удобно работать программам (проигрывателям, каталогизаторам). Ведь мало кто из пользователей сам полезет смотреть теги внутри файла – для просмотра метаданных и на персональном компьютере, и уж тем более на портативном устройстве гораздо удобнее использовать специализированное ПО.

Одна из многочисленных программ для просмотра и редактирования тегов, Tag&Rename

Тег делится на категории по предметному признаку, для каждого понятия, описывающего файл, выделяется отдельная категория. По отдельности они также могут называться тегами, например, тег «исполнитель», тег «альбом». Таким образом, для метаданных отдельного файла допустимо именование и в единственном числе – «ID3v1 тег находится в начале файла» и во множественном – «Я заполнил теги только что сжатой песни».

В разных аудиоформатах структура тегов, название и маркировка категорий в них различна. Общим сегодня является то, что число категорий, на которые разбита информация в теге, стараются сделать достаточно большим, как говорится, на все случаи жизни. CD-буклету, чтобы вместить весь объем информации, способный храниться в современном теге, пришлось бы превратиться в многотомное издание. Правда, использование потенциальных возможностей современных тегов обычно очень далеко от 100%. И это, пожалуй, к лучшему – кому нужен тег, по объему превосходящий сами данные?

Большая советская энциклопедия может уместиться в 256 мегабайт, доступных для современных тегов, практически полностью

Современный тег может включать в себя много типов информации. Это и текст, и служебная информация в удобном для программ двоичном виде, и изображения. Четкая структура тегов позволяет хранить различные типы информации в разных категориях. Программы заранее знают, как им считывать информацию из той или иной категории, – как картинку, как текст или как-то еще.

В тегах можно найти самую различную информацию

Люди, имеющие опыт работы с базами данных, увидят в структуре тегов знакомые черты. Фактически тег медиафайла можно представить как строку в базе данных с определенным числом информационных ячеек. Это делает удобным построение на основе тегов систем управления базами данных, позволяющих пользователям быстро и легко находить свои песни и фильмы, даже если их количество в аудиовидеотеке исчисляется десятками тысяч.

Медиабиблиотека Windows Media Player (скриншот с сайта winsupersite.com)

Никто их, правда, не называет СУБД, чаще используется название медиабиблиотека. Windows Media Player и iTunes можно привести в пример как наиболее распространенных представителей подобного ПО. Схожую функциональность предлагает и внутреннее ПО многих плееров, Apple iPod, Sony Network Walkman, Creative Zen являются здесь яркими представителями.

Обычно теги можно разделить на две группы – служебные, о которых пользователю, по идее, и знать не нужно, и информационные. Служебные теги, наподобие различных уникальных идентификаторов, создаются для нужд ПО. Информационные содержат информацию, важную для пользователя, это всем известные исполнитель, альбом и т.п.

Практическое использование

Сегодня метаданные аудиофайлов имеют две основные сферы применения.

Первая сфера – предоставление информации. Из тегов пользователь может узнать о своей записи много нового. Метаданные выступают здесь в уже упомянутой роли замены CD-буклета.

Из нескольких наиболее распространенных тегов самый обширный список категорий, а следовательно, самую полную информацию дает ID3v2 тег, применяющийся, как правило, в MP3-файлах. Но другие типы тегов содержат в себе категории, которых этот формат лишен, следовательно, назвать ID3v2 идеальным все же нельзя.

А некоторые типы тегов и вовсе позволяют создавать практически неограниченное количество категорий, давая возможность довести информационную насыщенность тега до максимальной. Но в результате значительный груз забот ложится на плечи конечного пользователя.

В любом случае, все типы современных тегов в теории предоставляют широкие возможности пользователю. Встает вопрос: с чем же мы сталкиваемся на практике? Наиболее распространены такие ситуации:

  • Вы приобрели аудиофайл в интернет-магазине с уже проставленными тегами.
  • Вы сжимаете аудио-CD. Здесь у вас есть выбор – проставить теги вручную или воспользоваться сервисами наподобие Gracenote. Последние способны идентифицировать CD-диск, найти его в своей базе данных и автоматически проставить теги в сжимаемом файле.
  • Наконец, вы можете получить файл из не вполне легального источника. Например, выкачать из P2P-сети, купить пиратский CD-MP3-диск. В любом случае, создатели этих контрафактных файлов должны были воспользоваться одним из двух вышеперечисленных способов для его получения.

Наиболее распространенные пути попадания сжатых аудиофайлов потребителю (использованы изображения с ergosign.de и ogoniok.com)

Вне зависимости от того, какой источник использовался, приходится констатировать, что то, что красиво звучит в спецификациях, увы, не столь впечатляюще в реальности. К сожалению, возможности метаданных в аудиофайлах не используются сегодня и наполовину. Да, теги наподобие «исполнитель», «альбом», «название» заполнены почти всегда даже в контрафактных треках. Номер трека в альбоме, год выпуска тоже попадаются. У честно купленных или сжатых с обращением к интернет-базам композиций попадается и Album Art. Но этим все обычно и ограничивается. Такие позиции, как темп, настроение, всевозможные ссылки, комментарии, слова песни в большинстве случаев остаются незаполненными даже в легально приобретенных файлах.

Advanced Tag Editor открыл WMA-файл, сжатый Window Media Player с audio-CD с обращением к Gracenote: большая часть тегов удручающе пусты

Тот же трек сжат с помощью iTunes – аналогичная картина

Также нередки противоречия между источниками, какую информацию вносить в тот или иной тег. Особенно это характерно для нелегального контента – здесь часты разночтения даже в таких пунктах, как название композиции или исполнителя. Если бы звукозаписывающие компании выпускали официальные образцы заполнения тегов выпускаемых композиций для всех пяти распространенных форматов, это могло бы серьезно помочь, но, к сожалению, этого не происходит. Приходится иметь дело с базами данных наподобие Gracenote, которые, хотя и сотрудничают с лейблами, предлагают довольно узкий ассортимент информации. К примеру, та же Gracenote начала ограниченно предлагать слова песен только с апреля 2007 года.

Все это серьезно снижает эффективность использования тегов. В программах наподобие Windows Media Player большая часть места, предлагаемого под информацию о проигрываемом треке, обычно остается незаполненным. Хотя нельзя сказать, чтобы такие проигрыватели пытались рассказать о песне так уж много: доступ к значительной части информации, которая может содержаться в тегах, возможен лишь через дебри меню.

Windows Media Player способен показать значительный объем информации о композиции во время проигрывания. К сожалению, в большинстве случаев все это место остается пустым.

Второе применение тегов – служебное. Программы – медиабиблиотеки – используют их как атрибуты при создании баз данных контента.

Теги как атрибуты в медиабиблиотеке iTunes

Многие современные медиапроигрыватели содержат функциональность медиабиблиотеки и используют простейшие механизмы СУБД в интерфейсе. Таким образом, в таких задачах, как поиск песен, составление различных списков композиций, теги используются самым интенсивным образом. Как пример использования подобного инструментария можно привести iTunes с его «умными» плей-листами, представляющими собой фактически сложные запросы к базе данных с использованием тегов как атрибутов.

Сложный запрос «умного» плей-листа iTunes поможет создать список проигрывания по вашему вкусу

В MP3-плеерах повышенной емкости базы данных на основе тегов используются еще с 1999 года.

Compaq/Hango Personal Jukebox – вероятно, первый MP3-плеер с базой данных на основе медиатегов (фото с сайта pc.watch.impress.co.jp)

Хотя существует альтернатива – стандартная файловая система с файлами и папками, базы на основе тегов пользуются все большей популярностью, особенно в продуктах, ориентированных на американский рынок.

iriver, Samsung, Creative, Sandisk – лишь некоторые из производителей, использующих базы данных по тегам в своих плеерах

Структура подобной базы данных обычно достаточно схожа у разных производителей. В качестве классифицирующих атрибутов обычно используются:

  • Название композиции
  • Альбом
  • Исполнитель
  • Жанр
  • Рейтинг

В основе музыкальной библиотеки iPod – метаданные (фото с сайта askdavetaylor.com)

Могут использоваться и некоторые другие категории, такие, как год выпуска, композитор. Кроме информации, входящей в теги, могут использоваться и данные из других источников, к примеру, базы данных медиабиблиотеки на ПК или плеере. В частности, отсюда могут браться атрибуты наподобие времени загрузки файла на плеер или количества проигрываний этого файла на ПК.

Потенциально теги являются очень хорошим источником атрибутов для базы медиаданных. В реальности же нас подстерегают все те же проблемы – для нормальной работы необходимо, чтобы все теги были проставлены четко, без расхождений, во всех файлах. В условиях, когда среднестатистический пользователь имеет в своей коллекции треки из самых разнообразных и не всегда легальных источников, это обычно недостижимо. И хотя существует немало программных продуктов, предназначенных для работы с тегами, этот самый пользователь едва ли возьмет на себя труд приведения всей своей коллекции в порядок. В результате работа с базами, основанными на тегах, получается далеко не такой комфортной, какой задумывалась. Одним из следствий этого является неувядающая популярность плееров, использующих в качестве структуры медиабиблиотеки стандартную файловую систему компьютера.

Будущее

Не приходится сомневаться, что роль медиаметаданных как важнейшего инструмента в мультимедиа-инфраструктуре будет только возрастать. Метаданные Microsoft Windows Media metadata и Apple iTunes tag уже являются тегами двойного назначения, применяемыми как для аудио, так и для видео. Медиатеги активно используются онлайн-сервисами, аудио, фото и видео. Большинство мультимедиа-устройств нового поколения используют базы медиаданных, построенные на основе тегов.

Всюду, где есть мультимедиа, мы видим теги или их родственников. Пример – категории видео на youtube.com

В будущем мы надеемся на дальнейшее развитие метаданных. Идеи open-source-тегов – сочетание богатого набора рекомендованных категорий и возможности создавать свои, произвольные – заслуживают использования и в метаданных «первой тройки»: MP3, Microsoft и Apple. Желательно появление удобных и функциональных и при этом доступных для рядового пользователя средств редактирования тегов, с лучшей и более функциональной интеграцией с базами данных в Интернете. Ожидаем увидеть больше мощных и гибких инструментов, основанных на метаданных, наподобие тех же «умных» плей-листов, но использующих больший набор атрибутов, в том числе произвольных, и более удобных в использовании.

Важным вопросом является и стандартизация тегов. Хотя бы для трех наиболее распространенных форматов хотелось бы более активного участия в создании метаданных музыкальных лейблов и даже самих исполнителей. В их руках теги могут стать дополнительными инструментами для творчества, средствами для обратной связи с поклонниками, использоваться для анонсов и промоушена. Хотя злоупотребления последним и превращения тегов в рекламный носитель, конечно, хотелось бы избежать.

Такого вот в тегах лучше, чтобы было поменьше

Проигрыватели, как компьютерные, так и портативные, также не должны отставать. Было бы хорошо, если бы в будущем пользователь мог получать как можно более полную информацию о песне или аудиокниге во время ее прослушивания, причем в изящной и ненавязчивой манере. Не повредит здесь и сотрудничество с онлайн-энциклопедиями – для интересующихся теги могут стать мостиками в историю музыки и литературы.

Теги могут объединять развлекательные и познавательные ресурсы Интернета, как обычные, так и user-generated

Еще одна тенденция, менее радостная для наиболее технически подкованной аудитории, – падение информационной прозрачности в этой области. Производители резонно полагают, что новое поколение потребителей не хочет забивать себе головы такими понятиями, как теги и метаданные. Популярные программы Windows Media Player и iTunes организованы так, чтобы упоминать эти слова не было необходимости.

iTunes показывает информацию о композиции, не употребляя терминов «тег» и «метаданные»

Скорее всего, в будущем понятие тега окончательно уйдет в область технических терминов, понятных только специалисту. Обычные пользователи не будут задумываться, откуда же берется вся эта информация о музыкальной композиции или фильме, для них все это будет частью единого целого.

С одной стороны, для простой публики такой вариант, безусловно, будет удобнее, с другой – доступ к технической информации для более любознательных будет затруднен. А хотелось бы, чтобы производители не забывали об этой небольшой, но авторитетной части целевой аудитории, которая сама создала самые первые медиатеги и всегда будет помнить, что это такое и для чего они нужны.

Алексей Дорожин ([email protected])
Опубликовано - 31 июля 2007 г.

Есть, что добавить?! Пишите... [email protected]

 
Новости:

13.05.2021 MediaTek представила предфлагманский чипсет Dimensity 900 5G

13.05.2021 Cайты, имеющие 500 тысяч пользователей из России, должны будут открыть местные филиалы

13.05.2021 Amazon представила обновления своих умных дисплеев Echo Show 8 и Echo Show 5

13.05.2021 МТС ввел удобный тариф без абонентской платы - «МТС Нон-стоп»

13.05.2021 Zenfone 8 Flip – вариант Galaxy A80 от ASUS

13.05.2021 Поставки мониторов в этом году достигнут 150 млн

13.05.2021 Состоялся анонс модной версии «умных» часов Samsung Galaxy Watch3 TOUS

13.05.2021 Tele2 выходит на Яндекс.Маркет

13.05.2021 OPPO представила чехол для смартфона, позволяющий управлять устройствами умного дома

13.05.2021 TWS-наушники с активным шумоподавлением Xiaomi FlipBuds Pro

13.05.2021 В России до конца следующего года появится госстандарт для искусственного интеллекта

13.05.2021 ASUS Zenfone 8 – компактный флагман на Snapdragon 888

12.05.2021 Компания Genesis представила внешность своего первого универсала G70 Shooting Brake

12.05.2021 В России разработан высокоточный гироскоп для беспилотников

12.05.2021 В Россию привезли новую версию смарт-часов HUAWEI WATCH FIT, Elegant Edition

12.05.2021 Раскрыты ключевые особенности смартфона POCO M3 Pro 5G

12.05.2021 Honor 50: стали известны дизайн и другие подробности о смартфоне

12.05.2021 Чипсет Exynos 2200 от Samsung будет устанавливаться и в смартфоны, и в ноутбуки

12.05.2021 МТС начала подключать многоквартирные дома к интернету вещей

12.05.2021 iPhone 13 будет толще и получит более крупные камеры по сравнению с iPhone 12

12.05.2021 Xiaomi договорилась с властями США об исключении из чёрного списка

12.05.2021 Xiaomi выпустила обновлённую версию умного пульта Agara Cube T1 Pro

Hit

12.05.2021 Игровые ноутбуки с NVIDIA GeForce RTX 3050 Ti уже в России!

12.05.2021 Индийский завод Foxconn сократил производство в два раза

12.05.2021 Lenovo отказалась от очного участия в предстоящем в июне Mobile World Congress

Подписка
 
© Mobile-review.com, 2002-2021. All rights reserved.