От русского переводчика: NewsML - один из самых распространенных XML-стандартов обмена новостной информацией от International Press Telecommunications Council (IPTC - Совет Телекоммуникации Международной Прессы, Великобритания). Стандарт разработан давно (2000 г.), активно развивается и продвигается. Но на русском языке до сих пор доступны только новостные сообщения о нем и разрозненные (как правило безответные) вопросы на форумах. Это побудило меня перевести данную статью с www.newsml.org, которая, разумеется, недостаточна для работы с NewsML, но дает развернутый ответ на вопрос о том, что такое NewsML. В конец добавил перевод еще одной странички (Спецификация) с того же сайта. - Это для тех, кто захочет копать дальше. Надеюсь, что мой труд не окажется бесполезным.
Дмитрий Скоробогатов
В 1999 IPTC начала работу "над XML-стандартом представления и управления новостями в ходе всего их жизненного цикла, включая производство, обмен, и использование потребителем". Через год, после того как были определены требования, в октябре 2000 IPTC одобрила спецификацию NewsML 1.0.
NewsML оказался устойчивым продуктом: начиная с введения стандарта, он был модифицирован всего два раза, текущая версия - 1.2 с октября 2003.
Охваченные требования:
Поддержка представления электронных объектов новостей типа статьи, части статьи, совокупности статей, отношения между статьями и метаданных, связанных со статьями.
Новости можно поставлять как отдельно, так и в пакетах из нескольких связанных элементов, и должны иметь метаданные, облегчающие создание, поставку, и использование (включая сортировку и поиск).
Использоваться в течение всего жизненного цикла новостей.
Стандарт, вероятно, будет использоваться в основном для обмена новостями, но в то же время он может быть применен и к созданию, и к управлению и публикации новостей в связанных в сеть системах, и для архивных приложений.
Позволять статьям состоять из произвольных смесей медиа-типов, языков и кодировок.
Пакеты новостей могут состоять из различных типов содержания - текстов, изображений, видео, аудио - все из которых должны обрабатываются одинаково. Одна и та же статья может существовать во множестве различных форм, в переводах текста на различные языки и может быть визуализирована в альтернативных форматах.
Быть используемым в качестве замены или позволять транспортировку из всех существующих форматов новостей и кодировок.
Надеемся, что NewsML постепенно заменит старые форматы обмена новостей - такие как Модель информационного обмена IIM. Однако там, где другие форматы исполняют различные специфические функции (подобно Индустриальному текстовому формату Новостей - NITF - с его возможностями форматирования), должна существовать возможность включать их как отдельные элементы в пределах NewsML.
Поддержка множества различных физических конструкций одних и тех же данных. В зависимости от пользовательских требований и систем поставки и использования, может возникнуть потребность представлять один и тот же новостной контент различными способами.
Некоторые пользователи желают непосредственно получать весь вывод провайдеров, а другие предпочитают получать уведомления о доступности (с описанием содержания) и затем запрашивать статью, которую захотят использовать.
Поддержка управления и модификации статей спустя какое-то время.
Новости часто развиваются постепенно, так что есть потребность модифицировать их, добавлять к ним, или заменять на более ранние версии. Статьи не могут быть доступны одновременно в различных СМИ, так что, вероятно, необходимо согласовывать их друг с другом.
Легкая расширяемость и гибкость.
Требования склонны изменяться, поскольку рынки развиваются. Установленная структура может быстро устареть. Кроме того, отдельные пользователи могут пожелать добавить собственные особенности и расширения.
Учет идентификации и подписи содержания статей и метаданных.
Значение новостного контента, и связанных с ним метаданных, зависит от их достоверности.
Не быть чрезмерно многословным.
Объемы передаваемой информации постоянно возрастают во всех областях новостной индустрии, и потребность в них продолжает расти, так что есть смысл позаботиться о минимизации накладных расходов (если удовлетворены другие требования). NewsML должен быть удобен для использования в отправляющих и получающих системах.
Использование XML и других соответствующих стандартов и рекомендаций.
Принятие XML позволяет основываться на проверенной и быстро развивающейся технологии, и будет способствовать более широкому распространению стандарта в информационной промышленности. Так как XML теперь хорошо поддерживается программными инструментальными средствами, то и компетентная поддержка стандарта должна быть общедоступна.
Структура NewsML
Цель NewsML - представление и управление новостями в ходе всего их жизненного цикла. В то же время стандарт был разработан достаточно гибко и предусматривает расширения, чтобы удовлетворить индивидуальные потребности пользователей. Это неизбежно привело к довольно сложной и слоистой структуре, которая может казаться трудной для понимания. Однако нет никакой необходимости использовать все особенности стандарта. Его основная логика проста и позволяет относительно простые решения для, скажем, обработки текста.
NewsML имеет форму документа XML. Он содержит последовательность компонентов, или элементов, которые используются, чтобы структурировать и обрабатывать новостной контент. Эти элементы могут иметь атрибуты, определяющие их свойства, и могут нести содержание в форме вложенных элементов и/или символьные данные или внешние ссылки.
Новостные метаданные
Эффективное использование метаданных - ключевая особенность NewsML, и значительные усилия было приложены к развитию основного набора метаданных. В эту работу был вовлечен существенный интеллектуальный капитал, представленный ранее в стандартах IIM (Модель информационного обмена) и NITF (Индустриальный текстовый формат Новостей), которые, однако, были существенно улучшены и расширены средствами XML.
Согласно замыслу метаданные в NewsML предполагается указывать по возможности близко к элементу, который они описывают, причем большая часть метаданных является опциональной.
На самом низком уровне, какой только может содержать новостные данные, - "ContentItem" - можно добавлять атрибуты, описывающие физические характеристики представления новостей.
В следующем более высоком уровне - "NewsComponent" - можно добавить метаданные следующих типов:
AdministrativeMetadata описывает происхождение NewsItem и включает имя файла. Провайдер и создатель новостного объекта могут быть идентифицированы, вместе с источником информации. Кроме того, была создана возможность для идентификации синдицированных элементов. Элемент Property (Свойство) позволяет указать любое другое административное методанное, которое может потребоваться для каких-нибудь приложений.
RightsMetadata описывает копирайт на NewsComponent и включает подробности любых прав использования, которые владелец авторского права предоставил другим сторонам. Эта информация дается (если дается) в текстовой форме и дополнительно может содержать ссылки на машинный обработчик данных.
DescriptiveMetadata используется, чтобы описать содержимое NewsItem в определенных терминах: Language (Язык), Genre (Жанр, - сущность NewsItem. Например: Current - Текущий, Analysis - Анализ, Forecast - Прогноз, Interview - Интервью, Retrospective - Ретроспектива), OfInterestTo (целевая аудитория) и TopicOccurence (распространение темы). Также содержит элемент Property (Свойство) - которое позволяет включать любое другое описательное методанное, необходимое для определенного приложения.
NewsLines можно представить как удобочитаемое представление некоторых метаданных. Они вообще имеют свойство быть как машиночитаемыми так и человекочитаемыми. Они применимы к различным типам медиа, имеют определенную уместность к новостям и пригодны для печати. Широко используемыми примерами NewsLines являются следующие элементы: HeadLine, SubHeadlines, ByLine, Date-Line, CreditLine, CopyrightLine, RightsLine, SeriesLine, SlugLine и KeywordLine. Использование этих NewsLines является опциональным, и каждый NewsLine может быть только однажды включен в NewsComponent.
Управление новостями
Провайдерам новостей часто приходится модифицировать новостные объекты, которые они уже переслали клиенту. Они, например, могут исправить заголовок, расширить текст истории или удалить сообщение в целом. Этот процесс обновления, удаления и изменения известен как "управление новостями". Различные провайдеры новостей могут иметь различную политику управления новостями. Стандарт NewsML от IPTC описывает продвинутые средства для осуществления разнообразных процедур провайдерами и их клиентами.
Спецификация
Раздел "Спецификация" содержит только нормативные документы, которые определяют NewsML.
Документы, дополнительные к стандарту, образовательные материалы, улучшающие ваше понимание, могут быть найдены в Разделе документации.
IPTC предоставляет DTD и Функциональную спецификацию для своего стандарта NewsML, как в его текущей версии, так и для предыдущих версий, поскольку они все еще находятся в использовании.
Текущая спецификация,
относящаяся к NewsML 1.2 (выпущена в октябре 2003)
Скачать1) полный пакет NewsML 1.2 (ZIP-файл, ~ 3 MB, обновлен в августе 2004). Этот пакет содержит всю документацию вместе с файлами спецификации, но только для NewsML 1.2.
Скачать1) полный пакет NewsML 1.x, содержит версии NewsML 1.0 - 1.2, 2.0-проект (ZIP-файл, ~ 6 MB, обновлен в августе 2004). Этот пакет содержит всю документацию вместе с файлами спецификации.
Смотрите введение в дерево каталогов файловой системы, используемое IPTC для всех своих файлов (PDF).
1) Браузеры могут добавить нежелательные символы к имени загружаемого файла, такие строки как "[1]" или дополнительное расширение имени файла, - например ".php"
Перевел с английского Дмитрий Скоробогатов
29 просмотров
Статистика просмотров страницы:
за текущий месяц (Март 2024) - 2;
за прошлый месяц (Февраль 2024) - 3;
за последние 3 месяца (Декабрь 2023 - Февраль 2024) - 3;