Декабрь 19, 2019 Просмотры 29 просмотров

Введение в NewsML

От русского переводчика: NewsML - один из самых распространенных XML-стандартов обмена новостной информацией от International Press Telecommunications Council (IPTC - Совет Телекоммуникации Международной Прессы, Великобритания). Стандарт разработан давно (2000 г.), активно развивается и продвигается. Но на русском языке до сих пор доступны только новостные сообщения о нем и разрозненные (как правило безответные) вопросы на форумах. Это побудило меня перевести данную статью с www.newsml.org, которая, разумеется, недостаточна для работы с NewsML, но дает развернутый ответ на вопрос о том, что такое NewsML. В конец добавил перевод еще одной странички (Спецификация) с того же сайта. - Это для тех, кто захочет копать дальше. Надеюсь, что мой труд не окажется бесполезным.

Дмитрий Скоробогатов

В 1999 IPTC начала работу "над XML-стандартом представления и управления новостями в ходе всего их жизненного цикла, включая производство, обмен, и использование потребителем". Через год, после того как были определены требования, в октябре 2000 IPTC одобрила спецификацию NewsML 1.0.

NewsML оказался устойчивым продуктом: начиная с введения стандарта, он был модифицирован всего два раза, текущая версия - 1.2 с октября 2003.

Охваченные требования:

  • Поддержка представления электронных объектов новостей типа статьи, части статьи, совокупности статей, отношения между статьями и метаданных, связанных со статьями.
    Новости можно поставлять как отдельно, так и в пакетах из нескольких связанных элементов, и должны иметь метаданные, облегчающие создание, поставку, и использование (включая сортировку и поиск).
  • Использоваться в течение всего жизненного цикла новостей.
    Стандарт, вероятно, будет использоваться в основном для обмена новостями, но в то же время он может быть применен и к созданию, и к управлению и публикации новостей в связанных в сеть системах, и для архивных приложений.
  • Позволять статьям состоять из произвольных смесей медиа-типов, языков и кодировок.
    Пакеты новостей могут состоять из различных типов содержания - текстов, изображений, видео, аудио - все из которых должны обрабатываются одинаково. Одна и та же статья может существовать во множестве различных форм, в переводах текста на различные языки и может быть визуализирована в альтернативных форматах.
  • Быть используемым в качестве замены или позволять транспортировку из всех существующих форматов новостей и кодировок.
    Надеемся, что NewsML постепенно заменит старые форматы обмена новостей - такие как Модель информационного обмена IIM. Однако там, где другие форматы исполняют различные специфические функции (подобно Индустриальному текстовому формату Новостей - NITF - с его возможностями форматирования), должна существовать возможность включать их как отдельные элементы в пределах NewsML.
  • Поддержка множества различных физических конструкций одних и тех же данных. В зависимости от пользовательских требований и систем поставки и использования, может возникнуть потребность представлять один и тот же новостной контент различными способами.
    Некоторые пользователи желают непосредственно получать весь вывод провайдеров, а другие предпочитают получать уведомления о доступности (с описанием содержания) и затем запрашивать статью, которую захотят использовать.
  • Поддержка управления и модификации статей спустя какое-то время.
    Новости часто развиваются постепенно, так что есть потребность модифицировать их, добавлять к ним, или заменять на более ранние версии. Статьи не могут быть доступны одновременно в различных СМИ, так что, вероятно, необходимо согласовывать их друг с другом.
  • Легкая расширяемость и гибкость.
    Требования склонны изменяться, поскольку рынки развиваются. Установленная структура может быстро устареть. Кроме того, отдельные пользователи могут пожелать добавить собственные особенности и расширения.
  • Учет идентификации и подписи содержания статей и метаданных.
    Значение новостного контента, и связанных с ним метаданных, зависит от их достоверности.
  • Не быть чрезмерно многословным.
    Объемы передаваемой информации постоянно возрастают во всех областях новостной индустрии, и потребность в них продолжает расти, так что есть смысл позаботиться о минимизации накладных расходов (если удовлетворены другие требования). NewsML должен быть удобен для использования в отправляющих и получающих системах.
  • Использование XML и других соответствующих стандартов и рекомендаций.
    Принятие XML позволяет основываться на проверенной и быстро развивающейся технологии, и будет способствовать более широкому распространению стандарта в информационной промышленности. Так как XML теперь хорошо поддерживается программными инструментальными средствами, то и компетентная поддержка стандарта должна быть общедоступна.

Структура NewsML

Цель NewsML - представление и управление новостями в ходе всего их жизненного цикла. В то же время стандарт был разработан достаточно гибко и предусматривает расширения, чтобы удовлетворить индивидуальные потребности пользователей. Это неизбежно привело к довольно сложной и слоистой структуре, которая может казаться трудной для понимания. Однако нет никакой необходимости использовать все особенности стандарта. Его основная логика проста и позволяет относительно простые решения для, скажем, обработки текста.

NewsML имеет форму документа XML. Он содержит последовательность компонентов, или элементов, которые используются, чтобы структурировать и обрабатывать новостной контент. Эти элементы могут иметь атрибуты, определяющие их свойства, и могут нести содержание в форме вложенных элементов и/или символьные данные или внешние ссылки.

Новостные метаданные

Эффективное использование метаданных - ключевая особенность NewsML, и значительные усилия было приложены к развитию основного набора метаданных. В эту работу был вовлечен существенный интеллектуальный капитал, представленный ранее в стандартах IIM (Модель информационного обмена) и NITF (Индустриальный текстовый формат Новостей), которые, однако, были существенно улучшены и расширены средствами XML.

Согласно замыслу метаданные в NewsML предполагается указывать по возможности близко к элементу, который они описывают, причем большая часть метаданных является опциональной.

На самом низком уровне, какой только может содержать новостные данные, - "ContentItem" - можно добавлять атрибуты, описывающие физические характеристики представления новостей.

В следующем более высоком уровне - "NewsComponent" - можно добавить метаданные следующих типов:

  • AdministrativeMetadata описывает происхождение NewsItem и включает имя файла. Провайдер и создатель новостного объекта могут быть идентифицированы, вместе с источником информации. Кроме того, была создана возможность для идентификации синдицированных элементов. Элемент Property (Свойство) позволяет указать любое другое административное методанное, которое может потребоваться для каких-нибудь приложений.
  • RightsMetadata описывает копирайт на NewsComponent и включает подробности любых прав использования, которые владелец авторского права предоставил другим сторонам. Эта информация дается (если дается) в текстовой форме и дополнительно может содержать ссылки на машинный обработчик данных.
  • DescriptiveMetadata используется, чтобы описать содержимое NewsItem в определенных терминах: Language (Язык), Genre (Жанр, - сущность NewsItem. Например: Current - Текущий, Analysis - Анализ, Forecast - Прогноз, Interview - Интервью, Retrospective - Ретроспектива), OfInterestTo (целевая аудитория) и TopicOccurence (распространение темы). Также содержит элемент Property (Свойство) - которое позволяет включать любое другое описательное методанное, необходимое для определенного приложения.
  • NewsLines можно представить как удобочитаемое представление некоторых метаданных. Они вообще имеют свойство быть как машиночитаемыми так и человекочитаемыми. Они применимы к различным типам медиа, имеют определенную уместность к новостям и пригодны для печати. Широко используемыми примерами NewsLines являются следующие элементы: HeadLine, SubHeadlines, ByLine, Date-Line, CreditLine, CopyrightLine, RightsLine, SeriesLine, SlugLine и KeywordLine. Использование этих NewsLines является опциональным, и каждый NewsLine может быть только однажды включен в NewsComponent.

Управление новостями

Провайдерам новостей часто приходится модифицировать новостные объекты, которые они уже переслали клиенту. Они, например, могут исправить заголовок, расширить текст истории или удалить сообщение в целом. Этот процесс обновления, удаления и изменения известен как "управление новостями". Различные провайдеры новостей могут иметь различную политику управления новостями. Стандарт NewsML от IPTC описывает продвинутые средства для осуществления разнообразных процедур провайдерами и их клиентами.

Спецификация

Раздел "Спецификация" содержит только нормативные документы, которые определяют NewsML.

Документы, дополнительные к стандарту, образовательные материалы, улучшающие ваше понимание, могут быть найдены в Разделе документации.

IPTC предоставляет DTD и Функциональную спецификацию для своего стандарта NewsML, как в его текущей версии, так и для предыдущих версий, поскольку они все еще находятся в использовании.

Текущая спецификация,
относящаяся к NewsML 1.2 (выпущена в октябре 2003)

  • Скачать1) DTD (dtd-файл)
  • Скачать1) экспериментальную XML схему (xsd-файл)
  • История изменений (PDF) от версии 1.1 к 1.2
  • Смотрите Функциональную спецификацию (HTML)
    (модифицированный документ, доступный с 19 сентября 2005)
  • Скачать1) полный пакет NewsML 1.2 (ZIP-файл, ~ 3 MB, обновлен в августе 2004). Этот пакет содержит всю документацию вместе с файлами спецификации, но только для NewsML 1.2.
  • Скачать1) полный пакет NewsML 1.x, содержит версии NewsML 1.0 - 1.2, 2.0-проект (ZIP-файл, ~ 6 MB, обновлен в августе 2004). Этот пакет содержит всю документацию вместе с файлами спецификации.
  • Смотрите введение в дерево каталогов файловой системы, используемое IPTC для всех своих файлов (PDF).

Спецификации для предыдущих версий

V 1.1 (выпущена в октябре 2002)

V 1.0 (выпущена в октябре 2000)


1) Браузеры могут добавить нежелательные символы к имени загружаемого файла, такие строки как "[1]" или дополнительное расширение имени файла, - например ".php"

Перевел с английского Дмитрий Скоробогатов


Просмотры 29 просмотров

Статистика просмотров страницы:

  • за текущий месяц (Март 2024) - 2;
  • за прошлый месяц (Февраль 2024) - 3;
  • за последние 3 месяца (Декабрь 2023 - Февраль 2024) - 3;
  • за последний год (Март 2023 - Февраль 2024) - 15;

Отзывы

Админ
Отлично!
Март 28 Админ

Статьи и обзоры Все статьи

GT & Industrial Systems, LP, действующая в Узбекистане через зарегистрированное ...
В начале 2000-х мир киберспорта переживал свою золотую эпоху, а ...
Бухгалтерская программа 1C способствует успешному развитию бизнеса в условиях современной ...
Автоматизация бизнес-процессов и повышение эффективности компании с помощью программы 1С.