Декабр 19, 2019 Кўришлар 23

Репортаж с “круглого стола” по вопросу Open XML

28 августа в конференц-зале столичной гостиницы Dedeman состоялся (правда, с небольшой задержкой: событие было перенесено на 5 часов вечера вместо 10 утра) «круглый стол» IT-ассоциации Узбекистана. Темой обсуждения был OpenXML и то, как наша страна отнесется к принятию данного формата в качестве мирового стандарта ISO.

Организовать событие помогла небезызвестная корпорация Microsoft, которая, собственно, и является одним из основных разработчиков формата. Основным, но не единственным: формат Office Open XML разработан Европейской Ассоциацией стандартизации в области информационных и коммуникационных систем (ECMA International), в разработке принимали участие и Microsoft, и Apple, и Novel, и Британская библиотека, и Библиотека Конгресса США...

Что вообще такое OpenXML и чем он нам полезен? Чего греха таить, этот формат уже вполне успешно используется пакетом MS Office 2007 для сохранения документов, но этим область его применеия не ограничивается. Как видно из названия, в основе формата лежит легко расширяемый XML, поэтому с помощью OpenXML можно описать и сохранить множество разных типов информации - от текста до трехмерной анимации. Это, однако, не означает, что OpenXML заменит все существующие форматы. Он их просто дополнит. XML удобен и понятен, но не во всех случаях: многие специальные форматы файлов нормально обходятся без XML и пока не видно надобности внедрять его повсеместно. Стандарт предусматривает включение бинарных файлов любого типа в документ OpenXML, так что чужими для него эти форматы не будут.

Взглянем на конструкцию документа OpenXML. На низшем уровне это ZIP-архив (правда, уже не с расширением .zip), содержащий некий набор файлов, среди которых обязательно есть основной XML-файл с описанием содержимого документа, да и сама информация: текст в виде XML и вложения в двоичном виде (например, изображения). Уже имеются частные стандарты для определенных подтипов документов:

WordProcessingML – для текстовых документов;
SpreadSheetML – для электронных таблиц;
PresentationML – для презентаций;

плюс стандарты помельче и попроще для графиков, диаграмм, формул и тому подобных полезных мелочей.

Как видно, пока формат не предусматривает какой-либо поддержки баз данных, так как необходимость XML при создании таблиц БД пока весьма сомнительна. Что касается такого важного вопроса, как кодировка символов (разброд и шатание всем уже изрядно поднадоели), то основой выбрана перспективная UTF. Стандарт все же предусматривает ее переопределение, то есть в отдельно взятом документе никто не запрещает использовать хоть KOI-8, хотя это и нежелательно, так как юникод перекрывает собой все существующие кодировки.

Возможно, у кого-то уже возникла мысль о громоздкости XML (скобочки да определители, несомненно, отстают от бинарных данных). Разработчики OpenXML обошли эту проблему наиболее практичным способом: сократили определители до одной-двух букв (HTML, например, часто использует английские слова, как они есть), а наиболее критичные по скорости и обьему определения все-таки представили в двоичном виде. Сильно концепции XML это не вредит, это необходимость: представьте себе, например, варианты словесной записи цвета (который сейчас принято представлять чем-то вроде #0507FF). Плюс не следует забывать, что файл сжимается в ZIP, а коэффициент сжатия текста высок и доходит в отдельных случаях до 10:1.

Также может возникнуть (и возникал) вопрос: «А нужен ли новый стандарт? Перевесят ли достоинства нового представления данных проблемы, связанные с его внедрением?» На такой вопрос можно ответить обывательским суждением: «Если бы не было нужно, крупные и уважаемые организации этим бы не занимались»... А если серьезно, то общий стандарт не помешает ни в коей мере. Порядочно расплодившиеся форматы - и открытые, и проприетарные - создают проблему взаимной совместимости приложений. Например, OpenOffice не всегда корректно открывает распространенные файлы MS Office, а сохраняет их еще хуже, MS Office, наоборот, не может похвастать поддержкой ODF - Open Document Format, используемый Sun Open Office. К слову, ODF уже зарегистрирован в ISO и может конкурировать с OpenXML, хотя и имеет ряд недостатков и не так хорошо документирован. В презентации Microsoft ODF и OpenXML были изображены на схеме рядом и перекрывали друг друга, так оно, в принципе, и есть. Правда, при таком раскладе продолжает смущать вопрос взаимной совместимости на уровне приложений – она пока реализована не очень-то... Также в списке конкурентов значатся довольно специфичный UOF (формат, разработанный при поддержке правительства КНР с учетом особенностей иероглифического письма) и PDF/X, который пока страдает порядочным количеством недостатков, включая такой, как закрытость большой части стандарта.

Не бывает, наверное, так, чтобы нечто новое принималось всеми и всем нравилось, хоть один скептик да найдется. А поскольку мир велик и стандарт тоже не мал, то и оппозиция далеко не слаба – против среди прочих выступила IBM. Чем ей «наступил на хвост» стандарт – дело темное. Тут может быть замешан и коммерческий фактор, и личная неприязнь к некоторым разработчикам стандарта (повторю – его уже нельзя считать only-Microsoft, хотя участие корпорации очень велико), но факт остается фактом: IBM выступила против и развернула антиагитацию. Все же, по словам представителя MS, среди потока поступающих замечаний и упреков (и от IBM, и от прочих фирм и организаций, крупных и мелких, да и просто от частных лиц) встречаются действительно здравые и полезные замечания, которые по возможности учитываются. Обстоятельный и очень интересный рассказ представителей Microsoft-Россия немного не уместился в предполагаемые временные рамки, но все же, думаю, ничего упущено не было.

После небольшого перерыва началась критика и вопросы. Точнее, критика предполагалась, но как таковой ее не было, а вот без вопросов не обошлось. На все вопросы докладчики ответили очень обстоятельно и опять не уложились в отведенное время, что скорее хорошо, чем плохо, тем более, что торопиться особо было и некуда. Хотя нет, вру – ISO прекратит прием рекомендаций и замечаний по стандарту 2 сентября, то есть уже совсем скоро. Кстати, в качестве поощрения спрашивающие получали довольно-таки эксклюзивную вещь: первый справочник-мануал по основам OpenXML. Предварительное ознакомление с ним порадовало – написано понятно и без воды. Поскольку мы обзавелись и электронным вариантом, его (и еще множество интересной документации) мы выложим на сервере PC.UZ, чтобы внести и свою лепту в поддержку стандарта.

Результатом работы «круглого стола» стало следующее заключение (в предварительной формулировке): “Считаем, что проект стандарта ISO/IEC DIS 29500 “Office Open XML file formats” может быть принят в качестве международного стандарта в организации ISO, поддерживаем положительное голосование по этому вопросу в ISO/IEC JTC-1 от Узбекистана и считаем желательным, чтобы ISO/IEC DIS 29500 впоследствии наряду с другими стандартами был рассмотрен в качетстве Национального стандарта Республики Узбекистан”.

Презентации и информационные материалы с круглого стола:

Презентация на русском языке (PDF, RAR, 5.7Mb)

Презентация на английском языке (PPT, RAR, 211Kb)

Резюме по OpenXML(PDF, RAR, 1.3Mb)

Комментарии на возражения NOOOXML (PDF, RAR, 320kb)

Комментарии на возражения IBM (PDF, RAR, 930kb)

Книга. Воутер Ван Вугт. OpenXML. Кратко и доступно (PDF, RAR, 2.7Mb)


Кўришлар 23

Сахифани кўриш статистикаси:

  • оxирги 3 ой (Июн 2025 - Август 2025) - 1;
  • оxирги йил (Сентябр 2024 - Август 2025) - 3;

Шарҳлар

Админ
Отлично!
Март 28 Админ

Мақолалар ва шарҳлар Барча мақолалар

Теперь пользователи получают максимум технологий без переплат, что делает апгрейд ...
В статье разбираем, от чего зависит скорость зарядки смартфонов и ...
Узнайте, какие квесты в Ташкенте заинтересуют профессионалов в области IT ...
Разбираем структуру цены, скрытые расходы и реальные способы сэкономить при ...