ДСТУ ISO 30042:2015 Інформаційні технології. Системи керування термінологією, знаннями та контентом. Обмін термінологічною інформацією (ISO 30042:2008, IDT)
НАЦІОНАЛЬНИЙ СТАНДАРТ УКРАЇНИ
Інформаційні технології
СИСТЕМИ КЕРУВАННЯ ТЕРМІНОЛОГІЄЮ, ЗНАННЯМИ ТА КОНТЕНТОМ.
ОБМІН
ТЕРМІНОЛОГІЧНОЮ ІНФОРМАЦІЄЮ
(ISO 30042:2008, IDТ)
ДСТУ ISO 30042:2015
Київ
(ДП «УкрНДНЦ»)
2017
ПЕРЕДМОВА
1 ВНЕСЕНО: Державне підприємство «Укрелекон» (ДП «Укрелекон»)
ПЕРЕКЛАД І НАУКОВО-ТЕХНІЧНЕ РЕДАГУВАННЯ: В. Плескач, д-р економ, наук (науковий керівник); С. Поляков
2 НАДАНО
ЧИННОСТІ: наказ
(ДП «УкрНДНЦ») від 18 грудня 2015 р. № 195 з 2017-01-01
3 Національний стандарт відповідає ISO 30042:2008 Systems to manage terminology, knowledge and content — TermBase exchange (TBX) (Системи керування термінологією, знаннями та контентом. Обмін термінологічними базами даних)
Ступінь відповідності — ідентичний (IDT)
Переклад з англійської (еn)
4 УВЕДЕНО ВПЕРШЕ
ЗМІСТ
Національний вступ
Передмова до ISO 30042:2008
Вступ до ДСТУ ISO 30042:2008
1 Сфера застосування
2 Нормативні посилання
3 Терміни та визначення понять
4 Зв’язок з іншими стандартами
5 Застосування ТВХ
6 Фундаментальні принципи
6.1 Загальна частина
6.2 Принципи щодо групування і представлення категорій даних
7 Вимоги до файлів ТВХ
7.1 Вимоги відповідності
7.2 Приклади невідповідності
7.3 Рівні виконання
8 Модуль ядерної структури
8.1 Вступ
8.2 Ієрархія
8.3 Компоненти термінологічного запису
8.4 Елементи, що можуть міститися на багатьох рівнях запису
8.5 Елементи, що містяться тільки на рівні термінів або нижче
8.6 Підтримка тексту
8.7 Елементи метаданих
8.8 Атрибути
8.9 Питання наборів символів
8.10 Мова
9 Обмеження категорій даних за промовчуванням
9.1 Вступ
9.2 Категорії даних, вбудовані в ядерну структуру DTD в ТВХ
9.3 Категорії даних, які визначають категоріями метаданих через файл XCS за промовчуванням
10 Приклади
10.1 Приклад типового файла ТВХ
10.2 Приклади кодування елементів ТВХ
10.3 Приклади записів ТВХ
11 Посилання об’єктів
11.1 Загальна інформація про посилання
11.2 Посилання на файл, вбудований у прикінцеву частину файла ТВХ
11.3 Посипання на файл із прикінцевої частини
11.4 Посилання на файл безпосередньо в записі
11.5 Посилання на зовнішнє джерело
11.6 Посилання та документування бібліографічних джерел
11.7 Посилання та документування інформації про відповідальну персону чи організацію
11.8 Посилання на зовнішню систему понять, систему класифікації або тезаурус
11.9 Посилання на запис ТВХ зсередини
12 Створення налаштованих ТВХ TML
12.1 Загальна інформація npo TML
12.2 Приклад файла XCS для визначених користувачами ТВХ TML
12.3 Створення налаштованого списку вибору імен показу
Додаток A DTD для модуля ядерної структури
Додаток В DTD для обмежень категорії даних (файл XCS)
Додаток С Файл XCS за промовчуванням
С.1 Вступ
C.2 Файл XCS для категорій даних та обмежень за промовчуванням
Додаток D Описи елементів та атрибутів ядерної структури та категорій даних за промовчуванням
D.1 Загальна інформація про описи
D.2 Макрос
D.3 Класи атрибутів
D.4 Елементи
D. 5 Категорії даних за промовчуванням
Додаток Е Описи елементів та атрибутів файла XCS
E.1 Вступ
Е.2 Класи атрибутів
Е.3 Елементи
Додаток F Інтегрована схема та інші ресурси ТВХ
Додаток G TBX-Basic
Додаток Н Підсумок змін
Додаток І Індекси
I.1 Ядерний модуль DTD
I.2 XCS DTD
I.3 Термінологічні категорії даних
Бібліографія
Додаток НА Перелік національних стандартів, згармонізованих з міжнародними документами, на які є посилання в цьому стандарті
НАЦІОНАЛЬНИЙ ВСТУП
Цей стандарт є повний письмовий переклад ISO 30042:2008 Systems to manage terminology, knowledge and content — TermBase exchange (TBX) (Системи керування термінологією, знаннями та контентом. Обмін термінологічними базами даних).
Технічний комітет, відповідальний за цей стандарт, — ТК 105 «Банківські і фінансові системи та послуги».
До стандарту внесено такі редакційні зміни:
— слова «цей міжнародний стандарт» замінено на «цей стандарт»;
— структурні елементи стандарту: «Титульний аркуш», «Передмову», «Зміст», «Національний вступ», «Терміни та визначення понять», першу сторінку, «Бібліографію» та «Бібліографічні дані» — оформлено згідно з вимогами національної стандартизації України;
— у тексті стандарту наведено «Національне пояснення», виділене рамкою.
У цьому стандарті є посилання на ISO 639-1:2002, ISO 639-2:1998, ISO 639-3:2007, ISO 3166-1:2006, ISO 8601:2004, ISO/IEC 10646, які безпосередньо або їхні пізніші версії прийнято в Україні як національні стандарти. Перелік їх наведено в додатку НА.
Інші стандарти, на які є посилання, не прийнято в Україні як національні, й чинних документів замість них немає. їхні копії можна отримати в Національному фонді нормативних документів.
ПЕРЕДМОВА до ISO 30042:2008
Міжнародна організація зі стандартизації (ISO) є всесвітньою федерацією національних органів зі стандартизації (органів-членів ISO). Роботу з підготовки міжнародних стандартів зазвичай здійснюють через технічні комітети ISO. Кожний національний орган-член ISO, зацікавлений у діяльності, для якої створено технічний комітет, має право бути представленим у цьому комітеті. Міжнародні урядові та неурядові організації, взаємодіючи з ISO, також беруть участь у цій роботі, тісно співпрацюючи з Міжнародною електротехнічною комісією (ІЕК).
Міжнародні стандарти розробляють відповідно до правил, наведених у директивах ISO/IEC, Частина 2.
Основним завданням технічних комітетів є підготовка міжнародних стандартів. Проекти міжнародних стандартів, схвалені технічними комітетами, розсилають національним органам-членам ISO для голосування. Опублікування міжнародного стандарту потребує схвалення щонайменше 75 % національних органів-членів ISO, що беруть участь у голосуванні.
Звертаємо увагу на те, що деякі елементи цього стандарту можуть бути об’єктом патентних прав. ISO не несе відповідальності за ідентифікацію зазначених патентних прав.
ISO 30042 підготовлено LISA OSCAR та прийнято за спеціальною пришвидшеною процедурою Технічним комітетом ISO/TC 37 « Термінологія та інші мовні та змістовні ресурси». Підкомітетом SC 3, «Системи управління термінологією та контентом» одночасно зі схваленням його органами- членами ISO.
Асоціація LISA з локалізації галузевих стандартів (The Localization Industry Standards Association — www.lisa.org) є організацією зі стандартів для глобалізації промисловості. У межах LISA Спеціальна зацікавлена група OSCAR з відкритих стандартів для повторного використовування контейнерів/кон- тенту (Open Standards for Container/content Allowing Reuse) розробляє засновані на XML стандарти для автоматичного мовного обробляння в галузі глобалізації, інтернаціоналізації, локалізації та перекладу, зокрема й стандарти пам’яті перекладів, термінології, текстової пам’яті, обчислювання слів/ символів та в інших суміжних галузях. Основним завданням Спеціальної зацікавленої групи OSCAR є розроблення стандартів для полегшення й автоматизації процесу глобалізації продуктів і послуг підтримуванням місцевих мов і культур. Публікація як стандарту OSCAR потребує схвалення керівного комітету OSCAR. Ранішу версія ТВХ розроблено й опубліковано LISA в 2002 р.
ТВХ і логотип ТВХ є зареєстрованими торговими марками LISA, логотип ТВХ підлягає умовам використовування, визначеним LISA. LISA підтримує авторські права на специфікації ТВХ, доступні на веб-сайті LISA, ISO також підтримує авторські права на специфікації ТВХ, розповсюджуючи їх як ISO 30042. Технічний зміст цих двох документів ідентичний і є суб’єктом спільної підтримки командою ISO ТК 37 та LISA OSCAR.
ВСТУП до ISO 30042:2008
У цьому стандарті визначено засновану на XML структуру для представлення структурованих термінологічних даних, що називається TermBase exchange (ТВХ). У цій структурі може бути визначено безліч термінологічних мов для розмітки (Terminological Markup Languages, TML). Мова TML, визначена за допомогою ТВХ, може сприяти обміну термінологічними даними між користувачами, серед яких перекладачі та письменники, застосування (application) та системи, такі як комп’ютерні засоби перекладу й авторської роботи. Таким чином, ТВХ може бути використано водночас для орієнтованих на людину та машину термінологічних даних. У цьому сенсі він може забезпечити потік термінологічної інформації в межах усього циклу виробництва інформації як всередині організації, так і з зовнішніми постачальниками послуг.
Цільова аудиторія цього стандарту складається з двох груп: (1) програмісти й аналітики, які хочуть розвивати програмні застосування, що обробляють ТВХ-відповідні (TBX-compliant) файли даних; (2) термінологи та інші фахівці з лінгвістики, які хочуть проаналізувати колекцію термінологічних даних для представлення їх у ТВХ або зрозуміти побудову файла ТВХ.
Ця версія ТВХ є оновленням версії, опублікованої Асоціацією LISA у 2002 р. Серед інших удосконалень поточна версія надає посилання на інтегровану схему, що охоплює модуль ядерної структури (core-structure module) та обмеження категорій даних у поєднаних деклараціях із використанням мов RELAX NG і Schematron. Вона також забезпечує посилання на ТВХ-відповідну TML, названу TBX-Basic.
Користувачі цього стандарту мають спочатку вивчити основу (розділи 1—12). Використання додатків А—І описано нижче.
(1) Модуль ядерної структури ТВХ
Усі мови TML у межах ТВХ мають однакову ядерну структуру. Модуль ядерної структури описано у розділі 8. DTD для модуля ядерної структури може бути знайдено в додатку А. Елементи, атрибути й типи даних описано в додатку D і перелічено в алфавітному порядку, наведеному в додатку І.
(2) Модуль XCS
Мови TML можуть відрізнятися залежно від дозволених категорій даних та рівнів термінологічних записів, які можуть відповідати цим категоріям даних. Ці обмеження ядерної структури, які визначають конкретну TML, формально представлено у файлі XCS. DTD для модуля XCS може бути знайдено в додатку В. Елементи й атрибути описано в додатку Е та перелічено в абетковому порядку, наведеному в додатку І.
(3) XCS за промовчуванням у межах ТВХ
Мова TML, що є мовою за промовчуванням у ТВХ, обмежується файлом XCS за промовчуванням. XCS за промовчуванням у межах ТВХ описано в розділі 9. Файл XCS за промовчуванням наведено в додатку С. Категорії даних описано в додатку D та перелічено в абетковому порядку, наведеному в додатку І.
(4) Перевірка відповідності документа ТВХ
Після того як мову TML визначено в ТВХ за допомогою XCS, документи ТВХ можуть бути перевірені на відповідність з цією TML. Вимоги відповідності наводять у розділі 7. Для перевірки відповідності можна використовувати різні методи та мови визначання схем. Зокрема, схему Relax NG, зазначену в додатку F, можна використовувати, щоб перевірити, чи дійсно екземпляр документа ТВХ є відповідним TML за промовчуванням у межах ТВХ. Додаток F також вказує, де користувач ТВХ може знайти додаткові ресурси для перевірки відповідності. Іншу мову TML в ТВХ, названу TBX-Basic, наводять у додатку G.
(5) Зміни, внесені в ТВХ із моменту його прийняття ISO в лютому 2007 p., наведено в додатку Н.
Перелік додатків:
A: DTD для модуля ядерної структури.
В: DTD для модуля XCS.
С: XCS за промовчуванням, що визначає мову TML за промовчуванням у ТВХ.
D: Описи елементів та атрибутів ядерної структури.
D. 5: Описи категорій даних за промовчуванням.
Е: Описи елементів та атрибутів файла XCS.
F: Схема Relax NG та інші ресурси для перевірки відповідності.
G: Посилання на TBX-Basic.
Н: Резюме змін в ТВХ.
І: Індекси (абеткові переліки елементів і категорій даних).
НАЦІОНАЛЬНИЙ СТАНДАРТ УКРАЇНИ
ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ
СИСТЕМИ КЕРУВАННЯ ТЕРМІНОЛОГІЄЮ, ЗНАННЯМИ ТА КОНТЕНТОМ.
ОБМІН
ТЕРМІНОЛОГІЧНОЮ ІНФОРМАЦІЄЮ
ИНФОРМАЦИОННЫЕ
ТЕХНОЛОГИИ
СИСТЕМЫ УПРАВЛЕНИЯ ТЕРМИНОЛОГИЕЙ,
ЗНАНИЯМИ И КОНТЕНТОМ.
ОБМЕН ТЕРМИНОЛОГИЧЕСКОЙ ИНФОРМАЦИЕЙ
INFORMATION TECHNOLOGY
SYSTEMS ТО MANAGE
TERMINOLOGY, KNOWLEDGE AND CONTENT.
TERMBASE EXCHANGE (TBX)
Чинний від 2017-01-01
1 СФЕРА ЗАСТОСУВАННЯ
Середовище ТВХ, визначене цим стандартом, призначається для підтримки різних типів процесів, що охоплюють термінологічні дані, зокрема й аналіз, описове представлення, поширення та обмін у різних комп’ютерних середовищах. Основна мета ТВХ — обмін термінологічними даними. Він обмежений у своїй здатності представляти презентаційну розмітку. Галузі застосування охоплюють переклад і авторську роботу з документами.
ТВХ є модульним для забезпечення підтримки різних типів термінологічних даних або категорій даних, внесених у різні термінологічні бази даних (термінологічні бази). ТВХ містить два модулі: ядерну або основну структуру та формалізм для визначення набору категорій даних і їх обмежень, виражених у форматі XML. Термін ТВХ у разі окремого використовування має на увазі середовище, що складається з цих двох взаємодієвих модулів.
Для максимізації взаємодії актуальних термінологічних даних ТВХ також надає базовий набір категорій даних (за промовчуванням), які спільно використовують у термінологічних базах даних. Однак підмножини або надмножини базового набору категорій даних можна використовувати в рамках ТВХ для підтримки конкретних потреб користувачів.
ТВХ у разі використовування з його набором категорій даних за промовчуванням кваліфікують як термінологічну мову розмітки (TML), що визначено в ISO 16642 та згадуватимуть у цьому міжнародному стандарті akTML за TBX-промовчуванням. Так само інші мови розмітки, які відповідають ТВХ і використовують підмножини набору категорій даних за промовчуванням також є мовами TML, але можуть мати інші назви, такі як вказано в додатку G (довідковий) TBX-Basic.
2 НОРМАТИВНІ ПОСИЛАННЯ
Наведені нижче нормативні документи треба застосовувати в цьому стандарті. У разі датованих посилань застосовують тільки зазначене видання. У разі недатованих посилань застосовують останнє видання документа (разом з усіма змінами).
ISO 639-1:2002 Codes for the representation of names of languages — Part 1: Alpha-2 code
ISO 639-2:1998 Codes for the representation of names of languages — Part 2: Alpha-3 code
ISO 639-3:2007 Codes for the representation of names of languages — Part 3: Alpha-3 code for comprehensive coverage of languages
ISO/IEC 646:1991 Information technology — ISO 7-bit coded character set for information interchange
ISO 3166-1:2006 Codes for the representation of names of countries and their subdivisions — Part 1: Country codes
ISO 8601:2004 Data elements and interchange formats — Information interchange — Representation of dates and times
ISO/IEC 10646 Information technology — Universal Multiple-Octet Coded Character Set (UCS)
ISO 12200:1999 Computer applications in terminology — Machine-readable terminology interchange format (MARTIF) — Negotiated interchange
ISO 12620 Computer applications in terminology — Data categories
ISO 16642:2003 Computer applications in terminology — Terminological markup framework.
НАЦІОНАЛЬНЕ ПОЯСНЕННЯ
ISO 639-1:2002 Коди для представлення назв мов. Частина 1. Alpha-2 код
ISO 639-2:1998 Коди для представлення назв мов. Частина 2. Alpha-З код
ISO 639-3:2007 Коди для представлення назв мов. Частина 3. Alpha-З код для всебічного покриття мов
ISO/IEC 646:1991 Інформаційні технології. 7-бітний кодований набір символів ISO для обміну інформацією
ISO 3166-1:2006 Коди для представлення назв країн та їх підрозділів. Частина 1. Коди країн
ISO 8601:2004 Елементи даних та формати обміну. Обмін інформацією. Представлення дат і часу
ISO/IEC 10646 Інформаційні технології. Універсальний множинний 8-символьний кодовий набір символів (UCS)
ISO 12200:1999 Комп’ютерні застосування в термінології. Формат обміну термінологією для машинного читання (MARTIF). Узгоджений обмін
ISO 12620 Комп’ютерні застосування в термінології. Категорії даних
ISO 16642:2003 Комп’ютерні застосування в термінології. Середовище термінологічної розмітки.
Повна версія документа доступна в тарифі «ВСЕ ВРАХОВАНО».