ГОСТ 7.24-2007 СИБИД. Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению

ФЕДЕРАЛЬНОЕ АГЕНТСТВО
ПО ТЕХНИЧЕСКОМУ РЕГУЛИРОВАНИЮ И МЕТРОЛОГИИ

НАЦИОНАЛЬНЫЙ
СТАНДАРТ
РОССИЙСКОЙ
ФЕДЕРАЦИИ

ГОСТ Р
7.24-
2007

Система стандартов по информации , библиотечному и издательскому делу

ТЕЗАУРУС ИНФОРМАЦИОННО - ПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ

Состав , структура и основные требования к построению

Москва

Стандартинформ

2006

Предисловие

Цели , основные принципы и основной порядок проведения работ по межгосударственной стандартизации установлены ГОСТ 1.0- 92 «Межгосударственная система стандартизации . Основные положения» и ГОСТ 1.2- 97 «Межгосударственная система стандартизации . Стандарты межгосударственные , правила и рекомендации по межгосударственной стандартизации . Порядок разработки , принятия , применения , обновления и отмены»

Сведения о стандарте

1 РАЗРАБОТАН Всероссийским институтом научной и технической информации Российской академии наук

2 ВНЕСЕН Федеральным агентством по техническому регулированию и метрологии

3 ПРИНЯТ Межгосударственным советом по стандартизации , метрологии и сертификации ( протокол № 31 от 8 июня 2007 г .)

За принятие проголосовали :

Краткое наименование страны по МК ( ИСО 3166) 004 - 97

Код страны по МК ( ИСО 3166) 004 - 97

Сокращенное наименование национального органа по стандартизации

Азербайджан

AZ

Азстандарт

Армения

AM

Армстандарт

Беларусь

BY

Госстандарт Республики Беларусь

Грузия

GE

Грузстандарт

Кыргызстан

KG

Кыргызстандарт

Молдова

MD

Молдова - Стандарт

Российская Федерация

RU

Федеральное агентство по техническому регулированию и метрологии

Таджикистан

TJ

Таджикстандарт

Туркменистан

TM

Главгосслужба «Туркменстандартлары»

Узбекистан

UZ

Агентство «Узстандарт»

Казахстан

KZ

Госстандарт Республики Казахстан

4 Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО 5964:1985 «Документация . Руководство по построению и разработке многоязычных тезаурусов» ( ISO 5964:1985 « Guidelinesforthe establishment and development of multilingual thesauri » , IDT )

5 Приказом Федерального агентства по техническому регулированию и метрологии от 31 октября 2007 г . № 287- ст межгосударственный стандарт ГОСТ 7.24 - 2001 введен в действие в качестве национального стандарта Российской Федерации с 1 июля 2008 г .

6 ВЗАМЕН ГОСТ 7.24-90

Информация о введении в действие ( прекращении действия ) настоящего стандарта публикуется в указателе «Национальные стандарты» .

Информация об изменениях к настоящему стандарту публикуется в указателе «Национальные стандарты» , а текст изменений - в информационных указателях «Национальные стандарты» . В случае пересмотра или отмены настоящего стандарта соответствующая информация будет опубликована в информационном указателе «Национальные стандарты»

Содержание

1 Область применения

2 Нормативные ссылки

3 Термины и определения

4 Состав и структура тезауруса

5 Основные требования к построению многоязычных информационно-поисковых тезаурусов

Приложение А (справочное) Примеры использования средств указания эквивалентности дескрипторов в одноязычных версиях

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

Система стандартов по информации , библиотечному и издательскому делу

ТЕЗАУРУС ИНФОРМАЦИОННО - ПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ

Состав , структура и основные требования к построению

System of standards on information, librarianship and publishing. Multilingual thesaurus for information retrieval. Composition, structure and basic requirements for development

Дата введения - 2008 - 07 - 01

1 Область применения

Настоящий стандарт распространяется на многоязычные информационно - поисковые тезаурусы ( далее - МИПТ ) и устанавливает состав , структуру и основные требования к построению МИПТ , применяемых в информационно - поисковых системах .

2 Нормативные ссылки

В настоящем стандарте использованы ссылки на следующие межгосударственные стандарты :

ГОСТ 7.25- 2001 Система стандартов по информации , библиотечному и издательскому делу . Тезаурус информационно - поисковый одноязычный . Правила разработки , структура , состав и форма представления

ГОСТ 7.74- 96 Система стандартов по информации , библиотечному и издательскому делу . Информационно - поисковые языки . Термины и определения

Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю «Национальные стандарты» , составленному по состоянию на 1 января текущего года , и по соответствующим информационным указателям , опубликованным в текущем году . Если ссылочный стандарт заменен ( изменен ), то при пользовании настоящим стандартом следует руководствоваться заменяющим ( измененным ) стандартом . Если ссылочный стандарт отменен без замены , то положение , в котором дана ссылка на него , применяется в части , не затрагивающей эту ссылку .

3 Термины и определения

В настоящем стандарте применены термины по ГОСТ 7.74- 96 , а также следующие термины с соответствующими определениями :

3.1 многоязычный информационно - поисковый тезаурус : Информационно - поисковый тезаурус , содержащий лексические единицы , взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков .

Примечание - Предназначен для обработки документов ( запросов ) и информационного поиска с целью обмена информацией на различных естественных языках .

3.2 одноязычный информационно - поисковый тезаурус : Информационно - поисковый тезаурус , содержащий лексические единицы , взятые из одного естественного языка .

3.3 язык - компонент МИПТ : Язык , на основе которого разработана какая - либо из одноязычных версий .

3.4 дескриптор МИПТ : Основная лексическая единица МИПТ , представляющая собой совокупность эквивалентных дескрипторов одноязычных версий , связанных средствами для указания эквивалентности .

4 Состав и структура тезауруса

4.1 Обязательными составными частями МИПТ являются :

- вводная часть ;

- алфавитные лексико - семантические указатели , включающие средства для указания эквивалентности дескрипторов одноязычных версий ( см . 4.4). Допускается в состав тезауруса вводить систематические , пермутационные , иерархические и другие указатели и списки специальных категорий лексических единиц , а также приложения , содержащие дополнительные сведения о разработке и использовании МИПТ .

4.2 Вводная часть включает титульный лист и введение , составленные согласно ГОСТ 7.25- 2001 и изложенные на одном или нескольких языках - компонентах .

На титульном листе следует указывать все языки - компоненты . Рекомендуется наименование тезауруса на титульном листе формулировать на одном языке , а дополнительно к основному титульному листу включать во вводную часть титульные листы на всех языках - компонентах . Введение должно содержать краткое описание методических принципов установления эквивалентности дескрипторов одноязычных версий , а также указание на то , что тезаурус разработан в соответствии с настоящим стандартом . Рекомендуется в состав вводной части включать полный или сокращенный перевод введения на всех языках - компонентах .

4.3 Алфавитный лексико - семантический указатель в каждой из одноязычных версий содержит перечень тезаурусных статей , расположенных в алфавитном порядке заглавных лексических единиц на соответствующем языке - компоненте . Состав и структура тезаурусных статей в лексико - семантических указателях одноязычных версий - по ГОСТ 7.25- 2001 .

4.4 Средства для указания эквивалентности дескрипторов одноязычных версий реализуются введением в тезаурусную статью кода эквивалентности дескрипторов ( идентификационного кода ) и ( или ) эквивалентных дескрипторов на языках - компонентах .

При использовании идентификационных кодов в дополнение к алфавитному лексико-семантическому указателю МИПТ составляют указатель идентификационных кодов , в котором каждому коду приписывают соответствующие дескрипторы одноязычных версий .

4.5 Систематические , иерархические и пермутационные указатели строятся по ГОСТ 7.25- 2001 на языках - компонентах и содержат средства для указания эквивалентности дескрипторов одноязычных версий . Примеры использования средств для указания эквивалентности дескрипторов приведены в приложении А .

4.6 Состав и структура одноязычных версий должны соответствовать следующим требованиям :

- в каждой одноязычной версии должны содержаться все дескрипторы , необходимые для представления онтологии предметной области с целью поиска и обмена информацией между системами , использующими различные языки ;

- классы условной эквивалентности лексических единиц одноязычных версий должны соответствовать друг другу по объему выражаемых понятий ;

- соответствующие друг другу дескрипторы отдельных одноязычных версий должны иметь по возможности максимально совпадающие парадигматические отношения .

Одноязычные версии допускается дополнять дескрипторами , не являющимися необходимыми для межъязыкового обмена и отсутствующими в других одноязычных версиях ; при этом указывают иерархическую подчиненность их какому - либо дескриптору МИПТ .

Одноязычные версии могут включать парадигматические отношения , отсутствующие в других одноязычных версиях , если они на данном языке - компоненте уточняют понятия , выраженные дескриптором МИПТ , и не противоречат его пониманию в других языках - компонентах .

5 Основные требования к построению многоязычных информационно - поисковых тезаурусов

5.1 Содержание работ по формированию одноязычных версий определяют наличием или отсутствием одноязычных тезаурусов по данной тематике на языках - компонентах .

5.1.1 При отсутствии одноязычных тезаурусов по данной тематике на языках - компонентах , как правило , сначала создают одну одноязычную версию и на ее основе строят остальные .

Возможна также совместная разработка одновременно всех или нескольких одноязычных версий при взаимном согласовании состава дескрипторов и их парадигматических связей .

5.1.2 При наличии тезауруса по данной тематике на одном из языков - компонентов , как правило , его берут за основу разрабатываемого МИПТ . Другие одноязычные версии формируют подбором эквивалентов дескрипторов этого тезауруса на языках - компонентах . При этом возможны различные степени семантического соответствия эквивалентов дескрипторов на различных языках .

5.1.3 При наличии нескольких исходных тезаурусов по данной тематике на языках - компонентах разработка МИПТ ведется подбором эквивалентных дескрипторов в данных тезаурусах ( см . 5.2.1 и 5.2.2). Дескрипторы , не имеющие эквивалентов в отдельных одноязычных версиях , переводят на соответствующие языки и включают в одноязычные версии , в которых этот дескриптор первоначально отсутствовал . При этом следует вносить в исходные тезаурусы изменения , необходимые для согласования одноязычных версий .

5.1.4 Рекомендуется одну из одноязычных версий выбирать в качестве базовой и устанавливать эквивалентность дескрипторов других одноязычных версий по отношению к дескрипторам базовой версии .

5.2 При установлении эквивалентности дескрипторов различных одноязычных версий необходимо различать на разных языках - компонентах следующие степени эквивалентности терминов :

- полная ;

- неполная ;

- частичная ;

- отсутствие эквивалентного термина .

5.2.1 При наличии в языках - компонентах полностью эквивалентных терминов их считают представителями одного дескриптора МИПТ .

5.2.2 При отсутствии в языках - компонентах полных эквивалентов для выражения одного и того же понятия в качестве дескриптора МИПТ в одноязычных версиях используют неполные и частичные эквиваленты .

Неполными эквивалентами являются термины , для которых объемы выражаемых ими понятий пересекаются .

Частичными эквивалентами являются термины , для которых объем понятия , выражаемого одним эквивалентом , входит в объем понятия , выражаемого другим эквивалентом .

5.2.2.1 Если различие в объеме понятий между неполными или частичными эквивалентами несущественно для данного МИПТ , то их можно использовать для представления дескриптора МИПТ в разных одноязычных версиях , например :

ru: АННОТАЦИЯ

fr: RESUME

5.2.2.2 Если различие в объеме понятий между неполными или частичными эквивалентами существенно , то при представлении дескриптора МИПТ в одноязычных версиях значение используемого термина уточняют одним из следующих способов :

- добавлением релятора ( см . 5.2.2.3);

- добавлением примечания ( см . 5.2.2.4);

- включением термина в уточняющее словосочетание с определяющими словами ( см . 5.2.2.5);

- введением условно эквивалентных аскрипторов в тезаурусную статью дескриптора одноязычной версии ( см . 5.2.2.6);

- использованием комбинации двух или более терминов ( см . 5.2.2.7).

5.2.2.3 Добавление релятора , который является частью дескриптора , применяют в тех случаях , когда для более полного соответствия содержанию дескриптора необходимо ограничивать объем понятия , выражаемого термином , например :

англ .

русск .

TREE

ДЕРЕВО ( РАСТЕНИЕ )

WOOD ( MATERIAL )

ДЕРЕВО ( МАТЕРИАЛ )

WOOD (LANDSCAPE)

ЛЕС ( ЛАНДШАФТ )

5.2.2.4 Добавление примечания , которое не является частью дескриптора , используют в случаях уточнения объема понятия , выраженного соответствующими дескрипторами на разных языках - компонентах , например :

франц .

русск .

AFFILIATION

МЕСТО РАБОТЫ ( как элемент библиографического описания , обозначающий место работы автора публикации)

5.2.2.5 Включение термина в уточняющее словосочетание применяют в тех случаях , когда требуется ограничивать объем понятия и данное словосочетание устойчиво употребляется в документах , например :

англ .

русск .

CRANE (MACHINE)

ПОДЪЕМНЫЙ КРАН

5.2.2.6 Введение условно эквивалентных аскрипторов в тезаурусную статью дескриптора одноязычной версии применяют в тех случаях , когда они необходимы для однозначного представления понятия в данной версии , например :

англ .

русск .

GRAPH

ГРАФИК

UF diagram chart

5.2.2.7 Если исходный дескриптор обозначает понятие , не выраженное в виде единого термина на другом языке - компоненте , то допускается использовать в одноязычной версии в качестве эквивалента комбинацию двух и более дескрипторов одноязычной версии , например :

франц .

русск .

CARTE PERFOREE+SELECTION

ПЕРФОКАРТА РУЧНОГО

MANUELLE

ОБРАЩЕНИЯ

REFERER ANALYTIQUE+ELABORATION

РЕФЕРИРОВАНИЕ

5.2.3 При отсутствии лексического эквивалента в одном из языков - компонентов допускаются решения , приведенные в 5.2.3.1 - 5.2.3.5.

5.2.3.1 Создание нового термина переводом или калькированием иноязычного дескриптора , например :

англ .

франц .

русск .

FIVE-YEAR PLAN

PLAN QUINQUENNAL

ПЯТИЛЕТНИЙ ПЛАН

5.2.3.2 Использование в качестве эквивалента словосочетания , например :

англ .

русск .

CORER

МАШИНА ДЛЯ УДАЛЕНИЯ СЕРДЦЕВИНЫ ПЛОДА

5.2.3.3 Заимствование иноязычного термина , например :

англ .

русск .

FILE

ФАЙЛ

5.2.3.4 Использование в качестве эквивалента термина с близким значением , например :

франц .

русск .

OUTILS LINGUISTIQUES

ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ

англ .

русск .

TEENAGER

ПОДРОСТОК

5.2.3.5 Использование в качестве эквивалента термина , более широкого по значению и не входящего в лексический состав данной тематической области , например в МИПТ по библиотечному делу :

франц .

русск .

ANIMATEUR

ОРГАНИЗАТОР КУЛЬТМАССОВОЙ РАБОТЫ

5.3 По окончании разработки МИПТ представляют для регистрации в национальный и / или международный центр ведения информационно - поисковых языков . МИПТ представляют в составе всех его одноязычных версий .

Каждая одноязычная версия МИПТ может быть представлена как одноязычный тезаурус с иноязычными эквивалентами .

Национальные и международные центры ведения информационно - поисковых языков предоставляют заинтересованным лицам сведения о зарегистрированных МИПТ на условиях , определяемых разработчиком .

Форма представления одноязычных версий - по ГОСТ 7.25- 2001 и 4.4.

5.4 Процесс ведения МИПТ сводят к ведению его одноязычных версий и к обеспечению их согласованности . Изменения вносят одновременно во все одноязычные версии после их согласования на уровне языков - компонентов .

Рекомендуется не реже чем через пять лет обновлять сведения о МИПТ , зарегистрированных по 5.3.

Приложение А ( справочное )
Примеры использования средств указания эквивалентности дескрипторов в одноязычных версиях

Примеры

1 Использование цифровых идентификационных кодов , не зависящих от языка :

STALA - дескриптор на польском языке

086210 - идентификационный код

a      CHARAKTERYSTYKA

INDEKS

MODUL

STALY

WSKAZNIK(LICZBA)

2 Использование эквивалентов дескрипторов на другом языке :

КОНСТАНТА - дескриптор на русском языке

STALA - дескриптор на польском языке

с Постоянная

а      КОЭФФИЦИЕНТ

МОДУЛЬ

ПОКАЗАТЕЛЬ

ХАРАКТЕРИСТИКА

3 Использование эквивалентов дескрипторов на других языках и идентификационных кодов :

БЕНЗИНЫ - дескриптор на русском языке

fre : ESSENCE MOTEUR - дескриптор на французском языке

eng : GASOLINE - дескриптор на английском языке

pol : BENZYNA - дескриптор на польском языке

011420 - идентификационный код

в     НЕФТЕПРОДУКТЫ СВЕТЛЫЕ

ТОПЛИВО ЖИДКОЕ

ТОПЛИВО КАРБЮРАТОРНОЕ

н      БЕНЗИНЫ АВИАЦИОННЫЕ

БЕНЗИНЫ АВТОМОБИЛЬНЫЕ

БЕНЗИНЫ АЛКИЛИРОВАННЫЕ

4 Использование совместного расположения статей на двух языках :

русский язык

немецкий язык

АМАЛЬГАМА СЕРЕБРА

SILBERAMALGAM

в МЕТАЛЛЫ

OBMETALLE

н КУПРОАРКВЕРИТ

UB CUPROARQUERIT

Ключевые слова : многоязычный информационно - поисковый тезаурус , дескриптор , лексическая единица , эквивалентность дескрипторов , идентификационный код дескриптора