Правила индексирования документа КЛЮЧЕВЫМИ СЛОВАМИ электронного каталога

1.Общие положения

Настоящая инструкция предназначена для сотрудников отдела комплектования и научной обработки документов, справочно-информационного отдела при аналитической обработке документов.
1.2.Настоящая инструкция призвана унифицировать процессы координатного индексирования документов, выработать единые правила по составлению и ведению словарей ключевых слов (в дальнейшем КС) ЭК библиотеки.

1.3.При определении КС используются:
  • ·        таблицы Универсальной десятичной классификации (УДК,ББК);
  • ·        алфавитно-предметный указатель к таблицам УДК, ББК и систематическому каталогу библиотеки;
  • ·        общие и отраслевые энциклопедические и терминологические словари и справочники, отраслевые тезаурусы;
  • ·        предисловие, аннотация, содержание (оглавление) предметизируемого документа, текст документа.

2. Методика индексирования документа

2.1. Методика индексирования документов с применением уже существующего в программе тезауруса означает, что индексирование документа производится с применением тезауруса , где ПОД составляется на основе КС документа, но представленных в виде устоявшихся понятий, сверенных с тезаурусом.
2.2. Ключевыми словами в традиционном понимании называются полнозначные слова, устойчивые сложные и сложносокращенные слова и терминологические словосочетания, несущие смысловую нагрузку в текстах документов.
Основное требование, которое предъявляется к выбору КС - строгая определенность значения. Для каждой предметной области в первую очередь следует выделять специальные (специфические) термины, употребляемые только в данной отрасли знания, являющиеся как бы ее опознавательными знаками.
В качестве КС могут выступать слова (унитермы), терминологические словосочетания, фразы (в исключительных случаях), аббревиатуры, численные характеристики, хронологические данные, имена собственные, символические обозначения.

2.3.Форма представления КС и КС-словосочетаний в ПОДе.

2.3.1. Термины-слова

2.3.1.1.КС могут быть однословными и в виде словосочетаний.

·        КС –одиночные существительные, а также главные опорные существительные в составе ключевых словосочетаний записываются в единственном или множественном числе в зависимости от своего понятийного содержания.



Например: ДЕНЬГИ
                              МАРКЕТИНГ
 
·        Прилагательные, наречия, числительные, местоимения, которые сами по себе могут выступать в роли КС, употреблять только в словосочетаниях.
                        Например: ДЕНЕЖНЫЕ РЫНКИ
                                                                  ПОСТАВКА ОБОРУДОВАНИЯ
                                                                 ПРОГНОЗИРОВАНИЕ БИЗНЕСА
2.3.1.2. При формулировке КС применяется как единственное, так и множественное число.

Единственное число применяется в следующих случаях:
·        Когда данное понятие не может быть отражено во множественном числе
Например:
                                                                       СФЕРА УСЛУГ
                                                                       МАЛЫЙ БИЗНЕС
·        Обозначает отвлеченное понятие, категорию 
Например:
РИСК, СТОИМОСТЬ
НРАВСТВЕННОСТЬ
ТВОРЧЕСТВО, КУЛЬТУРА
·        Когда лексическая единица обозначает единое понятие.
                                               Например:  
                                                                       АГРОПРОМЫШЛЕННЫЙ КОМПЛЕКС
                                                                       СИСТЕМА ОБРАЗОВАНИЯ
                                                                       ВЫСШАЯ ШКОЛА
                                                                       ОБЩЕОБРАЗОВАТЕЛЬНАЯ ШКОЛА
·      Сведения об отдельных договорах приводятся в форме единственного числа.
                                               Например:
                                                           ДОГОВОР КУПЛИ-ПРОДАЖИ ; ДОГОВОРЫ
                                                           ДОГОВОР АРЕНДЫ ; ДОГОВОРЫ ; АРЕНДА

В ряде случаев используется и единственное, и множественное число.
                                         Например:  
 ТЕАТР (как вид искусства), но
ТЕАТРЫ (как учреждения культуры)

Исчисляемые существительные употребляются в форме множественного числа, а неисчисляемые – в форме единственного числа. При равном употреблении в русском языке единственного и множественного числа предпочтение отдается множественному числу

2.3.1.3. Падеж КС
Имена существительные должны быть представлены в форме именительного падежа. В устойчивом словосочетании возможно применение любого падежа.
                                               Например:
ПАДЕЖИ;БИЗНЕС; БИБЛИОТЕКИ;
ТЕХНИКА БЕЗОПАСНОСТИ

Прилагательные и причастия в словосочетаниях согласуются в роде и числе с соответствующими существительными.

Например:
          ПОЛЕВЫЕ ЦВЕТЫ
          ДЕЙСТВУЮЩИЕ ВУЛКАНЫ

2.3.1.4. Синонимы

При составлении КС применяются синонимы или эквиваленты, если они общеупотребительны, взаимозаменяемы или очень близки по смыслу, а также являются вариантами написания одного и того же термина. При индексировании используются энциклопедические и справочные издания.
Например:
                                                           ЭКОНОМИЯ ; БЕРЕЖЛИВОСТЬ
                                                           ТОРГОВЫЕ МАРКИ ; БРЕНДЫ; БРЭНДЫ
                                                           ПОСТУПОК; ДЕЙСТВИЕ

2.3.1.5. Полисемия
КС могут быть полисемичными (многозначными) как в рамках общенаучной, так и в рамках отраслевой терминологии.
Для устранения полисемии (многозначности) следует использовать специальные реляторы (пояснения), указывающие на принадлежность к определенной отрасли или уточняющие значение КС. Реляторы указываются в скобках через итервал. Допускается релятор представлять сокращением.
                                   Например:
ПОЛЯ (МАТ.)
            ПОЛЯ (ФИЗ.)
2.3.1.6. Названия научных работ, литературных произведений включаются в КС без кавычек вместе с фамилией и инициалами автора на первом месте.                                                        Например:
ПУШКИН А С СКАЗКА О МЕРТВОЙ ЦАРЕВНЕ
                                                      МАРСАН Ж ПУБЛИКЕ СМОТРЕТЬ ЗАПРЕЩЕНО
                                                      КОЛАС Я НОВАЯ ЗЕМЛЯ
2.3.1.7. Для художественных произведений приводятся жанр произведения во множественном числе и его тема.
                                               Например:
РОМАНЫ ; ПОЭМЫ; РОМАНЫ В СТИХАХ ; СТИХОТВОРЕНИЯ
                                                           ТЕМА ЛЮБВИ; ТЕМА ОДИНОЧЕСТВ ; ТЕМА ДЕТСТВА
2.3.1.8. Если статья является официальным документом, то в КС вносятся словосочетания «Официальные материалы» и вид принятого нормативного документа (законы, постановления, распоряжения и т.п.).
2.3.1.9. Если статья является рецензией, рефератом или описывает конференцию, семинар, съезд и т. п., то в КС приводится соответствующий термин: рефераты, рецензии, конференции, семинары, съезды и т. п.

2.3.2. Термины-словосочетания

2.3.2.1. Общеупотребительные термины (методы, принципы, свойства, уравнения, проблемы, значения, применение и. т. п.) приводятся в КС только в сочетании с другими словами, сужающими их значение.
                                               Например:
                                                           ОЦЕНКА РИСКА ;
ПРИНЦИП ВЗАИМОЗАМЕНЯЕМОСТИ ;

2.3.2.2. Для достижения строгой определенности значения прилагательные используются в сочетании с существительными.
                                               Например:
                                                           ВРЕМЕННЫЙ ПЕРСОНАЛ;
                       ПОЛИМЕРНО-БИТУМНЫЕ ВЯЖУЩИЕ МАТЕРИАЛЫ ;
АНГЛИЙСКИЙ ЯЗЫК
ЭКОНОМИЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ


2.3.2.3. Союзы в КС не применяются. Исключение составляет соединительный союз «и». Он используется в исключительных случаях в словосочетаниях, выражающих конкретную связь между понятиями (названия различных законов, методов, теорий, названия актуальной темы исследования или комплексной проблемы).
                                               Например:
ЕДИНСТВА И БОРЬБЫ ПРОТИВОПОЛОЖНОСТЕЙ ЗАКОН
                                                           ГОСУДАРСТВО И ПРАВО; НАУКА И РЕЛИГИ ;
 ИНТЕЛЛИГЕНЦИЯ И ВЛАСТЬ
ЧЕЛОВЕК И ОБЩЕСТВО

2.3.2.4. Предлоги применяются в устойчивых словосочетаниях.
                                               Например:
                                               БУРЕНИЕ НА НЕФТЬ; ЗАЩИТА ОТ ПЫЛИ;
БОРЬБА С КУРЕНИЕМ;
ПОДГОТОВКА К ШКОЛЕ; РАБОТА С ДОКУМЕНТАМИ; ДВИЖЕНИЕ ЗА МИР;
                                               НАЛОГ НА ДОБАВЛЕННУЮ СТОИМОСТ ;
АВАРИИ ПРИ БУРЕНИ;
                                               ОБЩЕСТВА С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ;
2.3.2.5. Слова, состоящие из одной-двух букв, если они являются объектом рассмотрения в статье, приводятся после уточнения.
                                               Например:
                                                           ВИТАМИН А
                                                           ЯЗЫК ПРОГРАММИРОВАНИЯ C ;
ЯЗЫК ПРОГРАММИРОВАНИЯ СИ

Словосочетания необходимо разбивать в следующих случаях:

КС - словосочетание содержит несколько прилагательных – преобразуется в несколько двухсловных КС, в которых одно и то же существительное сопровождается поочередно одним прилагательным

Например:
ПРОФЕССИОНАЛЬНЫЕ БИБЛИОТЕЧНЫЕ ОБЪЕДИНЕНИЯ;=ПРОФЕССИОНАЛЬНЫЕ ОБЪЕДИНЕНИЯ; БИБЛИОТЕЧНЫЕ ОБЪЕДИНЕНИЯ

2.3.2.6. Численные характеристики
Все цифровые обозначения приводятся в КС арабскими цифрами.

2.3.2.7.Хронологические данные

Все данные записываются только арабскими цифрами. Буквы (гг.) не указываются.

                                   Например:
                                      ХХ ВЕК          -       20 ВЕК
    • Хронологический период с точным указанием временных границ приводится в цифровой форме без пробелов со знаком «дефис»  (-).
Например:
                                                           1799-1837
    • Год записывается отдельным ключевым словом.
Например: 2005
    • Десятилетний период записывается как совокупность первого и последнего года этого периода, объединенных знаком дефис без пробелов.
Например:
70-е годы ХIХ века     -       20 ВЕК 70 ГОДЫ
    • Отдельные периоды, для обозначения которых использованы формулировки, включающие в свой состав слова типа «середина ХIХ века», «начало XX» и т.д., включаются в ПОД следующим образом:
Например:
20 ВЕК ВТОРАЯ ПОЛОВИНА
20 ВЕК ВТОРАЯ ТРЕТЬ
 20 ВЕК НАЧАЛО
и т. п.
 Если указывается только одна граница, то используются слова «до» и «после», которые ставятся после обозначения даты без пробела.
Например: 20 ВЕК ДО

·        Возможно включение в ПОД словесного обозначения периода.
                        Например:
СРЕДНЕВЕКОВЬЕ
ДОРЕВОЛЮЦИОННЫЙ ПЕРИОД
ПОСЛЕВОЕННЫЙ ПЕРИОД

2.3.2.9. Имена собственные
В качестве КС приводятся имена собственные.
·        Названия исторических, политических и т. п. событий приводятся как устойчивые словосочетания. В качестве основного словосочетания дается название, приведенное в универсальных и отраслевых энциклопедиях. Также приводятся другие варианты, по которым возможен поиск.
Например:
            ВЕЛИКАЯ ОТЕЧЕСТВЕННАЯ ВОЙНА 1941—1945
            ВОЙНЫ

·        Ключевые слова иногда требуют уточнения. Реляторы указываются в скобках через интервал.

                                               Например:
                                                           ЭТЮДЫ (упражнения)
                                                           ИСТОРИЯ (наука)

    • Светские и религиозные праздники, термины народного календаря записываются полными словосочетаниями без кавычек.
                                               Например:
                                                           ДЕНЬ ПОБЕДЫ ; ДЕНЬ НЕЗАВИСИМОСТИ;
                                                           8 марта    см. МЕЖДУНАРОДНЫЙ ЖЕНСКИЙ ДЕНЬ
    • Нумерация версий программных продуктов приводится в словосочетании с наименованием программного продукта в поле 610.
                                               Например:
Запись в формате BelMarc/Authorities[416]  Excel (программный продукт) (английский язык)   см. MICROSOFT EXCEL (программный продукт ; 1984—) 
Запись в формате BelMarc/Authorities [216]  WINDOWS CE (программный продукт) (английский язык) - 4 док.
См. также: "Microsoft", компания (США) (английский язык)
                                                         
Запись в формате BelMarc/Authorities [610]  Excel 5
Запись в формате BelMarc/Authorities [610]  Windows 2000 


2.3.2.10 Иностранные термины, имеющие соответствующий эквивалент в русском языке, отражаются на русском языке. Не имеющие соответственного эквивалента – на языке оригинала.

Например: INTERNET…….. ИНТЕРНЕТ 

[450]  Internet (английский язык)
   см. ИНТЕРНЕТ

Названия фирм, торговых марок, иностранные термины, не имеющие соответствующего эквивалента в русском языке, отражаются в ЭК на языке оригинала.
                                               Например:
Запись в формате BelMarc/Authorities [210]  "Linxs", центр модной обуви (Гродно)


2.3.2.11. Порядок КС
При формулировке КС используется как прямой порядок следования слов (прямая формулировка КС), так и перестановка слов (инверсионная формулировка КС).
КС включается в ЭК в прямой формулировке в том случае, когда первое слово КС содержит признак предмета - прилагательное, характеризующее качественное своеобразие, разновидность предмета и,  которое в сочетании с существительным образует определенный термин.
                                   Например:
ТЕХНИЧЕСКИЙ ПРОГРЕСС, НО НЕ ПРОГРЕСС ТЕХНИЧЕСКИЙ
ТИПОГРАФСКАЯ ПЕЧАТЬ, НО НЕ ПЕЧАТЬ ТИПОГРАФСКАЯ

·        Прямая формулировка КС сохраняется и при наличии нескольких, уточняющих предмет, определений.
                                   Например:
НАРОДНЫЕ МУЗЫКАЛЬНЫЕ ИНСТРУМЕНТЫ
·        Наименования наук и научных дисциплин, начинающихся со слов «общая», «специальная», включаются в ЭК с этими определениями в прямой форме.
                                   Например:
Запись в формате BelMarc/Authorities [250]  ОБЩАЯ ПЕДАГОГИКА 
[450]  специальная теория относительности
   см. ОТНОСИТЕЛЬНОСТИ ТЕОРИЯ 
·        Наименования прикладных, технических, инженерных специальных дисциплин приводятся в прямой форме.
Например:
Запись в формате BelMarc/Authorities [250]  ТЕХНИЧЕСКАЯ ГРАФИКА 
Запись в формате BelMarc/Authorities [250]  ИНЖЕНЕРНАЯ ГЕОДЕЗИЯ

Инверсия применяется для специальных терминов из различных отраслей знаний, когда эти термины без наличия инверсированной формы теряют изначальный смысл. Термины приводятся в том виде, как даны в отраслевых справочных изданиях. В расчете на массового пользователя, приводится вариант термина без инверсии.
                                               Например:
                                               
    • Законы, правила, явления, теории, формулы и т. п., названные по именам авторов, открывателей и др. приводятся в КС так:
                                               Например:
                                                           НЬЮТОНА БИНОМ 
                                                           ПИФАГОРА ТЕОРЕМА
                                                           ДОПЛЕРА ЭФФЕКТ
    • Теоремы, формулы, законы и т. п., созданные двумя и более авторами, содержат тире между фамилиями разных авторов и дефис между двойной фамилией одного автора.
                                               Например:
                                               БОЙЛЯ–МАРИОТТА ЗАКОН 

Во всех остальных случаях спользуем рекомендации НББ:
ТЕМАТИЧЕСКИЙ ПРЕДМЕТ:
  • На ПЕРВОЕ МЕСТО выноситься ИМЯ СОБСВЕННОЕ (например, Ньютона закон тяготения)
  • Где есть слова МЕТОД, ТЕОРИЯ, ЗАКОН, СИСТЕМЫ, используется ИНВЕРТИРОВАННАЯ ФОРМА (например, Франка метод, Всемирного тяготения закон)
  • При использовании энтитетов по искусству, например, ЖИВОПИСЬ (в источнике белорусская живопись, живопись Беларуси) используем БЕЛОРУССКИЙ*ЖИВОПИСЬ



3.Термины и определения

Индексирование документов– выражение содержания документа и/или смысла информационного запроса на информационно-поисковом языке.

Ключевое слово – информативное слово, приведенное в стандартной лексикографической форме и используемое для координатного индексирования
В традиционном понимании ключевыми словами называются полнозначные слова, устойчивые сложные и сложносокращенные слова и терминологические словосочетания, несущие смысловую нагрузку в текстах документов (в ГОСТах такого определения нет).

Лексическая единица (ЛЕ) – обозначение отдельного понятия, принятое в информационно-поисковом языке и неделимое в этой функции. Лексические единицы могут представлять собой принятые в естественном языке слова, устойчивые словосочетания, аббревиатуры, символы, даты, общепринятые сокращения, лексически значимые компоненты сложных слов.

Поисковый образ документа (ПОД) – поисковый образ, выражающий основное смысловое содержание документа.

Релятор – символ или слово, используемое для различения значений многозначного термина.

Словосочетание – сочетание двух или нескольких слов, объединенных грамматически или по смыслу.

Устойчивое словосочетание – это словосочетание, при добавлении или изъятии слов из которого, меняется его смысл.


Список использованных материалов:

  1. Библиотечное дело: терминологический словарь / РГБ. – 3-е значит. перераб. и доп. изд. – М., 1997. – 168 с.
  2. ГОСТ 7.74-96. Информационно-поисковые языки. Термины и определения.
  3. ГОСТ 7.59-90 (ИСО 5693-85). Индексирование документов. Общие требования к систематизации и предметизации.
  4. ГОСТ 7.66-92. Индексирование документов. Общие требования к координатному индексированию.
  5. ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления.
  6. Никольцева Н. П. О возможности содержательного индексирования документов ключевыми словами / Н. П. Никольцева, О. А. Седышева // Предметный поиск в традиционных и нетрадиционных информационно-поисковых системах. – М., 1998. – Вып. 12. С. 60-73.



Утверждены протоколом заседания
методического совета LibКАРД
№ 3     от «8» февраля           2005 г.

ВЕРНУТЬСЯ НА ГЛАВНУЮ