Правила и приемы индексирования документа
Автор изображения: Новикова М. И.Источник: Владимирская областная научная библиотека

Методическая консультация предназначена для работников библиотек, которые занимаются индексированием документов. Использование методических рекомендаций поможет принять верное решение при выборе классификационного индекса, предметных рубрик, ключевых слов и обеспечит единообразие индексирования однотипных документов.

Индексирование – это выражение содержания документа и/или смысла информационного запроса на информационно-поисковом языке с помощью терминов индексирования (ГОСТ 7.74-96). Индексирование является основным средством раскрытия содержания документа, составляющего фонд библиотеки.

Индексирование проводится на основе непосредственного анализа документа с учётом характера информационно-поискового массива, элементом которого станет поисковый образ документа, характера информационных потребностей пользователей данной информационно-поисковой системы, в соответствии с общими принципами индексирования и особенностями их применения в конкретной организации.

Поисковый образ документа – это выраженное в терминах формализованного информационно-поискового языка основное смысловое содержание документа (а не вся информация, содержащаяся в документе), которое поставлено в однозначное соответствие этому документу, по которому производится отыскание данного документа в массиве других документов.

Индексирование документов реализуется по следующим принципам (они же процессы): классификационный (систематизация), предметизационный (предметизация) и принцип координатного индексирования (подбор ключевых слов). Библиотека сама решает какие принципы индексирования является для неё ведущими.

Классификационный принцип индексирования базируется на представлении содержания документа в некоторой специально разработанной классификационной системе (ББК, УДК) и использовании в качестве терминов индексирования классификационных индексов.

Предметизационный принцип индексирования базируется на представлении содержания документа в понятийной системе определенного естественного языка (русского, английского и т. д.) и использовании в качестве терминов индексирования лексических единиц естественного языка.

Координатное индексирование — это вид индексирования, при котором смысловое содержание документа и (или) запроса многоаспектно выражается множеством ключевых слов.

Пересистематизация — это плановое редактирование полей 6 блока, а также повторная обработка документов, по причине выявленных ошибок и (или) недостатков при индексировании. Внешней причиной для пересистематизации  являлся выход в свет новых выпусков Таблиц ББК.

 

Индексирование на любом из информационно-поисковом языке включает следующие этапы работы: выделение в документе тем, подлежащих отражению в виде отдельных тематических фрагментов; выбор понятий, характеризующих темы документа; выбор терминов индексирования (классификационный индекс, предметные рубрики, ключевые слова) для обозначения понятий — всё это для формирования поискового образа документа.

  1. Классификационный индекс состоит из одной или нескольких лексических единиц, которые следует выражать цифровыми или смешанными (буквенно-цифровыми) обозначениями с использованием синтаксических знаков. В зависимости от количества лексических единиц в классификационном индексе различают простой, сложный или составной классификационные индексы. Один или несколько классификационных индексов, отражающих в совокупности содержание данного документа, составляют поисковый образ документа в виде полного индекса (ГОСТ 7.59-2003). Рекомендуем использовать сложный полный классификационный индекс, применяя Таблицы общих типовых делений (ОТД), Таблицы территориальных типовых делений (ТТД) и др.

В пределах одного отдела или раздела Таблиц ББК используются Специальные типовые деления (СТД). Отличительным признаком СТД является знак «-» (дефис) перед их цифровой частью. СТД помещаются непосредственно под индексами тех отделов или разделов, для детализации которых они предназначены. Наиболее детализированные Таблицы СТД даются к крупным отделам и разделам (история, психология и др.).

Пример классификационного индекса c СТД в поле 686:

200 1#$aГроссмейстер разведки$e16+$fВладимир Антонов

686 ##$a63.3(2)6-36-8Судоплатов П.А.$vLBC/M$2rubbk

 

Пример составного классификационного индекса в поле 686. Первый полочный индекс «+» (плюс) второй индекс:

200 1#$aСжигание и термическая переработка твердых топлив$eучебное пособие$fА. Б. Бирюков, И. П. Дробышевская, Е. Ю. Рубан

686 ##$a31.352я73$vLBC/M$2rubbk

686 ##$a35.512я73$vLBC/M$2rubbk

  1. Алфавитно-предметный указатель (АПУ) — это указатель, состоящий из упорядоченного по алфавиту множества слов, словосочетаний и фраз естественного языка, обозначающих предметы какой-либо отрасли науки или практической деятельности. АПУ — обязательная составная часть любого издания таблиц классификации. Он обеспечивает вербальный (словесный) вход в таблицы. Рассредоточенные в таблицах характеристики понятий, объектов и т. п. здесь собираются вместе. Это позволяет отразить все вопросы в двух аспектах: в предметном — в указателе и в систематическом — в таблицах. Таким образом, таблицы и указатель образуют единое, органически взаимосвязанное целое. Надо помнить, что указанные в АПУ индексы нельзя сразу же использовать. Указатель — это вспомогательный аппарат. По указанному индексу необходимо обратиться к таблицам и ознакомиться с содержанием классификационного деления, его детализацией и имеющимися методическими указаниями. АПУ способствует взаимопроникновению методов систематизации и предметизации, усиливает взаимодействие двух принципов стратегии поиска – «сверху вниз», то есть от общего к частному и «снизу вверх», то есть от частного к общему.
  2. Предметизация – вид индексирования, вид обработки документа. Объектом предметизации является документ в целом, а цель предметизации заключается в формировании предметных рубрик. Документная предметизация – это процесс представления содержания, формы и назначения документа посредством специально разработанных предметных рубрик.

Предмет (документа, информационного запроса) – конкретный объект (материальная вещь, понятие, свойство или отношение), который рассматривается или упоминается в документе или информационном запросе. Обычно в каждом документе упоминается или рассматривается не один, а некоторое множество таких объектов. Предмет раскрывает основную тему документа, его форму и читательское назначение.

Предметная рубрика – это унифицированное языковое выражение, представленное средствами естественного языка, отражающее предмет документа и используемое для обеспечения контролируемого доступа к его содержанию.

Предметные рубрики состоят, как правило, из заголовка (одно или несколько слов или развёрнутое словосочетание) и подзаголовка, уточняющего, ограничивающего заголовок.

Пример предметной рубрики в поле 606:

200 1#$aПротиводействие коррупции в судебных системах зарубежных стран: организационно-правовой аспект$eмонография$fН. С. Посулихина, А. Б. Козырева

606 1#$2nlr_sh$3RU\NLR\AUTH\661308566$aКоррупция$xБорьба с ней$xМеждународно-правовые вопросы$jМонографии

686 ##$a67.911.15,021$vLBC/M$2rubbk

 

При формулировании предметной рубрики применяется полная форма наименования предмета. Некоторые аббревиатуры, имеющие широкое распространение, могут применяться в качестве предметных рубрик. Важно не допускать одновременного использования полной и сокращённой форм. Для художественных произведений предметные рубрики не определяются.

По правилам, предметизационное решение выражают одной или несколькими предметными рубриками составляющими поисковый образ документа. В зависимости от степени конкретизации представления предмета и его аспектов различают адекватные и обобщающие предметные рубрики. При окончательном выборе лексической единицы в процессе оформления предметной рубрики следует обозначать предмет и его аспекты с необходимой и достаточной для данной информационно-поисковой системы адекватностью.

Предметные рубрики – это термины индексирования, поисковые и организующие средства. Важно при выборе терминов индексирования проверить не только соответствие отобранных смысловых компонентов содержанию документа, а также правильность оформления терминов индексирования в поисковом образе документа с учётом установленных между ними связей и отношения. Иными словами, классификационный индекс и предметные рубрики должны сочетаться.

Пример предметной рубрики в поле 606:

200 1#$aФранцузская грамматика в схемах и таблицах$e12+$fГ. В. Костромин

606 1#$2nlr_sh$3RU\NLR\AUTH\661143637$aФранцузский язык$xГрамматика$jУчебные издания

686 ##$a81.471.1-2я7$vLBC/M$2rubbk

 

В предметных рубриках допускаются словосочетания с союзом «и», например:

606 1#$2nlr_sh$3RU\NLR\AUTH\6601627072$aМировая литература и культура$jВоспоминания, записки и т. п.

606 1#$2nlr_sh$3RU\NLR\AUTH\661016865$aЯзык и общество$jМонографии

 

  1. Ключевое слово — это информативное слово или словосочетание, приведённое к стандартной лексической форме и используемое для координатного индексирования (ГОСТ 7.74-96). Ключевое слово — это существительное, существительное в сочетании с прилагательным, числительным. Также ключевыми словами являются полнозначные слова, устойчивые сложные и сложносокращённые слова и терминологические словосочетания. Ключевые слова выбираются, как наиболее значимые слова из текста, заглавия, продолжения заглавия, аннотации.

Ключевые слова формируются в именительном падеже. В устойчивых словосочетаниях допускается употребление родительного падежа, например: базы данных, система слежения.

Ключевые слова употребляются в форме множественного числа, например: христиане, налоги. Существительные, не имеющие форму множественного числа — в форме единственного числа, например: маркетинг, пролетариат.

В ключевых словах не применяются инверсии, например: механические системы (но не системы механические).

Как правило используются двухсловные ключевые слова, но допускается употребление словосочетаний из нескольких слов, например: малый круг кровообращения.

В качестве ключевых слов не используются общенаучные понятия, например: значение, развитие, проблемы и др.

Все числа в ключевых словах пишутся арабскими цифрами, например: 7 международная конференция, 9 класс.

В поле 610 ключевые слова вводятся без сокращения, без кавычек, строчными буквами (кроме имён собственных).

Примеры:

1#$aагропромышленные комплексы

1#$aДень Победы

Сегодня координатное индексирование применяется в третью очередь, в приоритете классификационные индексы и предметные рубрики. В случае отсутствия в базе Единого авторитетного файла РНБ библиотекарь сам определяет ключевое слово.

Пример ключевого словосочетания в поле 610:

200 1#$aВзаимодействие органов прокуратуры с постоянно действующими координационными совещаниями по обеспечению правопорядка в субъектах Российской Федерации$eмонография$fЕ. В. Ступаченко$gавт. Ред.

606 1#$2nlr_sh1$3RU\NLR\AUTH\66244851$aПрокуратура$xОбщий надзор$jМонографии

606 1#$2nlr_sh$3RU\NLR\AUTH\661595947$aПрокуратура$xОрганизация работы$yРоссийская Федерация$xСубъекты$jМонографии

610 1#$aорганы прокуратуры

686 ##$a67.721-91,021$vLBC/M$2rubbk

 

Ошибки в  индексировании документов

Жёлтым маркером отмечены ошибки.

  1. Неправильное понимание назначения и использования ключевых слов. Неточный классификационный индекс.

Фрагмент записи:

200 1#$aСемейное право$eучебник и практикум$fТ. И. Нестерова

210 ##$aМосква$cПроспект$d2022

606 1#$2nlr_sh$3RU\NLR\AUTH\661262178$aСемейное право$yРоссийская Федерация$jУчебные издания для высших учебных заведений

610 1#$aсемейное право

610 1#$aучебник для вузов

610 1#$aзакон

686 ##$a67.404.4я73$vLBC/RL$2rubbk

 

Ошибки: В поле 606 стоит предметная рубрика «Семейное право» и указано читательское назначение «Учебные издания для высших учебных заведений», поэтому повторы в поле 610 не нужны. Семейное право является системой правовых норм, регулирующих семейные отношения, а закон, регулирующий семейное право, имеет название — «Семейный кодекс Российской Федерации». Поэтому третье ключевое слово в поле 610 не нужно. Правильный индекс для этого издания — 67.404.5я73-5

 

  1. Неточно определены предметные рубрики в поле 606, в поле 607 (Географическое название как предмет). Неточный классификационный индекс.

Фрагмент записи:

200 1#$aДом правительства. Сага о русской революции$e[12+]$fЮрий Слёзкин

210 ##$aМосква$cАСТ$cCorpus$d2020

607 ##$2nlr_sh$3RU\NLR\AUTH\661259397$aРоссия$xИстория$z20 в.

607 ##$2nlr_sh$3RU\NLR\AUTH\6601575308$aРоссия$xБыт и нравы$z20 в.

610 1#$aСССР

610 1#$aистория России

610 1#$aПервый Дом Советов

686 ##$a63.3(2)6$vLBC/RL$2rubbk

 

Ошибки: В издании речь идёт о Доме на набережной и его жильцах в разные годы 20 века. Этот жилой комплекс был построен в 1931 году в Москве. Необходима географическая привязка к Москве в поле 606 и в поле 607, а также  в классификационном индексе. Ключевые слова не нужны. Правильный вариант:

606 1#$2nlr_sh$3RU\NLR\AUTH\661405649$aЗдания$xИстория$yМосква, город

606 1#$2nlr_sh$3RU\NLR\AUTH\6601585411$aБыт и нравы$yСССР$z2-я пол. 20 в.

607 ##$2nlr_sh$3RU\NLR\AUTH\661259397$aРоссия$xИстория$z20 в.

607 ##$2nlr_sh$3RU\NLR\AUTH\661405650$a»Дом на набережной»

686 ##$a63.3(2-2Москва)6-75$vLBC/RL$2rubbk

 

  1. В электронной записи на издание о жизни и деятельности знаменитых писателей, художников, политиков и др. необходимо использовать не только поле 600, но и поле 606. Неточный классификационный индекс.

Фрагмент записи:

200 1#$aЛесков. Прозёванный гений$fМайя Кучерская

210 ##$aМосква$cМолодая гвардия$d2021

600 #1$2nlr_sh$3RU\NLR\AUTH\6601634440$aЛесков$bН. С.$gНиколай Семенович$f1831 — 1895$xБиография

610 1#$aрусская литература

610 1#$aрусские писатели

610 1#$aЛесков Н.С.

610 1#$aбиографии

686 ##$a83.3Р1-8Лесков$vLBC/SL$2rubbk

 

Ошибки: В издании речь идёт о жизни русского писателя Н. С. Лескова. В поле 606 необходимо поставить предметные рубрики, которые укажут на род деятельности персоны, а также век, когда он творил. Для детализации материала о писателе после фамилии и инициалов через «,» пишем 2 — биография писателя. Ключевые слова не нужны.

Правильный вариант:

600 #1$2nlr_sh$3RU\NLR\AUTH\6601634440$aЛесков$bН. С.$gНиколай Семенович$f1831 — 1895$xБиография

606 1#$2nlr_sh$3RU\NLR\AUTH\6616122$aРусская литература$z19 в.$jБиографии

606 1#$2nlr_sh1$3RU\NLR\AUTH\66973584$aРусские писатели$z19 в.$jБиографии

686 ##$a83.3Р1-8Лесков Н. С.,2$vLBC/SL$2rubbk

 

  1. Недостаточно предметных рубрик для полного раскрытия темы.

Фрагмент записи:

200 1#$aГранд-отель «Бездна»$eбиография Франкфуртской школы$fСтюарт Джеффрис$g[пер. Максима Фетисова]

210 ##$aМ.$cАд Маргинем Пресс$d2018

606 1#$a«Франкфуртская школа»$2nlr_sh$3RU\NLR\AUTH\669127

686 ##$a87.3(4Гем)6-754$vLBC/M$2rubbk

 

Ошибки: В записи к изданию, посвященному какому-либо философскому направлению или школе, для полного раскрытия темы одной предметной рубрики недостаточно. К данному изданию необходимо добавить три предметные рубрики. Фамилию одного из основателей Франкфуртской школы в поле 600, и что школа принадлежит течению неомарксизм немецкой философии 20 века.

Правильный вариант:

600 #1$2nlr_sh$3RU\NLR\AUTH\661444186$aХоркхаймер$bМ.$gМакс$f1895 — 1973$xФилософские взгляды

606 1#$2nlr_sh$3RU\NLR\AUTH\6669291$aФилософия немецкая$z20 в.

606 1#$2nlr_sh$3RU\NLR\AUTH\661594872$aНеомарксизм$xИстория

606 1#$2nlr_sh$3RU\NLR\AUTH\669127$a»Франкфуртская школа»

686 ##$a87.3(4Гем)6-754$vLBC/M$2rubbk

 

  1. Классификационный индекс не сочетается с предметной рубрикой. Неточный классификационный индекс.

Фрагмент записи:

200 1#$aБлюз черных дыр и другие мелодии космоса$fЖанна Левин$gперевод с английского Андрея Ростовцева$gпод редакцией Инны Безруковой

210 ##$aМосква$cАСТ$cCORPUS$d2021

606 1#$2nlr_sh$3RU\NLR\AUTH\66129230$aЧерные дыры

610 1#$aастрономия

610 1#$aастрофизика

610 1#$aчерные дыры

610 1#$aгравитационные волны

686 ##$a22.63$vLBC/M$2rubbk

 

Ошибки: Теме «Черные дыры» соответствует классификационный индекс — 22.637.5 Иерархически он сильно «снизу» от индекса — 22.63, поэтому целесообразно дать предметную рубрику «Астрофизика релятивистская».  А также заменить  ключевое слово «гравитационные волны» единым авторитетным файлом РНБ. Остальные ключевые слова не нужны.

Правильный вариант:

606 1#$2nlr_sh$3RU\NLR\AUTH\66199383$aАстрофизика релятивистская

606 1#$2nlr_sh$3RU\NLR\AUTH\66129230$aЧерные дыры

606 1#$2nlr_sh$3RU\NLR\AUTH\66268072$aГравитационные волны

686 ##$a22.637.5$vLBC/M$2rubbk

 

  1. В поле 606 первый индикатор всегда — 1.

Фрагмент записи:

200 1#$aЕда для радости$eзаписки диетолога$e[нетревожный подход к питанию$e12+]$fЕлена Мотова

210 ##$aМосква$cАСТ$cCorpus$d2021

606 0#$2nlr_sh$3RU\NLR\AUTH\661451108$aДиетология

606 0#$2nlr_sh$3RU\NLR\AUTH\66462912$aПитание рациональное

686 ##$a51.230$vLBC/PL$2rubbk

 

Ошибки: Поле 606 — наименование темы как предмет. Поле содержит слово или словосочетание, отражающее содержание документа, представленное в форме точки доступа. Значение первого индикатора всегда 1.

 

Скачать текст консультации