вантныв для БД. Для индексирования журнальной статьи требу
ется в среднем 6-7 понятий, но в зависимости от документа их
может быть только 2 или больше. Все понятия, выделенные в
процессе анализа содержания документа, должны быть адекват
но переведены на язык индексирования. Наиболее важным пра
вилом индексирования является правило конкретности: для вы
бранных понятий подбирается дескриптор, который максималь
но конкретно отражает это понятие.
Рассмотрим влияние индексирования конкретными и
широкими терминами (несоблюдение правила конкретности) на
результаты поиска.
1. Если индексатор приписал документу термин «пше
ница», автоматизированная система, реализуя связи тезауруса,
припишет этому документу термин «зерновые культуры», т.о.,
система поиска может выдать документ и на запрос «все о пше
нице», и на запрос «все о зерновых культурах».
2. Если же документу индексатор приписал термин
«зерновые культуры», то для запроса «все о пшенице» он «поте
рян», а будет присутствовать только в выдаче на запрос «все о
зерновых культурах».
Автоматическое приписывание вышестоящих терми
нов, существующее в БД «АГРОС», устраняет необходимость
избыточного ручного индексирования. Однако если термины в
тезаурусе не имеют соответствующих вышестоящих терминов,
но они являются важными для поиска, их следует записать в
ПОД.
Существуют особые случаи использования терминов
разного уровня конкретности, а именно: в документе рассматри
вается несколько объектов одного рода, а один из них - особен
но подробно. Тогда для описания всей группы рассмотренных
объектов следует использовать и более широкие термины, и бо
лее узкие. При поиске в тезаурусе дескрипторов для отражения
выделенного понятия возможны следующие ситуации.
1.
В тезаурусе имеется дескриптор, точно отражающий
выбранное понятие. В этом случае индексатор должен убедиться
в том, что понимаемое им значение выделенного понятия доку
мента совпадает со значением дескриптора тезауруса, а именно,
78
Научная электронная библиотека ЦНСХБ