ЭлБиб

Геоботаника

переменных. Различные ботанические описания регистрируют результаты «природного эксперимента»,

поэтому обработка этих результатов на основе последних достижений математики искусственного интеллекта

(ИИ) представляется перспективным направлением для решения классификационных и прогнозных задач

ботаники. Подобный подход позволит извлекать знания из больших массивов накопленной информации об

экологии и географии растений.

Одним из больших массивов ботанической информации является каталог гербарных этикеток. Работы

по формализации (кодированию) содержимого текстов этикеток осуществляются в ЦСБС СО РАН впервые в

мировой ботанической практике. На основе анализа формализованных экологических и флористических

характеристик мест сбора растений были проведены первые успешные опыты по генерации знаний-правил,

обобщающих сведения из базы данных (БД) гербарных этикеток (Красинский, Красноборов, 1997). Но

условия «природного эксперимента» - климатические, почвенные, ландшафтные, антропогенные, -

неопределенные, информация о них попадает в геоботанические описания посредством экспертных оценок

ботаников разной квалификации, и зачастую является неполной (пропущенные значения в полях электронных

БД). Также не всегда верно определены виды растений. По этой причине наиболее перспективно применить

для анализа гербарной информации теорию нечетких множеств (Кофман, 1982), с целью получения нечетких

продукционных правил-знаний. Нечеткие множества (НМ) и операции над ними концептуально объединяют

общие соображения экспертов с логическим рассуждением. НМ связывают то, что является физическими

истинами, с тем, что представляет собой человеческую интерпретацию фактов и явлений. Автор этой новой

теории Л.Заде подчеркивает, что смысл информации нельзя полностью передать средствами теории

вероятностей. Универсальность математического анализа систем на основе НМ основана на доказанной в

1993 г. теореме Б. Коско, гласящей, что любая математическая система может быть аппроксимирована с

любой наперед заданной точностью системой, основанной на нечеткой логике.

Информация в БД гербария многозначна (противоречива). Классы-таксоны растений также

полиморфичны, что создает их пересечения в признаковом пространстве. Для автоматической обработки

подобной информаций впервые разработан метод распознавания образов на пересекающихся (толерантных)

классах (Красинский В.И., 2002). Основанная на этом методе компьютерная программа-эксперт RECOFAM

точно диагностирует семейства растений. Семейство однозначно определяется по результатам ответов на

2-4 вопроса программы о значениях количественных и качественных признаков особи. Вариант этого

алгоритма многомерного анализа использован для предсказания ошибок в содержании текстов гербарных

этикеток. Программа внедрена в учебный процесс в двух ВУЗах как тренажер для студентов-ботаников.

Можно поставить другую задачу, например, оценки степеней приуроченности растений к экологическим

условиям, что будет соответствовать генерации нечетких правил для последующего создания экспертной

системы (советника эколога). Для работы с недоформализованными экологическими шкалами возможно

применить так называемый семантический дифференциал Ч. Осгуда. В этой методике экспертно определяется

набор качественных признаков (логических или балльных), в частности, это могут быть экологические шкалы.

Признаками описывают понятия предметной области, например, фитоценозы. Дифференциал определяет «размах»

в баллах качественных признаков. Далее встает задача классификации объектов (фитоценозов) по совокупности

качественных признаков, принимая некоторое множество объектов за обучающее (эталонное). Для решения

подобной задачи, на сложность которой указывал еще Л.П Раменский, можно использовать другой метод

ИИ - теорию искусственных нейронных сетей (Emergent.., 1996). Эта теория основывается на работах

акад. А.Н. Колмогорова по аппроксимации сложной функции набором простых. Нейронная сеть является

распределенным вычислителем, решающим на первом этапе задачу классификации эталонных объектов-

прецедентов (этап обучения). Математическая формулировка задачи классификации (метрика расстояния,

критерии оптимизации), естественно, требует проработки в конкретных условиях. На втором этапе обученная

нейросеть распознает предъявляемые объекты (прогнозирует). Литература по этому современному направлению

ИИ очень обширна. Сошлемся на пример применения нейронной сети для выявления культурологических типов

личностных ценностей человека на основе представления исходных данных психологического тестирования

семантическим дифференциалом (Горбань, 2002). Также возможно совместить в одной модели нейросетевой

классификатор с нечеткими входными или выходными лингвистическими переменными, типа «большая-

малая влажность», «болылая-малая освещенность», «приблизительная похожесть» и т. п. Такие гибридные

системы уже применяются в решении сложных технологических и экономических задач.

Описанные выше подходы, в которых можно классифицировать неполную, противоречивую информацию,

с учетом человеческого фактора, весьма перспективны и для решения сложных задач анализа ботанической

информации. Нечеткие множества, отражающие лингвистические переменные, и нечеткие продукционные

правила «если...то...» могуг^служить инструментом для формулирования онтологических моделей, более

адекватных реальным биологическим процессам, чем детерминированные уравнения и типовые реляционные

базы данных.

395

Электронная Научная СельскоХ зяйственная Библиотека