Предсказательное моделирование характеристик урожая озимой пшеницы
315
О =
a
1
П1
t
1
+
a
2
П2
t
2
+ … +
a
N
П
N
tN
,
(1)
где О есть отклик, П1,…,П
N
– предикторы, числа
a
1
,…,
a
N
есть
коэффициенты регрессии, а числа
t
1,…,
tN
есть значения
t
-статистик. В
общем случае могут рассматриваться не сами предикторы, а нелинейные
функции от них. Тогда мы называем предикторы преобразованными, такие
предикторы будем помечать верхним индексом П (П
i
П
). Таблица
преобразований для характеристик рельефа дана в работе (Шарый и др.,
2011). Если абсолютная величина
t
-статистики для данного предиктора
меньше известного из статистических таблиц критического значения, то этот
предиктор статистически незначим в регрессионной модели.
Важно, что предиктор может описывать не только количественные
факторы среды (такие как характеристики рельефа или климата), но и
качественные, такие как типы почв, сорта пшеницы или тип
землепользования. В этом случае предиктор называют
индикатором
, и он
принимает два различных значения, в качестве которых принято выбирать 0
и 1. Если на данной местности имеется
K
типов почв, то для их описания
требуется
K
–1 индикатор. Например, для описания трех типов почв нужно
два индикатора:
Значения индикаторов
Типы почв
И
1
И
2
0
0
Черноземы
1
0
Серые лесные
0
1
Дерново-подзолистые
Поскольку индикаторы принимают значения 0 и 1, их использованию
отвечает несколько ветвей решения уравнения (1).
В основе регрессионного анализа лежат следующие пять базовых
предположений (ошибка или остаток есть разность между наблюденным и
предсказанным моделью значениями отклика):
(А)
Отсутствие систематической ошибки (случайные ошибки в
предикторе должны быть меньше диапазона его изменения; коррекция
удалением таких излишне «шумящих» предикторов).
(Б)
Постоянство дисперсии ошибок (определяется по графику
остатков;
коррекция
применением
нелинейных
преобразований
предикторов).
Электронная Научная СельскоХозяйственная Библ отека