В
иноделие
и
иноградарство
1/2007
10
виноделие
Применение метода
главных компонент
для идентификации и сравнения натуральных вин
В.А. ГАВРИЛИНА, О.И.МАЛЬЦЕВА
Орловский государственный институт экономики и торговли
С.Н. СЫЧЕВ
Орловский государственный технический университет
К.С.СЫЧЕВ
ЗАО фирма «Найтек инструментс», г. Москва
К.К. ПОЛЯНСКИЙ
Воронежский государственный аграрный университет
Часть 1. Сущность применения
метода главных компонент
для описания и сравнения
многокомпонентных
физико-химических систем
Метод сравнения исследуемого образ-
ца
(вещество, изделие или природный объ-
ект с контрольным образцовым или стан-
дартным веществом, изделие или природный
объект) является основой большинства мето-
дов измерений.
Сравнение осуществляется:
методом,когдавеществу,изделиюилипри-
родному явлению присваивается модель,
содержащая ряд параметров, по мнению
авторов модели, позволяющие идентифи-
цировать исследуемый объект с целью его
дальнейшего использования или классифи-
кации;
путем сопоставления измеряемых с опре-
деленной погрешностью параметров моде-
ли исследуемых и контрольных образцов
или стандартных образцов исследуемый объ-
ект идентифицируется на предмет дальней-
шего его использования или классификации.
В любом случае при использовании
метода сравнения возникают две задачи:
разработка и выбор наиболее удачной
в конкретном случае модели вещества,
изделия или природного явления;
определение необходимого и достаточ-
ного количества параметров для идентифи-
кации исследуемого объекта.
Выбор математической модели и способ
задания количества параметров сложных
(многопараметровых) объектов связаны
между собой. Так, при применении нелиней-
ных моделей количество и особенно харак-
тер параметров определяются произвольно,
исходя из производственной необходимости
и экспериментального опыта. Параметры
многопараметровых линейныхмоделеймогут
быть определены как по первому способу,
то есть достаточно произвольно, так и путем
поиска линейно-независимых параметров
линейной модели объекта, непосредственно
не вводимых экспертом по своему усмотре-
нию, но содержащихся в экспериментальной
информации,особеннополипараметрической.
Алгоритм поиска линейно-независимых
параметров линейной модели объекта реа-
лизован в
так называемом
методе главных
компонент (
Д. Лоули, А. Максвелл
, 1967;
К. Иберла
, 1980; [1]).
Метод главных компонент
— это разно-
видность мультикорреляционного анализа,
то ссть метода, основанного на обработке
корреляционныхматрицбольшойразмерно-
сти. Его суть состоит в следующем: элементы
А
ik
(экспериментальные величины полипа-
раметрического анализа) исходной размер-
ности dim
A
=
mхn
приводятся к новым вели-
чинам, имеющим нулевые средние и еди-
ничные дисперсии, по формуле
Ã
ik
= (A
ik
–
Ā
i
)/S
i
,
(1)
где
Ā
i
=
Σ
A
ik
/n
— среднее значение
А
ik
по столбцам;
S
i
— стандартное отклонение.
Далее будем подразумевать, что
матрица
А
преобразована по формуле
(1). Вычисляем корреляционную матрицу
С =
А·A
T
/
(
n
–1), dim
С
=
mхm
, элементы кото-
рой
C
ik
— суть выборочные коэффициенты
парной корреляции исходных признаков
A
i
и
A
k
. Существует ортогональное преоб-
разование системы координат, с помощью
которого матрица
С
приводится к диаго-
нальному виду
V
T
CB
=
Λ
,
(2)
где
V
— матрица преобразования (матрица
векторов);
Λ
— diag (
λ
1
,
λ
2
…
λ
m
) — диагональ-
ная матрица;
λ
1
,
λ
2
– собственные значения
матрицы
С
, отвечающие ее
i
-му собственному
числу
λ
. Матрица
А
при этом преобразуется
по закону:
V
T
A = F
.
A = VF,
(3)
где
F
— преобразованная матрица
A
(матрица факторов), удовлетворяющая
соотношению
A·A
T
/(
n
–1) =
Λ.
(4)
Собственные числа
λ
i
— суть выборочные
дисперсии новых параметров (факторов),
причем последние не коррелируют друг с дру-
гом (их ковариационная матрица
Λ
— диа-
гональная). Преобразуем
λ
i
в (2) таким обра-
зом, чтобы выполнялось условие
λ
1
≥ λ
2
≥
≥ λ
3
≥
…
λ
i
≥
0.
Еслимежду исходнымипризнаками суще-
ствовала линейная зависимость, то только
первые
λ
1
,
λ
2
,
λ
3
,
λ
r
…отличны от нуля, из чего
следует, что последние
m-r
строк матрицы
F
состоят из одних нулей. Поэтому равенство
(3) можно переписать в виде
A
= {
V
}·{
F
},
(5)
где матрицы {
V
} и {
F
} — есть соответствую-
щие подматрицы матриц
V
и
F
.
Вследствие экспериментальной погреш-
ности при измерении параметров
A
ik
все
или большая часть
λ
i
могут оказаться отлич-
ными от нуля, однако при достаточно сильном
различии их значений остаточная диспер-
сия, определенная как
ε
=
Σλ
i
, будет малой
величиной для некоторого числа
r
. Малость
остаточной дисперсии
ε
оценивается, исходя
из заранее сформулированных требований
точности. Оценкой вклада
r
факторов может
служить величина
r m r
q
=
Σ λ
i
/
Σλ
i
=
Σλ
i
/
m.
(6)
I
=1
I
=1
I
=1
При введении меры информации,
как величины, пропорциональной следу
ковариационной матрицы параметров,
по (6) можно судить об объеме информации,
содержащейся в параметрах
A
1
,
A
2
,
A
3
,…,
A
m
и сохраняющейся при переходе к новым
параметрам
F
1
,
F
2
,…,
F
r
, которые называются
главными компонентами (факторами).
Обычно меру информации получают
в виде
q
·100% и называют вкладом фактора
F
i
в информацию, содержащуюся в исходной
матрице
А
.
При использовании метода главных ком-
понент мы предполагаем, что несколько
измеряемых переменных сильно коррелиру-
ют друг с другом. Это означает, что, либо они
взаимно определяют друг друга, либо связь
между ними обусловливается третьей вели-
чиной, которую непосредственно измерить
нельзя. Модель главных компонент связана
с последним предположением и дает воз-
можность получить числовые значения этих
третьих величин в виде набора линейно-
независимых факторов
F
, которые описы-
вают и воспроизводят исходную матрицу
с необходимой точностью в виде
А
(
ij
)
=
[
F
1
(i)·V
1
(j) + F
2
(i)·V
2
(j) +…] S
i
+ H
i
(7),
где
V
1
(
j
) и
V
2
(
j
) — коэффициенты линейной
модели из подматрицы {
V
};
F
1
(
i
),
F
2
(
i
) —
линейно-независимые факторы (параметры)
из подматрицы {
F
};
S
i
— стандартное откло-
нение по строкам;
H
i
— среднее значение
по cтрокам матрицы
А; А
(
ij
) —элемент исход-
ной матрицы
А
.
Применение метода главных компо-
нент для получения линейно-незави-
симых параметров вина.
Примером
использования этого метода для получе-
ния линейно-независимых параметров
может служить обработка многоволно-
Электронная Научная СельскоХозяйственная Библио ека