Table of Contents Table of Contents
Previous Page  12 / 52 Next Page
Information
Show Menu
Previous Page 12 / 52 Next Page
Page Background

В

иноделие

и

иноградарство

1/2007

10

виноделие

Применение метода

главных компонент

для идентификации и сравнения натуральных вин

В.А. ГАВРИЛИНА, О.И.МАЛЬЦЕВА

Орловский государственный институт экономики и торговли

С.Н. СЫЧЕВ

Орловский государственный технический университет

К.С.СЫЧЕВ

ЗАО фирма «Найтек инструментс», г. Москва

К.К. ПОЛЯНСКИЙ

Воронежский государственный аграрный университет

Часть 1. Сущность применения

метода главных компонент

для описания и сравнения

многокомпонентных

физико-химических систем

Метод сравнения исследуемого образ-

ца

(вещество, изделие или природный объ-

ект с контрольным образцовым или стан-

дартным веществом, изделие или природный

объект) является основой большинства мето-

дов измерений.

Сравнение осуществляется:

методом,когдавеществу,изделиюилипри-

родному явлению присваивается модель,

содержащая ряд параметров, по мнению

авторов модели, позволяющие идентифи-

цировать исследуемый объект с целью его

дальнейшего использования или классифи-

кации;

путем сопоставления измеряемых с опре-

деленной погрешностью параметров моде-

ли исследуемых и контрольных образцов

или стандартных образцов исследуемый объ-

ект идентифицируется на предмет дальней-

шего его использования или классификации.

В любом случае при использовании

метода сравнения возникают две задачи:

разработка и выбор наиболее удачной

в конкретном случае модели вещества,

изделия или природного явления;

определение необходимого и достаточ-

ного количества параметров для идентифи-

кации исследуемого объекта.

Выбор математической модели и способ

задания количества параметров сложных

(многопараметровых) объектов связаны

между собой. Так, при применении нелиней-

ных моделей количество и особенно харак-

тер параметров определяются произвольно,

исходя из производственной необходимости

и экспериментального опыта. Параметры

многопараметровых линейныхмоделеймогут

быть определены как по первому способу,

то есть достаточно произвольно, так и путем

поиска линейно-независимых параметров

линейной модели объекта, непосредственно

не вводимых экспертом по своему усмотре-

нию, но содержащихся в экспериментальной

информации,особеннополипараметрической.

Алгоритм поиска линейно-независимых

параметров линейной модели объекта реа-

лизован в

так называемом

методе главных

компонент (

Д. Лоули, А. Максвелл

, 1967;

К. Иберла

, 1980; [1]).

Метод главных компонент

— это разно-

видность мультикорреляционного анализа,

то ссть метода, основанного на обработке

корреляционныхматрицбольшойразмерно-

сти. Его суть состоит в следующем: элементы

А

ik

(экспериментальные величины полипа-

раметрического анализа) исходной размер-

ности dim

A

=

mхn

приводятся к новым вели-

чинам, имеющим нулевые средние и еди-

ничные дисперсии, по формуле

Ã

ik

= (A

ik

Ā

i

)/S

i

,

(1)

где

Ā

i

=

Σ

A

ik

/n

— среднее значение

А

ik

по столбцам;

S

i

— стандартное отклонение.

Далее будем подразумевать, что

матрица

А

преобразована по формуле

(1). Вычисляем корреляционную матрицу

С =

А·A

T

/

(

n

–1), dim

С

=

mхm

, элементы кото-

рой

C

ik

— суть выборочные коэффициенты

парной корреляции исходных признаков

A

i

и

A

k

. Существует ортогональное преоб-

разование системы координат, с помощью

которого матрица

С

приводится к диаго-

нальному виду

V

T

CB

=

Λ

,

(2)

где

V

— матрица преобразования (матрица

векторов);

Λ

— diag (

λ

1

,

λ

2

λ

m

) — диагональ-

ная матрица;

λ

1

,

λ

2

– собственные значения

матрицы

С

, отвечающие ее

i

-му собственному

числу

λ

. Матрица

А

при этом преобразуется

по закону:

V

T

A = F

.

A = VF,

(3)

где

F

— преобразованная матрица

A

(матрица факторов), удовлетворяющая

соотношению

A·A

T

/(

n

–1) =

Λ.

(4)

Собственные числа

λ

i

— суть выборочные

дисперсии новых параметров (факторов),

причем последние не коррелируют друг с дру-

гом (их ковариационная матрица

Λ

— диа-

гональная). Преобразуем

λ

i

в (2) таким обра-

зом, чтобы выполнялось условие

λ

1

≥ λ

2

≥ λ

3

λ

i

0.

Еслимежду исходнымипризнаками суще-

ствовала линейная зависимость, то только

первые

λ

1

,

λ

2

,

λ

3

,

λ

r

…отличны от нуля, из чего

следует, что последние

m-r

строк матрицы

F

состоят из одних нулей. Поэтому равенство

(3) можно переписать в виде

A

= {

V

}·{

F

},

(5)

где матрицы {

V

} и {

F

} — есть соответствую-

щие подматрицы матриц

V

и

F

.

Вследствие экспериментальной погреш-

ности при измерении параметров

A

ik

все

или большая часть

λ

i

могут оказаться отлич-

ными от нуля, однако при достаточно сильном

различии их значений остаточная диспер-

сия, определенная как

ε

=

Σλ

i

, будет малой

величиной для некоторого числа

r

. Малость

остаточной дисперсии

ε

оценивается, исходя

из заранее сформулированных требований

точности. Оценкой вклада

r

факторов может

служить величина

r m r

q

=

Σ λ

i

/

Σλ

i

=

Σλ

i

/

m.

(6)

I

=1

I

=1

I

=1

При введении меры информации,

как величины, пропорциональной следу

ковариационной матрицы параметров,

по (6) можно судить об объеме информации,

содержащейся в параметрах

A

1

,

A

2

,

A

3

,…,

A

m

и сохраняющейся при переходе к новым

параметрам

F

1

,

F

2

,…,

F

r

, которые называются

главными компонентами (факторами).

Обычно меру информации получают

в виде

q

·100% и называют вкладом фактора

F

i

в информацию, содержащуюся в исходной

матрице

А

.

При использовании метода главных ком-

понент мы предполагаем, что несколько

измеряемых переменных сильно коррелиру-

ют друг с другом. Это означает, что, либо они

взаимно определяют друг друга, либо связь

между ними обусловливается третьей вели-

чиной, которую непосредственно измерить

нельзя. Модель главных компонент связана

с последним предположением и дает воз-

можность получить числовые значения этих

третьих величин в виде набора линейно-

независимых факторов

F

, которые описы-

вают и воспроизводят исходную матрицу

с необходимой точностью в виде

А

(

ij

)

=

[

F

1

(i)·V

1

(j) + F

2

(i)·V

2

(j) +…] S

i

+ H

i

(7),

где

V

1

(

j

) и

V

2

(

j

) — коэффициенты линейной

модели из подматрицы {

V

};

F

1

(

i

),

F

2

(

i

) —

линейно-независимые факторы (параметры)

из подматрицы {

F

};

S

i

— стандартное откло-

нение по строкам;

H

i

— среднее значение

по cтрокам матрицы

А; А

(

ij

) —элемент исход-

ной матрицы

А

.

Применение метода главных компо-

нент для получения линейно-незави-

симых параметров вина.

Примером

использования этого метода для получе-

ния линейно-независимых параметров

может служить обработка многоволно-

Электронная Научная СельскоХозяйственная Библио ека