Библиотека

Планирование эксперимента в нестандартных областях факторного пространства

Радченко С.Г.

Источник: Вестник ХНТУ. – 2007. – №2(28). – С. 281...285: ил. 4. – Библиогр.: 10 назв.


Постановка проблемы

Многофакторные статистические модели получили значительное распространение в научных и прикладных исследованиях. Они используются при создании и совершенствовании различных сложных систем. Статистические модели особенно необходимы в тех случаях, когда возможности конструирования, производства и эксплуатации, основанные на традиционных физических принципах, исчерпаны или приводят к нецелесообразно большим затратам.

При получении статистических регрессионных моделей необходимо использовать методологию теории планирования эксперимента [1, 2]. Известные традиционные методы планирования многофакторного эксперимента предполагают формы факторных пространств в виде многомерных прямоугольного параллелепипеда (куба), сферы и симплекса. В нестандартных областях факторного пространства поиск наилучших условий получения моделей в общем виде по публикациям не известен, кроме метода регуляризации. Единичные случаи таких задач решались численными методами.

Анализ достижений и публикаций по теме исследования

Причины возникновения нестандартных областей факторного пространства следующие: 1) параметры (факторы) однородного ряда технических и технологических объектов связаны зависимостью близкой к линейной [3, с. 338], 2) обработка результатов эксперимента при условии, что уровни факторов не могут быть достаточно точно выдержаны по матрице плана эксперимента, 3) Обработка результатов пассивного (специально не организованного) эксперимента.

В нестандартных областях факторного пространства наблюдается корреляция факторов и, следовательно, их главных эффектов и взаимодействий при построении регрессионных моделей. Мультиколлинеарность эффектов (взаимная сопряженность их) затрудняет или делает невозможным устойчивое определение структуры и коэффициентов уравнения регрессии, содержательную интерпретацию причинных и структурных связей между эффектами и моделируемым откликом. При значительной мультиколлинеарности эффектов задача является некорректно поставленной и целесообразное использование уравнения регрессии теряет смысл.

Редактор русского перевода сборника статей [4] д.ф.-м.н. Н.Г. Волков считает, что «необходимы устойчивые методы и алгоритмы, обладающие ясными математическими свойствами в смысле их оптимальности» [4, с. 6].

Особенностью широко используемого при получении статистических моделей метода наименьших квадратов является его неустойчивость, «если не делать каких-то дополнительных предположений, которые трудно проверяемы» [5, с. 94]. Поэтому при решении прикладной задачи необходимо, по мнению исследователя, не только сформулировать систему необходимых предпосылок, но и методики их проверок [6]; устойчивость предпосылок и метода получения моделей к сравнительно малым нарушениям принятых условий; систему действий исследователя, если принятые предпосылки не выполняются фактически [7, с. 55...65].

Ведущий научный сотрудник механико-математического факультета МГУ им. М.В. Ломоносова А.М. Шурыгин, обсуждая проблему устойчивости оценивания параметров распределения и статистических моделей, приходит к следующему выводу. «В классической статистике отсутствует понятие устойчивости решения, и этим она невыгодно отличается от других ветвей прикладной математики. Предполагается, что если решение оптимально в рассматриваемой модели, то в похожей модели оно будет близко к оптимальному. Но такое предположение не обосновано. На «неуниверсальность» оценок максимума правдоподобия указывал А.Н. Колмогоров» [8, c. 161].

Некоторые специалисты констатируют сложность и трудность решения проблемы мультиколлинеарности: «Однозначного ответа на этот вопрос нет» [9, c. 94].

Цель статьи

Обоснование методов устойчивого оценивания структуры и коэффициентов многофакторных статистических моделей для произвольных (нестандартных) форм факторного пространства с наилучшими возможными критериями качества полученных моделей.

Основная часть

Факторное пространство, соответствующее многомерному прямоугольному параллелепипеду, принимается за прообраз факторного пространства Rпр.

Используя методы планирования эксперимента, в прообразе всегда можно получить статистические модели с наилучшими характеристиками. Произвольная область факторного пространства, не соответствующая стандартной форме, принимается за образ факторного пространства Ro. Получить в нем статистические модели с наилучшими характеристиками традиционными методами не представляется возможным. Необходимо найти метод перехода от заданного плохо обусловленного факторного пространства Ro образа к хорошо обусловленному факторному пространству Rпр прообраза, в котором и необходимо решать поставленную задачу.

Впервые предложено использовать топологическое отображение прообраза факторного пространства в образ факторного пространства [7, c. 190...197]. Две системы Rпр и Ro при взаимно однозначном и взаимно непрерывном отображении будут изоморфными, т. е. равными по виду, форме. Понятие изоморфизма включает в себя как частный случай понятие гомеоморфизма. Гомеоморфные пространства топологически эквивалентны. При рассмотрении топологического отображения метрические свойства множеств Xпр (прообраз) и Xo (образ) не используются. Следовательно, отображаемые множества Xпр, Xo могут характеризоваться различными метрическими свойствами.

Сформулированы в общем виде пять методов ортогонального представления коррелированных факторов.

1) Ортогональность представления коррелированных факторов путем отображения точек прообраза – значений уровней факторов Xпр в соответствующие им точки образа – значения уровней факторов Xo (1 ≤ ik, 1 ≤ иN) [7, c. 195].

Xio = fiотоб (X1пр, ..., Xkпр). (1)

Функции fiотоб и обратные функции fiотоб-1 должны быть непрерывны. Функции отображения fiотоб впервые предлагается для случая линейного ограничения формы образа задавать в виде структуры полного факторного эксперимента 2k.

(1 + x1)(1 + x2)...(1 + xk) → NП.

Для случая криволинейного ограничения формы образа впервые предлагается использовать ограничительные линии второго порядка и криволинейные поверхности, полученные на основе структуры многофакторного эксперимента 3k или 3k–p.

(1 + x1 + z1)(1 + x2 + z2)...(1 + xk + zk) → NП(NД),

где 1 – значение фиктивной независимой переменной x0 ≡ 1; x1, x2, ..., xk – линейные ортогональные контрасты факторов X1, X2, ..., Xk; z1, z2, ..., zk – квадратичные ортогональные контрасты факторов X1, X2, ..., Xk; k – число факторов; NП(NД) – общее число структурных элементов, равное соответственно 2k, 3k или 3k–p; p – дробность реплики; p = 1; 2 для k = 4; 5. Предполагается, что k = 2, ..., 5.

Коэффициенты функции отображения fiотоб определяют, используя метод наименьших квадратов.

На рис. 1, 2 и рис. 3, 4 показаны области образа и прообраза соответственно при линейных и криволинейных ограничениях образа для k = 2; 3. Однозначность функции fiотоб–1 была подтверждена путем анализа якобиана: в области прообраза он не равен нулю. Коэффициенты парной корреляции факторов rij(Xiо, Xjо) в образе отличны от нуля, а в собственных кодированных координатах образа rij(xiо, xjо) и в прообразе rij(Xiпр, Xjпр) равны нулю.

Системы натуральных и собственных кодированных координат областей образа и прообраза при линейном ограничении образа, k=2
Рис. 1. Системы натуральных и собственных кодированных координат областей образа
и прообраза при линейном ограничении образа, k = 2

Области образа и прообраза при линейном ограничении образа, k=3
Рис. 2. Области образа и прообраза при линейном ограничении образа, k = 3

Отображение точек плана эксперимента Xiuпр прообраза в точки Xiuо образа с использованием функций отображения (1) фактически представляет получение плана эксперимента в образе при условии использования в прообразе и образе собственной кодированной системы координат (рис. 3).

Хорошие свойства оценок коэффициентов статистических моделей в области прообраза и их единственность сохраняется при топологическом отображении и в области образа, что следует из доказанной проф. Т. Андерсоном леммы 3.2.3 и следствия из нее 3.2.1 [10, c. 69].

Системы натуральных и собственных кодированных координат областей образа и прообраза при криволинейном ограничении образа, k=2
Рис. 3. Системы натуральных и собственных кодированных координат областей образа
и прообраза при криволинейном ограничении образа, k = 2

Области образа и прообраза при криволинейном ограничении образа, k=3
Рис. 4. Области образа и прообраза при криволинейном ограничении образа, k = 3

В основу исследования и обоснования топологического отображения принята теория групп преобразований. Фигуры прообраза Фпр и образа Фо находятся в отношении эквивалентности, так как для них выполняются бинарные отношения эквивалентности: рефлексивность, симметричность, транзитивность. Гомеоморфность фигур Фпр и Фо была подтверждена проведенным вычислительным экспериментом [7, c. 295...298].

Другие методы и подходы устойчивого оценивания статистических моделей: 2) установление собственной кодированной системы координат в области прообраза и в области образа [7, c. 286...289], 3) планирование эксперимента с использованием фиктивных факторов [7, c. 328...341], 4) применение сложных функций [7, c. 341...344], 5) выбор оптимальных координат факторного пространства [7, c. 344...351].

Выводы и перспективы дальнейших исследований

1. Впервые предложен, разработан и обоснован метод гомеоморфного отображения для построения оптимальных планов экспериментов и повышения устойчивости регрессионных моделей в условиях взаимной сопряженности факторов.

2. При использовании разработанного метода устойчивого оценивания в произвольной по форме факторном пространстве образа можно планировать эксперимент и получать наилучшие возможные критерии качества статистических моделей.

В дальнейшем необходимо продолжить разработку анализа вкладов эффектов факторов Xiо по полученным статистическим моделям в области образа.

Литература
  1. Налимов В.В. Теория эксперимента. М.: Наука. – 1971. – 208 с. – (Физико-математическая библиотека инженера).
  2. Налимов В.В., Голикова Т.И. Логические основания планирования эксперимента. – 2-е изд., перераб. и доп.– М.: Металлургия, 1981. – 152 с.
  3. Половинкин А.И. Основы инженерного творчества: Учеб. пособие для студентов втузов. – М.: Машиностроение, 1988. – 368 с.
  4. Устойчивые статистические методы оценки данных / Пер. с англ. Ю.И. Малахова; Под ред. Н.Г. Волкова. – М.: Машиностроение, 1984. – 232 с.
  5. Тихонов А.Н. [Выступление на годичном общем собрании Академии наук СССР] // Вестн. Акад. наук СССР. – 1989. – № 2. – C. 94–95.
  6. Радченко С.Г. Система предпосылок регрессионного анализа и ее выполнение при проведении прикладных исследований // Вестн. Нац. техн. ун-та Украины «Киев. политехн. ин-т». Машиностроение. – 2001. – Вып. 41. – С. 20–27.
  7. Радченко С.Г. Устойчивые методы оценивания статистических моделей: Монография. – К.: ПП «Санспарель», 2005. – 504 с.
  8. Шурыгин А.М. Прикладная стохастика: робастность, оценивание, прогноз. – М.: Финансы и статистика, 2000. – 224 с.
  9. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика: Начал. курс: Учебник. – 5-е изд., испр. – М.: Дело, 2001. – 400 с.
  10. Андерсон Т. Введение в многомерный статистический анализ / Пер. с англ. Ю.Ф. Кичатова; Под ред. Б.В. Гнеденко. – М.: Физматгиз, 1963. – 500 с.


В начало

Библиотека