Планирование эксперимента в нестандартных областях факторного пространства
Радченко С.Г.
Источник: Вестник ХНТУ. – 2007. – №2(28). – С. 281...285: ил. 4. – Библиогр.: 10 назв.
Постановка проблемы
Многофакторные статистические модели получили значительное распространение в научных и прикладных
исследованиях. Они используются при создании и совершенствовании различных сложных систем. Статистические модели
особенно необходимы в тех случаях, когда возможности конструирования, производства и эксплуатации, основанные на
традиционных физических принципах, исчерпаны или приводят к нецелесообразно большим затратам.
При получении статистических регрессионных моделей необходимо использовать методологию теории планирования
эксперимента [1, 2]. Известные традиционные методы планирования многофакторного эксперимента предполагают формы
факторных пространств в виде многомерных прямоугольного параллелепипеда (куба), сферы и симплекса. В нестандартных
областях факторного пространства поиск наилучших условий получения моделей в общем виде по публикациям не известен,
кроме метода регуляризации. Единичные случаи таких задач решались численными методами.
Анализ достижений и публикаций по теме исследования
Причины возникновения нестандартных областей факторного пространства следующие: 1) параметры (факторы)
однородного ряда технических и технологических объектов связаны зависимостью близкой к линейной [3, с. 338], 2)
обработка результатов эксперимента при условии, что уровни факторов не могут быть достаточно точно выдержаны по
матрице плана эксперимента, 3) Обработка результатов пассивного (специально не организованного) эксперимента.
В нестандартных областях факторного пространства наблюдается корреляция факторов и, следовательно, их
главных эффектов и взаимодействий при построении регрессионных моделей. Мультиколлинеарность эффектов (взаимная
сопряженность их) затрудняет или делает невозможным устойчивое определение структуры и коэффициентов уравнения
регрессии, содержательную интерпретацию причинных и структурных связей между эффектами и моделируемым откликом.
При значительной мультиколлинеарности эффектов задача является некорректно поставленной и целесообразное
использование уравнения регрессии теряет смысл.
Редактор русского перевода сборника статей [4] д.ф.-м.н. Н.Г. Волков считает, что «необходимы устойчивые
методы и алгоритмы, обладающие ясными математическими свойствами в смысле их оптимальности» [4, с. 6].
Особенностью широко используемого при получении статистических моделей метода наименьших квадратов является
его неустойчивость, «если не делать каких-то дополнительных предположений, которые трудно проверяемы» [5, с. 94].
Поэтому при решении прикладной задачи необходимо, по мнению исследователя, не только сформулировать систему
необходимых предпосылок, но и методики их проверок [6]; устойчивость предпосылок и метода получения моделей к
сравнительно малым нарушениям принятых условий; систему действий исследователя, если принятые предпосылки не
выполняются фактически [7, с. 55...65].
Ведущий научный сотрудник механико-математического факультета МГУ им. М.В. Ломоносова А.М. Шурыгин,
обсуждая проблему устойчивости оценивания параметров распределения и статистических моделей, приходит к
следующему выводу. «В классической статистике отсутствует понятие устойчивости решения, и этим она невыгодно
отличается от других ветвей прикладной математики. Предполагается, что если решение оптимально в рассматриваемой
модели, то в похожей модели оно будет близко к оптимальному. Но такое предположение не обосновано. На
«неуниверсальность» оценок максимума правдоподобия указывал А.Н. Колмогоров» [8, c. 161].
Некоторые специалисты констатируют сложность и трудность решения проблемы мультиколлинеарности:
«Однозначного ответа на этот вопрос нет» [9, c. 94].
Цель статьи
Обоснование методов устойчивого оценивания структуры и коэффициентов многофакторных статистических моделей
для произвольных (нестандартных) форм факторного пространства с наилучшими возможными критериями качества
полученных моделей.
Основная часть
Факторное пространство, соответствующее многомерному прямоугольному параллелепипеду, принимается за
прообраз факторного пространства Rпр.
Используя методы планирования эксперимента, в прообразе всегда можно получить статистические модели с
наилучшими характеристиками. Произвольная область факторного пространства, не соответствующая стандартной форме,
принимается за образ факторного пространства Ro. Получить в нем статистические модели с
наилучшими характеристиками традиционными методами не представляется возможным. Необходимо найти метод перехода от
заданного плохо обусловленного факторного пространства Ro образа к хорошо обусловленному
факторному пространству Rпр прообраза, в котором и необходимо решать поставленную задачу.
Впервые предложено использовать топологическое отображение прообраза факторного пространства в образ
факторного пространства [7, c. 190...197]. Две системы Rпр и Ro при взаимно
однозначном и взаимно непрерывном отображении будут изоморфными, т. е. равными по виду, форме. Понятие изоморфизма
включает в себя как частный случай понятие гомеоморфизма. Гомеоморфные пространства топологически эквивалентны.
При рассмотрении топологического отображения метрические свойства множеств Xпр (прообраз) и
Xo (образ) не используются. Следовательно, отображаемые множества Xпр,
Xo могут характеризоваться различными метрическими свойствами.
Сформулированы в общем виде пять методов ортогонального представления коррелированных факторов.
1) Ортогональность представления коррелированных факторов путем отображения точек прообраза – значений
уровней факторов Xiипр в соответствующие им точки образа – значения уровней факторов
Xiиo (1 ≤ i ≤ k, 1 ≤ и ≤ N) [7, c. 195].
|
Xio = fiотоб
(X1пр, ..., Xkпр). |
(1) |
Функции fiотоб и обратные функции fiотоб-1
должны быть непрерывны. Функции отображения fiотоб впервые предлагается для случая
линейного ограничения формы образа задавать в виде структуры полного факторного эксперимента 2k.
(1 + x1)(1 + x2)...(1 + xk) → NП. |
Для случая криволинейного ограничения формы образа впервые предлагается использовать ограничительные линии
второго порядка и криволинейные поверхности, полученные на основе структуры многофакторного эксперимента 3k
или 3k–p.
(1 + x1 + z1)(1 + x2 + z2)...(1 + xk + zk) → NП(NД), |
где 1 – значение фиктивной независимой переменной x0 ≡ 1;
x1, x2, ..., xk – линейные ортогональные контрасты факторов
X1, X2, ..., Xk; z1, z2,
..., zk – квадратичные ортогональные контрасты факторов X1,
X2, ..., Xk; k – число факторов;
NП(NД) – общее число структурных элементов, равное соответственно
2k, 3k или 3k–p; p –
дробность реплики; p = 1; 2 для k = 4; 5. Предполагается, что
k = 2, ..., 5.
Коэффициенты функции отображения fiотоб определяют, используя метод наименьших
квадратов.
На рис. 1, 2 и рис. 3, 4 показаны области образа и прообраза соответственно при линейных и криволинейных
ограничениях образа для k = 2; 3. Однозначность функции
fiотоб–1 была подтверждена путем анализа якобиана: в области прообраза он
не равен нулю. Коэффициенты парной корреляции факторов rij(Xiо,
Xjо) в образе отличны от нуля, а в собственных кодированных координатах образа
rij(xiо, xjо) и в прообразе
rij(Xiпр, Xjпр) равны нулю.
Рис. 1. Системы натуральных и собственных кодированных координат областей образа и прообраза при линейном ограничении образа, k = 2
|
|
Рис. 2. Области образа и прообраза при линейном ограничении образа, k = 3
|
Отображение точек плана эксперимента Xiuпр прообраза в точки
Xiuо образа с использованием функций отображения (1) фактически представляет
получение плана эксперимента в образе при условии использования в прообразе и образе собственной кодированной
системы координат (рис. 3).
Хорошие свойства оценок коэффициентов статистических моделей в области прообраза и их единственность
сохраняется при топологическом отображении и в области образа, что следует из доказанной проф. Т. Андерсоном
леммы 3.2.3 и следствия из нее 3.2.1 [10, c. 69].
Рис. 3. Системы натуральных и собственных кодированных координат областей образа и прообраза при криволинейном ограничении образа, k = 2
|
|
Рис. 4. Области образа и прообраза при криволинейном ограничении образа, k = 3
|
В основу исследования и обоснования топологического отображения принята теория групп преобразований. Фигуры
прообраза Фпр и образа Фо находятся в отношении эквивалентности, так как для них выполняются
бинарные отношения эквивалентности: рефлексивность, симметричность, транзитивность. Гомеоморфность фигур
Фпр и Фо была подтверждена проведенным вычислительным экспериментом [7, c. 295...298].
Другие методы и подходы устойчивого оценивания статистических моделей: 2) установление собственной
кодированной системы координат в области прообраза и в области образа
[7, c. 286...289], 3) планирование эксперимента с использованием фиктивных факторов
[7, c. 328...341], 4) применение сложных функций [7, c. 341...344], 5) выбор
оптимальных координат факторного пространства [7, c. 344...351].
Выводы и перспективы дальнейших исследований
1. Впервые предложен, разработан и обоснован метод гомеоморфного отображения для построения оптимальных
планов экспериментов и повышения устойчивости регрессионных моделей в условиях взаимной сопряженности факторов.
2. При использовании разработанного метода устойчивого оценивания в произвольной по форме факторном
пространстве образа можно планировать эксперимент и получать наилучшие возможные критерии качества статистических
моделей.
В дальнейшем необходимо продолжить разработку анализа вкладов эффектов факторов
Xiо по полученным статистическим моделям в области образа.
Литература |
- Налимов В.В. Теория эксперимента. М.: Наука. – 1971. – 208 с. – (Физико-математическая библиотека инженера).
- Налимов В.В., Голикова Т.И. Логические основания планирования эксперимента. – 2-е изд., перераб. и доп.– М.: Металлургия, 1981. – 152 с.
- Половинкин А.И. Основы инженерного творчества: Учеб. пособие для студентов втузов. – М.: Машиностроение, 1988. – 368 с.
- Устойчивые статистические методы оценки данных / Пер. с англ. Ю.И. Малахова; Под ред. Н.Г. Волкова. – М.: Машиностроение, 1984. – 232 с.
- Тихонов А.Н. [Выступление на годичном общем собрании Академии наук СССР] // Вестн. Акад. наук СССР. – 1989. – № 2. – C. 94–95.
- Радченко С.Г. Система предпосылок регрессионного анализа и ее выполнение при проведении прикладных исследований // Вестн. Нац. техн. ун-та Украины «Киев. политехн. ин-т». Машиностроение. – 2001. – Вып. 41. – С. 20–27.
- Радченко С.Г. Устойчивые методы оценивания статистических моделей: Монография. – К.: ПП «Санспарель», 2005. – 504 с.
- Шурыгин А.М. Прикладная стохастика: робастность, оценивание, прогноз. – М.: Финансы и статистика, 2000. – 224 с.
- Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика: Начал. курс: Учебник. – 5-е изд., испр. – М.: Дело, 2001. – 400 с.
- Андерсон Т. Введение в многомерный статистический анализ / Пер. с англ. Ю.Ф. Кичатова; Под ред. Б.В. Гнеденко. – М.: Физматгиз, 1963. – 500 с.
|
|