Котяш Светлана Владимировна

Специальность:  Экономическая кибернетика
Группа: ЭКИ-00

Тема диссертации: "Математические модели повышения эффективности методов смещенного оценивания"

Руководитель: Дмитриева Ольга Анатольевна



               



АВТОРЕФЕРАТ


Введение
1 Исследование и анализ причин использования методов смещенного оценивания
      1.1 Причины использования методов смещенного оценивания
      1.2 Постановка задачи исследования
2 Классификация и анализ методов смещенного оценивания
      2.1 Классификация методов смещенного анализа
      2.2 Методы обычных и обобщенных гребневых оценок
      2.3 Методы оценок дробного ранга
      2.4 Методы сжатых оценок
Заключение
Список использованной литературы



ВВЕДЕНИЕ
      Все большую популярность при принятии эффективных решений для различных систем и процессов приобретают статистические математические модели. На сегодняшний день существует множество статистических методов построения таких моделей.
      Для построения моделей, в которых существует линейная зависимость между входными переменными, необходимо применение методов обработки, нечувствительных к таким их особенностям.
      Широкое распространение получили методы смещенного оценивания, которые позволяют использовать преимущества, достигнутые при отказе от соблюдения требования несмещенности оценок параметров системы, и тем самым позволяют повысить точность разрабатываемых статистических моделей. Однако большое количество таких методов и их специфических особенностей влечет за собой большие трудности при выборе наиболее эффективного метода, который бы соответствовал статистическим характеристикам исходной информации модели. То есть неправильный выбор метода смещенного оценивания может привести к увеличению значения дисперсии и смещения оценок параметров модели и, тем самым, привести к несоответствию математической модели реальному процессу.
      В связи с этим, анализ влияния исходной информации на эффективность методов смещенного оценивания и повышение их эффективности, а также более формализованный подход к выбору конкретного метода для разработки математических моделей различных процессов, является наиболее актуальной и трудной научно-исследовательской задачей. И решение этой задачи принесет большую пользу не только в научной деятельности, но и при принятии решений на предприятиях страны.


1 ИССЛЕДОВНИЕ И АНАЛИЗ ПРИЧИН ИСПОЛЬЗОВАНИЯ
МЕТОДОВ СМЕЩЕННОГО ОЦЕНИВАНИЯ

        1.1 Причины использования методов смещенного оценивания

      В настоящее время разработано большое количество методов и алгоритмов построения математических моделей для решения задач в различных предметных областях. Но каждый из этих методов и алгоритмов ориентирован, как правило, на решение определенного конкретного класса задач и обеспечивает эффективное решение только при выполнении некоторых теоретических предпосылок и предположений.
      Одним из самых распространенных методов является регрессионный анализ. Методы регрессионного анализа с успехом применяются при анализе экспериментальных данных в различных областях науки: психологии, экономике, социологии, физике, химии, геологии, автоматике и др. В экономике, например, эти методы используются при построении многофакторных моделей производительности труда и функций спроса, производственных функций и экономико-статистических моделей. Во многом этому способствовало интенсивное развитие и внедрение в практику вычислительной техники, что позволило переложить на ЭВМ большую часть трудоемкой вычислительной работы. Число прикладных работ с использованием регрессионного анализа растет быстрее в несколько раз числа научных публикаций по данной теме. Но многие авторы современных пакетов прикладных программ по статистической обработке информации не учитывают вычислительных возможностей метода для конкретного объекта, имеющего свои конкретные особенности. Таким образом, чаще всего приводится субъективное объяснение полученных результатов без научного обоснования целесообразности использования выбранного метода.
      Применение регрессионного анализа в условиях линейной зависимости между входными векторами, ошибок в независимых переменных, нарушения предположения о нормальности закона распределения наблюдений, неоднородности и корреляции этих наблюдений, представляет определенную трудность. Это вызвало необходимость разработки класса методов синтеза математических моделей, нечувствительных к нарушению вышеперечисленных предпосылок. Так для получения оптимальных оценок параметров модели при наличии линейной зависимости между входными переменными был разработан специальный класс методов – методы смещенного оценивания.
      Большинство объектов в технике, экологии, экономике, социологии, биологии характеризуются многомерностью и линейной зависимостью между входными векторами, что приводит к некорректности решения задачи построения математической модели. Таким образом, в силу взаимной зависимости входных векторов, применение классических методов построения статистических моделей, таких как регрессионный анализ, корреляционный анализ, не позволяет получить адекватных математических моделей и в значительной степени затрудняет обработку результатов и их интерпретацию.
      Рассмотрим применение регрессионного анализа к задачам со специфическими данными. Рассматриваемые объекты ограничим классом квазистационарных, а модели классом линейных. Зависимость между выходной и входными переменными представим в виде:
(1.1)

      Для оценивания неизвестного вектора параметров воспользуемся методом наименьших квадратов (МНК). Получим
(1.2)

      Регрессионный анализ требует, чтобы ни одна независимая переменная не была четко скоррелирована с любой другой независимой переменной или с любой линейной комбинацией независимых переменных. Посмотрим, что получается при существовании линейной зависимости между входными векторами . Пусть существует линейная зависимость
(1.3)

Анимированная формула №1

      Чем ближе левая часть (1.3) к нулевому вектору из, тем сильнее мультиколлинеарность. Предельный случай соответствует точному равенству в (1.3). Такое явление называют строгой мультиколлинеарностью. Наличие мультиколлинеарности приводит к неустойчивости оценок, неустойчивости вычислительной процедуры, коэффициенты регрессионной модели оказываются сильно коррелированными между собой, имеют расширенный доверительный интервал и увеличенную дисперсию, что приводит к невозможности интерпретации результатов. Вдобавок коэффициенты могут не достичь статистической значимости даже в тех случаях, когда наблюдается существенная взаимосвязь, что ведет к неверной констатации отсутствия двумерной связи.
      Существует несколько способов корректировки мультиколлинеарности. Если у нас есть ряд добавочных по отношению к выборке случаев (как, например, тогда, когда мы выбираем данные из опубликованного источника и можем просто обратиться к нему еще раз и сделать довыборку), увеличение размера выборки может в какой-то степени уменьшить мультиколлинеарность. Другой путь – определить, какие именно независимые переменные особенно тесно связаны друг с другом, и объединить их в единый фактор. Естественно, любое подобное комбинирование будет работать только в том случае, если оно теоретически обосновано. И наконец, можно попробовать справиться с мультиколлинеарностью, отбросив одну или несколько тесно связанных переменных. Это может привести к искажениям, но, убирая сначала одну, потому другую из связанных независимых переменных и сравнивая результаты регрессий, можно по меньшей мере составить представление о том, какой урон наносят искажения, а какой – мультиколлинеарность. Но ни один из перечисленных методов не приводит к существенному увеличению точности модели.
      Поэтому в последнее время стали популярны исследования по теории смещенного оценивания и ее применению для случаев, когда переменные модели сильно коррелированны. Методами смещенного оценивания являются гребневые оценки, редуцированные оценки, оценки Марквардта, оценки Хоккинса и др. Также, в случае, когда ковариационные матрицы плохо обусловлены, при вычислении оценок коэффициентов регрессии может быть использован метод регуляризации А.Н. Тихонова [8].
      При сильной мультиколлинеарности оценки МНК становятся настолько неудовлетворительными, что даже знаки некоторых координат часто не соответствует истинным.
      Таким образом, задачу оценивания можно сформулировать следующим образом: найти оценку параметров регрессии, которая была бы устойчивой даже при сильной сопряженности независимых переменных, т.е. такую оценку, точность которой не падала бы до нуля при усилении мультиколлинеарности.

        1.2 Постановка задачи исследования

      Быстрый рост количества систем обработки информации требует интенсивного развития статистических методов обработки информации. Повышение качества и эффективности таких систем напрямую связано с точностью построенных математических моделей, что определяет эффективность решения поставленных задач. Поэтому проблема повышения точности и надежности статистических моделей в настоящее время является одной из самых актуальных задач.
      Методы смещенного оценивания насчитывают более восьмидесяти модификаций, имеющих свои особенности. Эффективность смещенного метода обработки данных зависит от выбора фактора деформации, выбор которого связан в свою очередь с определенными трудностями. В связи с этим необходимо изучить результаты исследования методов смещенного оценивания с различной структурой информационной матрицы, различной степенью коррелированности входных переменных и различной интенсивностью дисперсии помех, а также внимательно рассмотреть области эффективного применения конкретного метода смещенного оценивания, на основании чего можно будет выбрать наиболее точный метод синтеза статистических моделей в условиях мультиколлинеарности выходной информации.
      В настоящее время работы по исследованию методов смещенного оценивания посвящены анализу влияния одной, двух статистических характеристик исходной выборки на эффективность методов. В таких условиях достаточно сложно провести сравнительный анализ эффективности методов в случае различной дисперсии помех и различной структуры информационной матрицы. Это в свою очередь приводит к трудностям не только в выборе метода смещенного оценивания, но и в достижении максимальной эффективности и точности при применении выбранного метода. Исходя из этого, ставится задача разработки таких математических моделей, которые бы не только позволяли оценивать эффективность методов смещенного оценивания, но и повышали эффективность и точность указанных методов.
      Таким образом, целью работы является решение следующих подзадач:
      - проведение анализа и обоснование эффективности применения методов смещенного оценивания при синтезе математических моделей в условиях нарушения полного ранга информационной матрицы, что позволит повысить точность оценок параметров моделей;
      - исследование критериев оценки эффективности методов смещенного оценивания;
      - исследование комплекса математических моделей оценки эффективности методов смещенного оценивания, оценивающих влияние статистических характеристик исходной информации на эффективность данных методов;
      - разработка математической модели, позволяющей повышать эффективность и точность выбранного метода смещенного оценивания.
      Следует отметить, что в работе рассматривается класс квазистационарных объектов и процессов, которые описываются линейными по параметрам моделями.
      В данной работе будет приведена попытка разработки комплекса математических моделей направленных на повышение эффективности методов смещенного оценивания и будут приведены результаты исследования по разработке критериев выбора метода построения моделей процессов с линейной зависимостью входных данных.


2 КЛАССИФИКАЦИЯ И АНАЛИЗ
МЕТОДОВ СМЕЩЕННОГО ОЦЕНИВАНИЯ

        2.1 Классификация методов смещенного анализа

      В случае когда матрица единична, имеют место несмещенные оценки с минимальной дисперсией, которые определяются по методу МНК из системы нормальных уравнений (1.2).
      С уменьшением собственных чисел в матрице расстояние между оценками и истинными значениями увеличивается. Помимо увеличения расстояния между и возможно получение неверного направления действия входных переменных.
      Для преодоления таких трудностей разработан комплекс методов, основанный на отказе от требований несмещенности. Тогда имеет место неравенство вида , где - любая смещенная оценка. Такой комплекс методов получил название – смещенное оценивание. В настоящее время класс этих методов включает в себя более восьмидесяти алгоритмов и его разбивают на следующие группы: методы обычных гребневых оценок, методы обобщенных гребневых оценок, методы оценок дробного ранга, методы сжатых оценок. Все рассматриваемые смещенные оценки являются линейными преобразованиями МНК-оценок.
      Проведем анализ методов смещенного оценивания в соответствии с выше приведенной классификацией.

        2.2 Методы обычных и обобщенных гребневых оценок

      Наиболее типичным представителем смещенных оценок является класс методов гребневого оценивания.
      В гребневых оценках поставлена задача получения оценок с минимальной регрессией. Рассмотрим связь гребневых оценок с оценками МНК и статистическими характеристиками исходной информации, которая необходима для оценки эффективности методов гребневого оценивания и выполнения формализованной процедуры выбора наиболее адекватных из них.
      Оценка гребневой регрессии является линейным преобразованием оценки , полученной методом МНК, и зависит от параметра и исходной информации . Гребневая оценка представляется в виде . Используя равенство вида для МНК, получим связь между гребневыми оценками и оценками МНК вида , тогда . Из этого выражения видно, что имеет место смещение.
      Дисперсия для гребневой оценки определяется следующим образом
(2.1)

Анимированная формула №2

      Среднеквадратичная ошибка определяется из выражения:
(2.2)

      Заметим, что вектор короче, чем , т.е. . Гребневые оценки являются оценками минимальной нормы в классе смещенных оценок. Следовательно, внутри класса эквивалентности, гребневая оценка есть самая короткая оценка, т.е. является в определенном случае наилучшей.
      Эффективность методов гребневых оценок зависит от статистических характеристик исходной информации и оптимального выбора параметра . Обобщенная гребневая оценка лучше любых оценок внутри этого класса, если оптимальное значение известно в терминах параметров теоретического распределения [1].

        2.3 Методы оценок дробного ранга

      Класс алгоритмов дробного ранга является по сути развитием оценок обобщенного обращения [9]. При определенных статистических характеристиках исходных данных оценки обобщенног обращения являются наиболее предпочтительными из класса смещенных оценок.
      Оценки дробного ранга имеют вид . Для уменьшения среднеквадратичной ошибки оценок дробного ранга, необходимо выполнение условия . Следует отметить возможность комбинирования оценок дробного ранга с гребневыми оценками вида . Здесь выбирается так, чтобы исключить чисто нулевые собственные значения, а - по какому-либо из способов выбора для гребневых оценок.

      
        2.4 Методы сжатых оценок

      Плохая обусловленность информационной матрицы приводит к увеличению оценок . Для уменьшения длины вектора оценок Стейном и Джеймсом был предложен класс сжатых (редуцированных) оценок. Сжатые оценки можно представить в виде , где - оценка МНК, - параметр редукции.
      Аналитически определить оптимальные сжатые оценки для конкретной матрицы невозможно. Определить наиболее эффективный метод сжатых оценок для конкретной матрицы возможно только при использовании моделей, связывающих статистические характеристики исходной информации и критерии оценки эффективности метода.


ЗАКЛЮЧЕНИЕ


      В данной работе проведен анализ и исследование причин, приводящих к некорректности построения математических моделей на основе метода регрессионного анализа при решении прикладных задач. Проведен анализ статистических методов построения математических моделей, применяющихся для устранения линейной зависимости входных переменных. И показано, что применение таких методов не приводит к повышению точности модели, поэтому необходимо применение смещенных методов оценивания, которые позволяют получить вектор коэффициентов модели с некоторым смещением, но с меньшей величиной дисперсии, что значительно повышает степень адекватности строящихся моделей.
      Проведен анализ методов смещенного оценивания и сравнительной анализ принципов выбора фактора деформации в смещенных методах оценивания.
      Проведен анализ существующих среднеквадратичных критериев оценки эффективности методов смещенного оценивания и показано, что использование среднеквадратичной ошибки как меры сравнения связано с трудностями, которые обусловлены необходимостью знания истинных коэффициентов модели.
      Предложено в качестве критерия для сравнительного анализа методов смещенного оценивания использование относительной среднеквадратичной погрешности, позволяющей оценить отношение среднеквадратичной погрешности метода смещенного оценивания и среднеквадратичной погрешности МНК.
      Предложен алгоритм по выбору класса методов смещенного оценивания в зависимости от статистических характеристик исходной информации, что позволит проводить поиск наиболее эффективного метода уже внутри выбранного класса.
Список использованной литературы


      1. Демиденко Е. З. Линейная и нелинейная регрессия. – М.: Финансы и статистика, 1981. – 302 с.
      2. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. – М.: Статистика, 1973. – 393 с.
      3. Ермаков С. М., Панкратьев Ю. Д. Смещенные оценки и метод регуляризации. // Вестник ЛГУ. – 1975. - №7. – С. 27-30.
      4. Лесная Н.С., Шамша Т.Б., Витько А.В., Скибенко Т.И. Эффективность применения гребневых и робастных методов оценивания. // Вестник ХГПУ. – 1999. - № 42. – С. 42-47.
      5. Лесная Н.С., Шамша Т.Б. Сравнительная оценка характеристик автоматического выбора параметров устойчивых методов построения статистических моделей. //Информационные технологии: наук, техника, технология, образование, здоровье. – 1998. - №6. Ч.1. – С.358-362.
      6. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. Пер. с англ. – М.: Мир, 1982. – 488 с.
      7. Химмельблау Д. Анализ процессов статистическими методами. – М.: Мир, 1973. – 958 с.
      8. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. – М.: Наука, 1974. – 223 с.
      9. Ра ор. Линейные статистические методы и их приложения. – М.: Мир, 1967. – 548 с.
      10. Вучков И., Бяджиева Л., Солаков Е. Прикладной регрессионный анализ: Пер. с болгар. – М.: Финансы и статистика, 1987. – 230 с.
      11. Маркус Н. Минк Х. Обзор по теории матриц и матричным неравенствам. – М.: Наука, 1972. – 232 с.



ГЛАВНАЯ    БИБЛИОТЕКА    ССЫЛКИ    ИНДИВИД. ЗАДАНИЕ    ОТЧЕТ О ПОИСКЕ   
НАЗАД