| ||||||||||||||
|
Корреляционный анализ. Коэффициент корреляции Автор: А.В.Гармаш
Корреляционный анализ - метод, позволяющий обнаружить зависимость между несколькими случайными величинами. Допустим, проводится независимое измерение различных параметров у одного типа объектов. Из этих данных можно получить качественно новую информацию - о взаимосвязи этих параметров. Например, измеряем рост и вес человека, каждое измерение представлено точкой в двумерном пространстве: Несмотря на то, что величины носят случайный характер, в общем наблюдается некоторая зависимость - величины коррелируют. В данном случае это положительная корреляция (при увеличении одного параметра второй тоже увеличивается). Возможны также такие случаи:
Взаимосвязь между переменными необходимо охарактеризовать численно, чтобы, например, различать такие случаи: Для этого вводится коэффициент корреляции. Он рассчитывается следующим образом: Есть массив из n точек {x1,i, x2,i} Рассчитываются средние значения для каждого параметра: И коэффициент корреляции: r изменяется в пределах от -1 до 1. В данном случае это линейный коэффициент корреляции, он показывает линейную взаимосвязь между x1 и x2: r равен 1 (или -1), если связь линейна. Коэффициент r является случайной величиной, поскольку вычисляется из случайных величин. Для него можно выдвигать и проверять следующие гипотезы: 1. Коэффициент корреляции значимо отличается от нуля (т.е. есть взаимосвязь между величинами): Тестовая статистика вычисляется по формуле: и сравнивается с табличным значением коэффициента Стьюдента t(p = 0.95, f = ) = 1.96 Если тестовая статистика больше табличного значения, то коэффициент значимо отличается от нуля. По формуле видно, что чем больше измерений n, тем лучше (больше тестовая статистика, вероятнее, что коэффициент значимо отличается от нуля) 2. Отличие между двумя коэффициентами корреляции значимо: Тестовая статистика: Также сравнивается с табличным значением t(p,) Методами корреляционного анализа решаются следующие задачи: 1) Взаимосвязь. Есть ли взаимосвязь между параметрами? 2) Прогнозирование. Если известно поведение одного параметра, то можно предсказать поведение другого параметра, коррелирующего с первым. 3) Классификация и идентификация объектов. Корреляционный анализ помогает подобрать набор независимых признаков для классификации. Источник:Лекции по корреляционному анализу - http://chemstat.com.ru/node/12 |