| ||||||||||
|
Регрессионный анализ. Градуировка. Автор: А.В. Гармаш
Проведение количественного анализа, как правило, включает в себя построение градуировки, т.е. находждение градуировочной функции экспериментальным путем. Для этого измеряется аналитический сигнал для серии образцов сравнения, в результате получается массив данных: {xi,yi}, где x - содержание определяемого компонента, y - аналитический сигнал. На плоскости каждое измерение можно представить точкой: Градуировочная функция y = f(x) определяется методами регрессионного анализа. Прямо через точки проводить ломаную и считать ее градуировочной функцией нельзя, т.к. измеряемый сигнал содержит погрешность. Т.о. необходимо: Вид функции зависимости выбирается исходя из внешней информации (расположения точек на плоскости) и из общих соображений относительно физических и химических законов, связывающих аналитический сигнал с содержанием определяемого компонента (например, построение градуировки в спектрофотометрии опирается на закон Бугера-Ламберта-Бера). Наиболее часто используется линейная зависимость. Обозначим k - число параметров градуировочной функции, n - число измерений. Мы получаем систему уравнений: Рассмотрим различные варианты соотношений n и k: 1) n < k - данных недостаточно. Необходимо провести больше измерений или упростить модель - уменьшить число параметров. 2) n = k - у системы единственное точное решение. Однако в этом случае нельзя оценить погрешность измерения 3) n > k - система уравнений несовместна и не имеет точного решения. Существует бесконечное множество приближенных решений, возникает задача аппроксимации. На практике наиболее распространен 3-й случай. Рассмотрим его более подробно на примере линейного регрессионного анализа (т.е. градуировочная зависимость имеет линейный вид y = ax + b, определяется двумя параметрами a и b, k = 2). Необходимо найти a и b такие, чтобы погрешность была минимальной. Один из наиболее распространенных методов нахождения параметров линейной зависимости - метод наименьших квадратов, МНК Предпосылки МНК: С учетом всех предпосылок получаются следующие выражения для a и b: Источник: Лекции по регрессионному анализу http://chemstat.com.ru/node/12 |