Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение.
Коэффициент корреляции
Ковариация
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от -1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
- 0.1 < rxy < 0.3: слабая;
- 0.3 < rxy < 0.5: умеренная;
- 0.5 < rxy < 0.7: заметная;
- 0.7 < rxy < 0.9: высокая;
- 0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X умеренная и прямая.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
Уравнение регрессии (оценка уравнения регрессии)
Линейное уравнение регрессии имеет вид.
y = 6.52 x -5.11.
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = 6.52 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 6.52.
Коэффициент a = -5.11 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y (x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 — прямая связь, иначе — обратная). В нашем примере связь прямая.