всегда —1 ? r ? 1. Однако практическое использование коэффициента К. в качестве меры зависимости оправдано лишь тогда, когда совместное распределение пары (X, Y)
нормально или приближённо нормально (см. Нормальное распределение
);
употребление r
как меры зависимости между произвольными Y
и Х
приводит иногда к ошибочным выводам, т. к. r
может равняться нулю даже тогда, когда Y
строго зависит от X
. Если двумерное распределение Х
и Y
нормально, то линии регрессии Y
по Х
и Х
по Y
суть прямые у = mY
+
bY
(x — mx)
и х = mx+
bx
(у — mY
),
где
и
; b
Y
и b
X
именуются коэффициентами регрессии, причём
.
Так как в этом случае
Е (Y - y (x))2
=
s2
Y
(
1 -
r2
)
и
Е (Y - x (y))2
=
s2
X
(
1 -
r2
)
то очевидно, что r (корреляционные отношения совпадают с r2
полностью определяет степень концентрации распределения вблизи линий регрессии: в предельном случае r = ± 1 прямые регрессии сливаются в одну, что соответствует строгой линейной зависимости между Y
и X
, при r =
0 величины не коррелированы.
Корреляция между диаметрами и высотами 624 стволов северной сосны
см | м | Итого |
17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |
14-17 | 2 | 2 | 5 | 1 | | | | | | | | | | | 10 |
18-21 | 1 | 3 | 3 | 12 | 15 | 9 | 4 | | | | | | | | 47 |
22-25 | 1 | 1 | 1 | 3 | 18 | 24 | 29 | 14 | 7 | | | | | | 98 |
26-29 | | | | | 7 | 18 | 30 | 43 | 31 | 3 | 2 | | | | 134 |
30-33 | | | | | 1 | 5 | 18 | 29 | 35 | 18 | 7 | 1 | | | 114 |
34-37 | | | | | | 1 | 3 | 17 | 33 | 26 | 12 | 6 | | | 98 |
38-41 | | | | | | | 2 | 2 | 10 | 19 | 16 | 4 | | | 53 |
42-45 | | | | | | | | | 4 | 13 | 6 | 8 | | 1 | 32 |
46-49 | | | | | | | | 3 | 3 | 7 | 6 | 2 | 1 | | 22 |
50-53 | | | | | | | | | 1 | 4 | 4 | 2 | 1 | | 12 |
54-57 | | | | | | | | | | 1 | 1 | 1 | | | 3 |
58 и более | | | | | | | | | | | 1 | | | | 1 |
Итого | 4 | 6 | 9 | 16 | 41 | 57 | 86 | 108 | 124 | 91 | 55 | 24 | 2 | 1 | 624 |
Средний диаметр | 18,5 | 18,6 | 17,7 | 20,0 | 22,9 | 25,0 | 27,2 | 30,1 | 32,7 | 38,3 | 40,0 | 41,8 | 49,5 | 43,5 | 31,2 |
При изучении связи между несколькими случайными величинами X1
,..., Xn
пользуются множественными и частными корреляционными отношениями и коэффициентами К. (последними по-прежнему в случае линейной связи). Основной характеристикой зависимости являются коэффициенты rij
— простые коэффициенты К. между Xi
и Xj
,
в совокупности образующие корреляционную матрицу (rij
) (очевидно, rij
= rji
и rkk
=
1). Мерой линейной К. между X1
и совокупностью всех остальных величин X2
,..., Xn
служит множественный коэффициент К., равный при n =
3
.
Если предполагается, что изменение величин X1
и X2
определяется в какой-то мере изменением остальных величин X3
,
..., Xn
,
то показателем линейной связи между X1
и X2
при исключении влияния X3,
..., Xn
; является частный коэффициент К. X1
и X2
относительно X3
,..., Xn
,
равный в случае n=
3
Множественные и частные корреляционные отношения выражаются несколько сложнее.
В математической статистике разработаны методы оценки упомянутых выше коэффициентов и методы проверки гипотез об их значениях, использующие их выборочные аналоги (выборочные коэффициенты К., корреляционные отношения и т. п.). См. Корреляционный анализ
.
Лит.:
Дунин- Барковский И. В., Смирнов Н. В., Теория вероятностей и математическая статистика в технике (Общая часть), М., 1955; Крамер Г., Математические методы статистики, пер. с англ., М., 1948; Хальд А., Математическая статистика с техническими приложениями, пер. с англ., М., 1956; Ван дер Варден Б. Л., Математическая статистика, пер. с нем., М., 1960; Митропольский А. К., Техника статистических вычислений, 2 изд., М., 1971.
А. В. Прохоров.
Приближённая линия регрессии для зависимости среднего диаметра северной сосны от высоты.