Исходные данные о продаже квартир на вторичном рынке жилья
№ п/п y
x1
x2
Задание
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22.5
26
18.5
13.2
25.8
17
18
21
14.5
23
19.5
14.2
13.3
16.1
13.516
29
35
28
30
51
38
30
32
27
39
29.5
29
30
30.8
28
31
15
10
10
25
10
12
15
20
10
5
15
12
5
10
25
10
y – цена квартиры (тыс.$);
x1 – жилая площадь(кв. м);
x2 – время пути до метро (мин).
По имеющимся статистическим данным
отдельно для пар (у,х1) и (у,х2) найти:
а) уравнение линейной регрессии;
б) коэффициент корреляции;
в) среднюю величину у при х1=35 (х2=12);
г) 95% доверительные интервалы для
индивидуального и среднего значения у;
д) с надежностью 0.95 интервальные оценки коэффициента регрессии b1 и дисперсии s2;
е) коэффициент детерминации.
Оценить на уровне 0.05 значимость
уравнения регрессии.
Сделать анализ полученных результатов.
Табличные значения стандартных функций распределения:
t0.05,14 = 2.145 F0.05,1,14 = 4.6
c20.025,14 =26.1 c20.975,14 =5.63
1. Парная регрессия y на x1.
а) Найти уравнение линейной регрессии для x1.
№ п/п
yi
xi
y2
x2
x * y
xi –
(xi –)2
1 22,5 29 506,25 841 652,5 -3,3 10,89 2 26 35 676 1225 910 2,7 7,29 3 18,5 28 342,25 784 518 -4,3 18,49 4 13,2 30 174,24 900 396 -2,3 5,29 5 25,8 51 665,64 2601 1315,8 18,7 349,69 6 17 38 289 1444 646 5,7 32,49 7 18 30 324 900 540 2,3 5,29 8 21 32 441 1024 672 -0,3 0,09 9 14,5 27 210,25 729 391,5 -5,3 28,09 10 23 39 529 1521 897 6,7 44,89 11 19,5 29,5 380,25 870,25 575,25 -2,8 7,84 12 14,2 29 201,64 841 411,8 -3,3 10,89 13 13,3 30 176,89 900 399 -2,3 5,29 14 16,1 30,8 259,21 948,64 495,88 -1,5 2,25 15 13,5 28 182,25 784 378 -4,3 18,49 16 16 31 256 961 496 -1,3 1,69 Сумма 292,1 517,3 5613,87 17273,89 9694,73 548,95 Средняя 18,2 32,3 350,9 1079,6 605,9 34,3
Таким образом, выборочные средние значения = 32,3; = 18,2; = 605,9;
выборочная дисперсия = 34,3;
выборочная ковариация cov(x,y) = = 605,9-32,3*18,2 = 18,04;
Коэффициенты регрессии b1== = 0,53
= 18,2 – 0,53*32,3 = 1,08
При увеличении жилой площади на 1 кв.м цена квартиры в среднем возрастает на 0,53 тыс.$.
Уравнение регрессии = 1,08 + 0,53 * x.
б) рассчитать коэффициент корреляции
Между величиной жилой площади квартиры и ценной квартиры наблюдается умеренная положительная зависимость.
в) определить среднюю величину y при x1=35.
Средняя цена квартиры при жилой площади 35 кв.м составляет 19.63 тыс.$. Промежуточные вычисления для последующих расчетов проводим в таблице.
№ п/п
yi
xi
1
22,5 29 16.45 6.05 36.60 4.3 18.49
2
26 35 19.63 6.37 40.58 7.8 60.84
3
18,5 28 15.92 2.58 6.66 0.3 0.09
4
13,2 30 16.98 -3.78 14.29 -5.0 25.00
5
25,8 51 28.11 -2.31 5.34 7.6 57.76
6
17 38 21.22 -4.22 17.81 -1.2 1.44
7
18 30 16.98 1.02 1.04 -0.2 0.04
8
21 32 18.04 2.96 8.76 2.8 7.84
9
14,5 27 15.39 -0.89 0.79 -3.7 13.69
10
23 39 21.75 1.25 1.56 4.8 23.04
11
19,5 29,5 16.72 2.78 7.73 1.3 1.69
12
14,2 29 16.45 -2.25 5.06 -4.0 16.00
13
13,3 30 16.98 -3.68 13.54 -4.9 24.01
14
16,1 30,8 17.40 -1.30 1.69 -2.1 4.41
15
13,5 28 15.92 -2.42 5.86 -4.7 22.09
16
16 31 17.51 -1.51 2.28 -2.2 4.84
Сумма
292,1 517,3 169.59 281.27
Средняя
18,2 32,3 17.58
г) найти 95% доверительные интервалы для индивидуального и среднего значения y.
С учетом значений из обеих таблиц:
Остаточная дисперсия
Дисперсия среднего значения
= 0.920
Стандартное отклонение
Дисперсия индивидуального значения y0
Стандартное отклонение y0
Для доверительной вероятности g=0,95 уровень значимости a = 1-g = 0,05.
Табличное значение t-распределения Стьюдента для уровня значимости a = 0,05 и числа степеней свободы k = n-2 =16-2 =14 составляет t0.05,8 = 2,31.
Доверительный интервал для среднего значения
19.63 – 2.145×0.96 £ y £ 19.63 + 2.145×0.96
17.57£ y £ 21.69
Доверительный интервал для индивидуального значения
19.63 – 2.145×3.61 £ y0 £ 19.63 + 2.145×3.61
11.89 £ y0 £ 27.37
С учетом возможных ошибок средняя цена квартиры с площадью 35 кв.м с вероятностью 95% лежит в пределах от 17,57 до 21,69 тыс.$; при этом отдельно цена квартиры колебаться от 11,89 до 27,37 тыс.$.
д) с надежностью 0,95 найти интервальные оценки коэффициента регрессии b1 и дисперсии возмущений s2.
Дисперсия коэффициента регрессии == 0.022
Стандартное отклонение
Доверительный интервал для коэффициента регрессии b1
0.53–2.145×0.148 £ b1 £ 0.53+ 2.145×0.148
0.21 £ b1 £ 0.85
С надежностью 0,95 увеличение площади квартиры на 1 кв.м приводит к увеличению цены квартиры на величину от 0,21 до 0,85 тыс.$.
Табличные значения распределения c2 Пирсона для уровня значимости 0,05 и числа степеней свободы 14 составляют
;
Доверительный интервал дисперсии возмущений
7,42 £ s2 £ 34,42
Интервал для стандартного отклонения 2,72 £ s £ 5,87.
С надежностью 0,95 дисперсия ошибок расчета находится в пределах от 7,42 до 34,42, а стандартное отклонение цены квартиры от среднего значения лежит в пределах от 2,72 до 5,87.
Оценить на уровне 0,05 значимость уравнения регрессии.
Общая сумма квадратов отклонений y = 281,27
Остаточная сумма квадратов = 169,59
Сумма квадратов, объясненная регрессией = 281,27–169,59 = 111,68
Величина F-критерия
= 9,23,
где m – число параметров (коэффициентов), рассчитанных по уравнению регрессии m=2.
Табличное значение F-распределения Фишера для уровня значимости a=0,05 и числа степеней свободы k1=n-m=14 и k2=m-1=1 составляет F0,05,1,14=4,6.
Так как расчетное значение F-критерия больше табличного критического, то уравнение регрессии y по x1 следует признать значимым, т.е. ............