ГлавнаяГотовые работы Курсовая работа. Статистика

Готовая контрольная работа

на тему:

«Курсовая работа. Статистика»









Цена: 750 руб.

Номер: V42011

Предмет: Статистика

Год: 2006

Тип: контрольные

Отзывы

Айжамал 26.08.2020
Вас беспокоит автор статьи Айжамал из Кыргызстана,  моя статья опубликована, и в этом ваша заслуга. Огромная благодарность Вам за оказанные услуги.
Татьяна М. 12.06.2020
Спасибо Вам за сотрудничество! Я ВКР защитила на 5 (пять). Огромное спасибо Вам и Вашей команде Курсовой проект.
Юлианна В. 09.04.2018
Мы стали Магистрами)))
Николай А. 01.03.2018
Мария,добрый день! Спасибо большое. Защитился на 4!всего доброго
Инна М. 14.03.2018
Добрый день,хочу выразить слова благодарности Вашей и организации и тайному исполнителю моей работы.Я сегодня защитилась на 4!!!! Отзыв на сайт обязательно прикреплю,друзьям и знакомым  буду Вас рекомендовать. Успехов Вам!!!
Ольга С. 09.02.2018
Курсовая на "5"! Спасибо огромное!!!
После новогодних праздников буду снова Вам писать, заказывать дипломную работу.
Ксения 16.01.2018
Спасибо большое!!! Очень приятно с Вами сотрудничать!
Ольга 14.01.2018
Светлана, добрый день! Хочу сказать Вам и Вашим сотрудникам огромное спасибо за курсовую работу!!! оценили на \5\!))
Буду еще к Вам обращаться!!
СПАСИБО!!!
Вера 07.03.18
Защита прошла на отлично. Спасибо большое :)
Яна 06.10.2017
Большое спасибо Вам и автору!!! Это именно то, что нужно!!!!!
Спасибо, что ВЫ есть!!!

Поделиться

Задание 1.
Выписать 140-150 значений одного варьирующего количественного признака. Полученный массив данных считать совокупностью, которая подлежит статистическому изучению.
Исходные данные:
Табл. 1. Данные о размере чистых активов крупнейших банков России на 1 января 1997г., млрд. руб.
Название банка Чистые активы
Банк инвестиций и сбережений 172
Внешторгбанк 25286
Национальный резервный банк 9911
ОНЭКСИМ банк 19221
Международная финансовая компания 9499
Инкомбанк 17275
ТОКОбанк 6286
Империал 6649
Автобанк 6728
Международный московский банк 7609
СБС 11602
Международный промышленный банк 4887
Башкредитбанк 1732
Российский кредит 12278
Мосбизнесбанк 8453
МЕНАТЕП 11058
Московский индустриальный банк 3117
Промстройбанк России 5651
Промышленно-строительный банк 3606
Уникомбанк 3743
Газпромбанк 3649
Возрождение 4079
Мост-банк 8405
Московский деловой мир 1951
Межкомбанк 4065
Нефтехимбанк 2568
Ситибанк Т/О 2728
Ланта-банк 630
Альба-Альянс 804
ИнтерТЭКбанк 1295
Мосстройэкономбанк 1420
Гута-банк 5636
Росэстбанк 1255
Совфинтрейд 1356
Лионский кредит 2145
Собинбанк 811
Альфа-банк 5387
Русский банк имущественной опеки 425
Нижегородпромстройбанк 764
Чейз Манхеттен Банк Интернэшнл 2317
Залогбанк 116
Еврофинанс 1283
Конверсбанк 2061
Омскпромстройбанк 650
АК БАРС 333
Запсибкомбанк 1137
Уралпромстройбанк 980
Диалог-Банк 1012
ВКА-Банк 339
Кредит Свисс АО 2869
Российский капитал 949
МАПО-банк 1237
Динамит 999
Росэксимбанк 339
Торибанк 2523
Уральский банк реконструкции и развития 513
Дальрыббанк 633
Уралтрансбанк 622
Востсибкомбанк 682
Пробизнесбанк 1486
Кредобанк 905
Металлургический 599
Петровский 1094
Монтажспецбанк 489
Енисей, Уфа 765
Енисей, Красноярск 867
Нефтефромбанк 469
ОРГБАНК 619
Желдорбанк 871
Золото-Платина-Банк 312
Банк Москвы 1159
Славянский банк 461
Евразия-Центр 235
РНКБ 903
Восток-Запад 729
Риаблик Нэшнл 944
Бэнк оф Нью 416
Транскредит 439
Заречье 450
Промадтехбанк 1181
Зенит 1363
Кубаньбанк 709
Металлинвестбанк 959
Солидарность 513
Сосьете Женераль Восток 796
Первый профессиональный 170
Прио-Внешторгбанк 370
Капитал 548
Томскпромстройбанк 461
Аспект 210
Платина 359
Олимпийский 429
Кузбассоцбанк 704
Метбанк 498
Моснарбанк Лимитед 112
Челябинвестбанк 328
Юнибест 881
Камчаткомагропромбанк 292
Элбим-банк 439
Кредитимпексбанк 668
Фундамент-банк 186
Югра 522
Курскпромбанк 244
Тайдон 129
Уралвнешторгбанк 550
БНП-Дрезднер банк 1598
Пресня-банк 435
Ростпромстройбанк 588
Сургутнефтегазбанк 401
Русский индустриальный банк 546
Нефтяной 531
Солидарность 460
Интернационале Нидерланден банк Евразия 1489
Прогресспромбанк 369
Европейский торговый банк 331
Промторгбанк 183
Интехбанк 232
Сибэкобанк 173
Новосибирск-внешторгбанк 262
Газбанк 218
Волго-Окский региональный Внешторгбанк России 343
Промсвязьбанк 311
Экономбанк 443
Новая Москва 517
Первый Инвестиционный 202
Тагилбанк 239
Совинком 140
Кредит-Москва 337
Подольск-промкомбанк 204
Мосстройбанк 1004
Держава 189
Проминвестбанк 296
РТБ-Банк 78
Ханты-Мансийский банк 452
АБН АМРО банк 1320
Волгопромбанк 258
Интурбанк 629
Белгородпромстройбанк 342
Уральский трастовый банк 110
КогалымнефтеКогалымкомбанк 559


Задача 2.
По имеющимся значениям признака построить равноинтервальный вариационный ряд (6-8 интервалов) и рассчитать следующие характеристики (оценки) и их среднеквадратичные ошибки: . Построить гистограмму, полигон и кумулянту. Произвести выравнивание по теоретической кривой нормального или иного распределения и применить критерии согласия (хи-квадрат, критерии Романовского и Колмогорова). Разделить изучаемую совокупность на 3-4 подгруппы, определить внутригрупповые и межгрупповую дисперсию и проверить правило сложения вариаций (дисперсий). Сделать выводы.
Решение:
Рассчитаем размер интервала. При группировке с равными интервалами применяется формула:

где:
– (размах вариации);
и – соответственно максимальное и минимальное значения признака;
– число групп.
Табл. 2. Чистые активы, млрд. руб.
Интервал Количество В процентах к итогу
78-3229 117 83,571
3229-6380 10 7,143
6380-9531 6 4,286
9531-12682 4 2,857
12682-15833 0 0,000
15833-18984 1 0,714
18984-22135 1 0,714
22135-25286 1 0,714



Среднее арифметическое
млрд. руб.
Расчетная таблица
Интервал Коли
чество




Накопленная частота
78-3229 117 1653,5 193459,5 160263005,9 -187567243110,265 219523342272165 117
3229-6380 10 4804,5 48045 39228895,38 77697871014,402 153890623270296 127
6380-9531 6 7955,5 47733 158001670,8 810805888059,924 4160754661050820 133
9531-12682 4 11106,5 44426 274407744,2 2272817422406,560 18824902520465200 137
12682-15833 0 14257,5 0 0 0,000 0 137
15833-18984 1 17408,5 17408,5 212711390,6 3102316624324,920 45246135676747100 138
18984-22135 1 20559,5 20559,5 314552520,8 5578786675535,220 98943288356527500 139
22135-25286 1 23710,5 23710,5 436251253,1 9111817886919,290 190315155814582000 140
Итого: 395342 1595416481 20766675125150,100 357863650994916000,000

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии и обозначается :




Коэффициент вариации.

Для интервальных рядов распределения с равными интервалами мода определяется по формуле:

где - начальное значение интервала, содержащего моду;
- величина модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному;
- частота интервала, следующего за модальным.
Медиана интервального вариационного ряда распределения определяется по формуле

где - начальное значение интервала, содержащего медиану;
- величина медианного интервала;
- сумма частот ряда;
- сумма накопленных частот, предшествующих медианному интервалу;
- частота медианного интервала.
Квартили




Гистограмма распределения

Полигон распределения











Кумулянта

Произведем выравнивание по теоретической кривой нормального или иного распределения и применить критерии согласия (хи-квадрат, критерии Романовского и Колмогорова).
Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения . Его кривая выражается уравнением

где у - ордината кривой нормального распределения; - стандартизованные отклонения; x - варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение.
Если нужно получить теоретические частоты f\' при выравнивании вариационного ряда по кривой нормального распределения, то можно воспользоваться формулой

где N- сумма всех эмпирических частот вариационного ряда; h - величина интервала в группах; - cреднее квадратическое отклонение; - нормированное отклонение вариантов от средней арифметической.


Интервал Количество
y f’

78-3229 117 1653,5 0,375672282 49,092208775 93,93483
3229-6380 10 4804,5 0,335860958 43,889733286 26,16817
6380-9531 6 7955,5 0,125638827 16,418266226 6,610946
9531-12682 4 11106,5 0,019665374 2,569837299 0,795912
12682-15833 0 14257,5 0,001287937 0,168305359 0,168305
15833-18984 1 17408,5 0,000035294 0,004612159 214,8228
18984-22135 1 20559,5 0,000000405 0,000052884 18907,3
22135-25286 1 23710,5 0,000000002 0,000000254 3941314

Наиболее распространенным является критерий согласия К. Пирсона , который можно представить как сумму отношений квадратов расхождений между f\' и f к теоретическим частотам:

Вычисленное значение критерия расч. необходимо сравнить с табличным (критическим) значением кр. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m – 3=6-3=3, где m - число групп в ряду распределения для нормального распределения). С вероятностью кр,3=7,8.
То есть , то расхождения между эмпирическими и теоретическими частотами распределения не могут быть случайными и предположение о близости эмпирического распределения к нормальному может быть отвергнуто.
В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского КРом , который, используя величину , предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения

где m - число групп; k = (m - 3 =3) - число степеней свободы при исчислении частот нормального распределения.
Вышеуказанное отношение > 3, то расхождения эмпирических и теоретических частот нельзя считать случайными, а эмпирическое распределение – не соответствующим нормальному и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле

где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; - сумма эмпирических частот.
По таблицам значений вероятностей - критерия можно найти величину , соответствующую вероятности Р., так как величина вероятности Р значительна меньше найденной величины , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями существенны.
Разделить изучаемую совокупность на 3-4 подгруппы, определить внутригрупповые и межгрупповую дисперсию и проверить правило сложения вариаций (дисперсий)
Составим расчетную таблицу:
Интервал Количество Среднее групповое


78-6380 127 1065,969 198284502 127211288
6380-12682 10 9219,2 35626788 511568258
12682-18984 1 17275 0 231289347
18984-25286 2 22253,5 18392113 815005714
Итого: 1065,969 252303402 1685074606

То есть правило сложения дисперсий выполняется.

Задание 3.
Выписанные ранее индивидуальные значения считать собственно-случайной выборкой. Рассчитать среднюю и предельную ошибки выборки для повторного и бесповторного отбора. Определить доверительные границы для выборочной средней. Рассчитать среднюю и предельную ошибки для типической выборки, а также дать пример расчета предельной ошибки для малой выборки и для серийной выборки.
Решение:
Будем считать, что выписанные ранее индивидуальные значения получены собственно-случайной 10% выборкой.

При случайном повторном отборе средняя ошибка выборочной средней рассчитывается по формуле:
,
где — средняя ошибка выборочной средней;
— дисперсия выборочной совокупности;
n — численность выборки.
При бесповторном отборе она рассчитывается по формуле:
,
где N — численность генеральной совокупности.
Предельная ошибка выборки связана со средней ошибкой выборки отношением:
.
Рассчитаем предельную ошибку выборки для доли с вероятностью 0,954:
При повторном отборе

при бесповторном отборе

Получим доверительные границы для выборочной средней:

При повторном отборе

при бесповторном отборе

Для типической выборки:
Для выявления доли простоев из-за несвоевременного поступления полуфабрикатов была проведена фотография рабочего дня 10% рабочих четырех различных цехов. Отбор рабочих внутри цехов производится методом механического отбора. В результате выборки были получены следующие данные:
Цех Число рабочих в выборке Удельный вес простоев из-за несвоевременного поступления полуфабрикатов, %
№1 20 5
№2 36 10
№3 14 15
№4 30 2
С вероятностью 0,954 требуется определить пределы, в которых находится доля простоев на заводе из-за несвоевременного поступления полуфабрикатов.
Рассчитаем долю простоев из-за несвоевременного поступления полуфабрикатов в выборке:

Рассчитаем дисперсии типических групп:
для группы
Средняя из внутригрупповых дисперсий определяется по формуле:

Определяем среднюю ошибку в выборочной доле:

Рассчитаем предельную ошибку выборки для доли с вероятностью 0,954:

С вероятностью 0,954 можно утверждать, что доля простоев рабочих из-за несвоевременного поступления полуфабрикатов находится в пределах .
Пример расчета предельной ошибки выборки для малой выборки.
При контрольной проверке качества поставленной в торговлю колбасы получены данные о содержании поваренной соли в пробах. По данным выборочного обследования нужно установить с вероятностью 0,95 предел, в котором находится средний процент содержания поваренной соли в данной партии товара.
Расчетная таблица
Пробы



4,3 0,2 0,04
4,2 0,1 0,01
3,8 0,3 0,09
4,3 0,2 0,04
3,7 - 0,4 0,16
3,9 - 0,2 0,04
4,5 0,4 0,16
4,4 0,3 0,09
4,0 - 0,1 0,01
3,9 - 0,2 0,04
41,0
— 0,68

Определяем дисперсию малой выборки:

Определяем среднюю ошибку малой выборки:

Исходя из численности выборки (n=10) и заданной вероятности =0,95, устанавливается по распределению Стьюдента значение коэффициента доверия t=2,263.
Предельная ошибка малой выборки составит:

Следовательно, с вероятностью 0,95 можно утверждать, что во всей партии колбасы содержание поваренной соли находится в пределах:
, т.е. от 4,1% - 0,2%=3,9%
до 4,1%+0,2%=4,3%.
Пример для серийной выборки.
В механическом цехе завода в десяти бригадах работает 100 рабочих. В целях изучения квалификации рабочих была произведена 20%-ная серийная бесповторная выборка, в которую вошли 2 бригады. Получено следующее распределение обследованных рабочих по разрядам:
Рабочие Разряды рабочих в бригаде 1 Разряды рабочих в бригаде 2
1 2 3
2 4 6
3 5 1
4 2 5
5 5 3
6 6 4
7 5 2
8 8 1
9 4 3
10 5 2

Необходимо определить с вероятностью 0,997 пределы, в которых находится средний разряд рабочих механического цеха.
Определим выборочные средние по бригадам и общую среднюю:



Определим межсерийную дисперсию:

Рассчитаем среднюю ошибку выборки:

Вычислим предельную ошибку выборки с вероятностью 0,997.

С вероятностью 0,997 можно утверждать, что средний разряд рабочих механического цеха находится в пределах .

Задание 4.
Из любого источника выписать динамический ряд, состоящий из 12 - 15 уровней. Рассчитать следующие характеристики: абсолютный прирост, ускорение, коэффициенты и темпы роста (или снижения) и прироста – цепные и базисные, средний уровень ряда, средний абсолютный прирост, средний коэффициент роста, абсолютное значение одного процента прироста и т. д. произвести выравнивание по 3 или 4 теоретическим кривым, указав наибольшую степень аппроксимации. Произвести экстраполяцию, рассчитать показатели колеблемости, определить доверительные границы прогноза. Сделать выводы по существу.
Решение:
Исходные данные.
Год Среднегодовая численность ППП, чел.
1985 470
1986 500
1987 505
1988 533
1989 540
1990 589
1991 577
1992 594
1993 640
1994 628
1995 646

Для выражения абсолютной скорости роста уровня ряда динамики исчисляют абсолютный прирост, который определяется по формуле:

Интенсивность изменения уровней ряда динамики оценивается темпом роста, который вычисляется по формуле:

Для выражения изменения величины абсолютного прироста уровней ряда динамики в относительных величинах определяется темп прироста:

Показатель абсолютного значения одного процента прироста определяется как результат деления абсолютного прироста на соответствующий темп прироста, выраженный в процентах:


Год Среднегодовая численность ППП, чел. Абсолютный прирост Темп роста Темп прироста Абсолютное значение 1% прироста.
Цеп
ной Базис
ный Цеп
ной Базис
ный Цеп
ной Базис
ный

1985 470 - - 100,00 - 0,00 -
1986 500 30 30 106,383 106,383 6,383 6,383 4,7
1987 505 5 35 101,000 107,447 1,000 7,447 5
1988 533 28 63 105,545 113,404 5,545 13,404 5,05
1989 540 7 70 101,313 114,894 1,313 14,894 5,33
1990 589 49 119 109,074 125,319 9,074 25,319 5,4
1991 577 -12 107 97,963 122,766 -2,037 22,766 5,89
1992 594 17 124 102,946 126,383 2,946 26,383 5,77
1993 640 46 170 107,744 136,170 7,744 36,170 5,94
1994 628 -12 158 98,125 133,617 -1,875 33,617 6,4
1995 646 18 176 102,866 137,447 2,866 37,447 6,28

Средние показатели динамики.
Для моментного ряда с равноотстоящими уровнями средняя хронологическая рассчитывается по формуле:

Определение среднего абсолютного прироста производится по цепным абсолютным приростам по формуле:

Средний темп роста вычисляется по формуле средней геометрической:

Средний темп прироста получим по формуле:

Средняя
хронологическая Средний абсолютный прирост Среднегодовой
Темп роста Среднегодовой
Темп прироста
566,4 17,6 103,23 3,23

Обычно моделирование начинается в построения уравнения прямой: , отражающей линейную форму зависимости результата Y от фактора X.
Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Δ, Δа0 и Δа1. Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X.

Год






1985 1 470 1 470 476,7273 1,189
1986 2 500 4 1000 494,5091 0,971
1987 3 505 9 1515 512,2909 1,289
1988 4 533 16 2132 530,0727 0,518
1989 5 540 25 2700 547,8545 1,389
1990 6 589 36 3534 565,6364 4,131
1991 7 577 49 4039 583,4182 1,135
1992 8 594 64 4752 601,2 1,273
1993 9 640 81 5760 618,9818 3,716
1994 10 628 100 6280 636,7636 1,549
1995 11 646 121 7106 654,5455 1,511
Итого 66 6222 506 39288 6222 18,669
Средняя 6 565,6364 — — — 1,697
Δ= 1210 — — — — —
Δа0= 555324
458,945 — — —
Δа1= 21516
17,782 — — —

Расчёт определителя системы выполним по формуле:
1210;
Расчёт определителя свободного члена уравнения выполним по формуле:
555324.
Расчёт определителя коэффициента регрессии выполним по формуле:
21516.
Расчёт параметров уравнения регрессии даёт следующие результаты:
; .
В конечном счёте, получаем теоретическое уравнение регрессии следующего вида:

Оценку качества модели дадим с помощью скорректированной средней ошибки аппроксимации:
.
В нашем случае, скорректированная ошибка аппроксимации составляет 1,697%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X.
Построение логарифмической функции предполагает предварительное выполнение процедуры линеаризации исходных переменных. В данном случае, для преобразования нелинейной функции в линейную введём новую переменную , которая линейно связана с результатом. Следовательно, для определения параметров модели будут использованы традиционные расчётные приёмы, основанные на значениях определителей второго порядка.
Год







1985 1 0 470 0,000 0,000 444,112 4,577
1986 2 0,693 500 0,480 346,574 497,052 0,521
1987 3 1,099 505 1,207 554,799 528,020 4,070
1988 4 1,386 533 1,922 738,895 549,993 3,004
1989 5 1,609 540 2,590 869,096 567,036 4,780
1990 6 1,792 589 3,210 1055,346 580,961 1,421
1991 7 1,946 577 3,787 1122,790 592,734 2,782
1992 8 2,079 594 4,324 1235,188 602,933 1,579
1993 9 2,197 640 4,828 1406,224 611,929 4,963
1994 10 2,303 628 5,302 1446,023 619,976 1,419
1995 11 2,398 646 5,750 1549,040 627,255 3,314
Итого 17,50231 6222 33,400 10323,976 6222,000 32,429
Средняя 1,591 565,64 — — — 2,948

Расчёт определителей второго порядка даёт следующие результаты:
; ; . Отсюда получаем параметры уравнения:
,
Полученное уравнение имеет вид: .
Оценочные показатели позволяют сделать вывод, что линейно-логарифмическая функция описывает изучаемую тенденция хуже, чем линейная модель: скорректированная средняя ошибка аппроксимации здесь выше и составляет 2,948%, то есть возможности использования для прогноза данной модели более ограничены.
Таким образом, можно придти к выводу, что по сравнению с линейной моделью данное уравнение менее пригодно для описания изучаемой связи.
Проведём расчёт параметров степенной функции, которому также предшествует процедура линеаризации исходных переменных. В данном случае, выполняется логарифмирование обеих частей уравнения, в результате которого получаем уравнение, в котором линейно связаны значения логарифмов фактора и результата. Исходное уравнение после логарифмирования приобретает следующий вид: .
Год








1985 1 470 0 6,153 0,000 0,000 6,113 451,500 3,271
1986 2 500 0,693 6,215 0,480 4,308 6,208 496,945 0,540
1987 3 505 1,099 6,225 1,207 6,838 6,265 525,620 3,646
1988 4 533 1,386 6,279 1,922 8,704 6,304 546,964 2,469
1989 5 540 1,609 6,292 2,590 10,126 6,335 564,114 4,263
1990 6 589 1,792 6,378 3,210 11,429 6,360 578,526 1,852
1991 7 577 1,946 6,358 3,787 12,372 6,382 590,997 2,475
1992 8 594 2,079 6,387 4,324 13,281 6,400 602,017 1,417
1993 9 640 2,197 6,461 4,828 14,197 6,417 611,909 4,966
1994 10 628 2,303 6,443 5,302 14,834 6,431 620,894 1,256
1995 11 646 2,398 6,471 5,750 15,516 6,444 629,136 2,981
Итого 6222 17,502 69,659 33,400 111,605 69,660 6218,623 29,136
Средняя 1,591 6,333 — — — — 2,649
В результате расчёта получены следующие значения определителей второго порядка:
61,071;
373,3;
8,45.
Параметры степенной функции составляют:
; .

Уравнение имеет вид: lnY=ln a0 + a1*ln X = 6,113 + 0,138*lnX , а после процедуры потенцирования уравнение приобретает окончательный вид:
.
Полученное уравнение несколько лучше описывает изучаемую зависимость и более надёжно по сравнению с линейной моделью (ошибка аппроксимации на уровне 2,649% ).
Очевидно, что недостатки степенной модели по сравнению с линейной не столь значительны, но её построение заметно сложнее и требует значительно больших усилий. Поэтому окончательный выбор, в данном конкретном случае, сделаем в пользу модели, которая является более простой при построении, анализе и использовании, то есть в пользу линейной модели:
Если рассчитать прогнозное значение в 1996 году ( Xпрогнозн.= 12), то прогнозное значение результата сформируется на уровне: .
Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии- и ошибки прогноза положения регрессии - . То есть, .
В нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1. Тогда (чел.).
Ошибка положения регрессии составит: =
= 0,781(чел.).
Интегральная ошибка прогноза составит: = = 2,922 (чел.).
Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,26*2,922 = 6,604 ≈ 7,0 (чел.). Табличное значение t-критерия для уровня значимости α=0,05 и для степеней свободы n-k-1 = 11-1-1=9 составит 2,26. Следовательно, ошибка большинства реализаций прогноза не превысит чел.
Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале . Верхняя граница доверительного интервала составит
= 672,323 + 7,0 = 679,323(чел.).
Нижняя граница доверительного интервала составит: = 665,323(чел.).
Относительная величина различий значений верхней и нижней границ составит: = раза. Это означает, что верхняя граница в 1,02 раза больше нижней границы, то есть точность выполненного прогноза весьма велика, но его надёжность на уровне 95% оценивается как высокая. Причиной большой точности прогноза является низкая ошибка аппроксимации. Здесь её значение не выходит за границу 5-7% из-за достаточно высокой типичности линейной регрессии.

Задание 5.
Выписать не менее 15 значений трех количественных признаков, два из которых (X1 и X2) являются факторами. Найти уравнение парной регрессии между X1 и Y, а также меры тесноты их связи ( ). Оценить их надежность, произвести увязку параметров линейного уравнения регрессии с коэффициентами корреляции. Далее, используя все три признака, найти коэффициент множественной корреляции и определить его значимость. Рассчитать и другие показатели, и критерии, используемые в корреляционно-регрессионном анализе.
На отдельном примере рассчитать показатели тесноты связи для качественных признаков ( ).
Решение:
Исходные данные
Соотношение доходов населения и цен на жилье по регионам РФ
№ Название банка Чистые активы Капитал Прибыль
1 Уникомбанк 3743 743 57
2 Внешторгбанк 25286 5741 1962
3 Национальный резервный банк 9911 2952 645
4 ОНЭКСИМ банк 19221 2846 266
5 Международная финансовая компания 9499 1941 512
6 Инкомбанк 17275 1784 744
7 ТОКОбанк 6286 1702 282
8 Империал 6649 1508 429
9 Автобанк 6728 1459 913
10 Международный московский банк 7609 1384 290
11 СБС 11602 1363 175
12 Международный промышленный банк 4887 1197 18
13 Башкредитбанк 1732 1106 417
14 Российский кредит 12278 1079 367
15 Мосбизнесбанк 8453 895 481
16 МЕНАТЕП 11058 893 146
17 Московский индустриальный банк 3117 866 365
18 Промстройбанк России 5651 772 239
Расчёт неизвестных параметров уравнения выполним методом наименьших квадратов (МНК), построив систему нормальных уравнений и решая её, относительно неизвестных а0 и а1. Для расчёта используем значения определителей второго порядка Δ, Δа0 и Δа1. Расчётные процедуры представим в разработочной таблице, в которую, кроме значений Y и X, войдут X2, X*Y, а также их итоговые значения, средние, сигмы и дисперсии для Y и X.






1 1732 417 2999824 722244 103,066 68,017
2 3117 365 9715689 1137705 166,990 42,901
3 3743 57 14010049 213351 195,882 30,090
4 4887 18 23882769 87966 248,683 49,980
5 5651 239 31933801 1350589 283,945 9,738
6 6286 282 39513796 1772652 313,253 6,771
7 6649 429 44209201 2852421 330,008 21,448
8 6728 913 45265984 6142664 333,654 125,520
9 7609 290 57896881 2206610 374,316 18,268
10 8453 481 71453209 4065893 413,270 14,674
11 9499 512 90231001 4863488 461,548 10,931
12 9911 645 98227921 6392595 480,564 35,627
13 11058 146 122279364 1614468 533,503 83,956
14 11602 175 134606404 2030350 558,611 83,113
15 12278 367 150749284 4506026 589,811 48,274
16 17275 744 298425625 12852600 820,445 16,563
17 19221 266 369446841 5112786 910,262 139,585
18 25286 1962 639381796 49611132 1190,189 167,219
Итого 170985 8308 2244229439 107535540 8308 972,673
Среднее 9499,166667 461,5555556 54,037
Сигма 5869,007 427,157
Дисперсия 34445245,917 182463,025


В конечном счёте, получаем теоретическое уравнение регрессии следующего вида:

В уравнении коэффициент регрессии а1 = 0,046 означает, что при увеличении чистых активов на 1 млрд. руб. (от своей средней) прибыль возрастёт на 0,046 млрд. руб. (от своей средней).
Свободный член уравнения а0 = 23,126 оценивает влияние прочих факторов, оказывающих воздействие на прибыль.
Относительную оценку силы связи даёт общий (средний) коэффициент эластичности:

В нашем случае, когда рассматривается линейная зависимость, расчётная формула преобразуется к виду:

Это означает, что при изменении чистых активов на 1% от своей средней прибыль увеличивается на 0,949 процента от своей средней.
Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:
,
Коэффициент корреляции, равный 0,634, показывает, что выявлена достаточно сильная между объемом чистых активов и прибылью. Коэффициент детерминации, равный 0,402, устанавливает, что вариация прибыли на 40,2% из 100% предопределена вариацией чистых активов; роль прочих факторов, влияющих на розничный товарооборот, определяется в 59,8%, что является достаточно большой величиной.
Для оценки статистической надёжности выявленной зависимости рассчитаем фактическое значение F-критерия Фишера – Fфактич. и сравним его с табличным значением – Fтабл. По результатам сравнения примем решения по нулевой гипотезе , то есть, либо примем, либо отклоним её с вероятностью допустить ошибку, которая не превысит 5% (или с уровнем значимости α=0,05).
В нашем случае, ; где k - число факторов в уравнении; - число изучаемых объектов. Для обоснованного вывода сравним полученный результат с табличным значением критерия: при степенях свободы d.f.1=k=1 и d.f.2=n-k-1=18-1-1=16 и уровне значимости α=0,05.
В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости прибыли от чистых активов и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.
Оценку качества модели дадим с помощью скорректированной средней ошибки аппроксимации:
.
В нашем случае, скорректированная ошибка аппроксимации составляет 54,037%. Она указывает на невысокое качество построенной линейной модели и ограничивает её использование для выполнения точных прогнозных расчётов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).
При построении двухфакторной регрессионной модели воспользуемся для упрощения расчётов методом стандартизованных переменных. В этом случае, исходное уравнение приобретает вид: . Выполним расчёт -коэффициентов, используя значения известных по условию линейных коэффициентов парной корреляции.



;

;
В результате получено уравнение в стандартизованном масштабе:


С увеличением чистых активов на 1 млрд. руб. прибыль уменьшается на 0,03 млрд. руб., с увеличением капитала на 1 млрд. руб. прибыль возрастает на 0,851 млрд. руб.
Но так как признаки-факторы измеряются в разных единицах, сравнивать значения их коэффициентов регрессии не следует. Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и β - коэффициенты.
Тесноту выявленной зависимости оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β – коэффициентов: В нашем случае 2-х факторной зависимости расчёт строится следующим образом:
.

Как показали расчёты, установлена средняя зависимость прибыли от капитала и чистых активов. Это означает, что 68,1% вариации прибыли определены вариацией данных факторов. Оставшиеся 31,9% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.
Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть, .
Для проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и остаточной дисперсий и их степеней свободы: d.f.1=k и d.f.2=n-k-1; где: n –число изучаемых единиц; k – число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k=2.
.
В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:
.
Для принятия обоснованного решения Fфактич. сравнивается с Fтабличн., которое формируется случайно и зависит степеней свободы факторной (d.f.1 = k) и остаточной (d.f.2 = n-k-1) дисперсий, а также от уровня значимости α=0,05. В нашем примере, где d.f.1=k= 2 и d.f.2=n-k-1 = 18-2-1=15 при α=0,05 Fтабл = 3,68. В силу того, что Fфактич =16,011> Fтабл. = 3,68, можно с не очень высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы – согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.

Непараметрические методы применяются для измерения тесноты связи качественных и альтернативных признаков, а так же количественных признаков, распределение которых отличается от нормального распределения.
Для измерения связи альтернативных признаков применяются коэффициент ассоциации Дэвида Юла и коэффициент контингенции Карла Пирсона.
проанализируем зависимость между полом и фактом совершения покупки посетителями магазина.
1 признак



2 признак М Ж Итого
Купил 24 32 56
Не купил 16 28 44
Итого 40 60


Наблюдается очень слабая прямая связь между полом и фактом свершения покупки. Предельное абсолютное значение коэффициента может быть близко к единице.
Коэффициент ассоциации непригоден для расчета в том случае, если одна из частот по диагонали равна 0. В этом случае применяется коэффициент контингенции, который рассчитывается по формуле:

Коэффициент контингенции также указывает на практическое отсутствие связи между признаками (его величина всегда меньше Кас).
Если значения признака распределены более чем по 2 группам, то для определения тесноты связи применяют коэффициенты взаимной сопряженности признаков Пирсона, Чупрова и др.
Показатель Пирсона определяется по формуле , где - показатель взаимной сопряженности признаков, который рассчитывается на основе матрицы взаимного распределения частот.
Рассмотрим зависимость между величиной магазина и формой обслуживания.

Самообслуживание Традиционное Итого
Мелкие
магазины 12 45 57
Средние 19 10 29
Крупные 14 4 18
Итого 45 59







Коэффициент свидетельствует о наличии заметной связи между величиной магазина и формой его обслуживания. Более точным показателем тесноты связи является коэффициент Чупрова, который определяется по формуле:
, где - соответственно число групп, выделенных по каждому признаку.


Задание 6.
Подобрать примеры и рассчитать: агрегатные индексы физического объема, цен, товарооборота, абсолютные разности, индексы фиксированного и переменного составов, индексы структурных, ассортиментных сдвигов, индексы территориальных сдвигов.
Решение:

Вид продукции (варианты) Базисный период Текущий период
Выпуск
продукции, тыс. шт. Цена
за единицу, тыс. руб. /шт. Выпуск
продукции, тыс. шт. Цена
за единицу, тыс. руб./шт.
A 3 H 6
I 66 3 37 3
II 56 5 40 5
III 63 7 62 9

1. Индивидуальные индексы цен и физического объема товарооборота.
Индивидуальные индексы вычисляются по формуле

Индивидуальные индексы физического объема товарооборота вычисляются по формуле

Таб. «Индивидуальные индексы»
Продукты Индексы цен Индексы физического объема
товарооборота Индекс товарооборота
А 1,000 0,561 0,561
Б 1,000 0,714 0,714
В 1,286 0,984 1,265
2. Общий индекс цен вычисляется по формуле.

3. Общие индексы.
Общий индекс физического объема вычисляется по формуле

Общий индекс стоимости


Абсолютное изменение стоимости произведенной продукции
тыс. руб.
в том числе
за счет изменения цен на отдельные виды продукции
тыс. руб.
за изменения структуры
тыс. руб.
Особый подход существует при индексировании средних величин. Индекс средней величины определяется как отношение ее значений в текущем и базисном периоде. Например, индекс средней цены будет определяться так:

При этом на величину средней влияет как изменение цен, так и изменение структуры набора продукции, для которой определялась средняя цена, поскольку в ее расчете участвуют веса разных периодов (q0 и q1). Поэтому индекс средней величины называется индексом переменного состава, а для анализа влияния на индекс средней величины непосредственного изменения усредняемой величины (в данном случае - цены) определяется индекс фиксированного состава:
,
а изменения структуры продукции - индекс структурного (ассортиментного) сдвига:

Выводы: Стоимость продукции снизилась на 50 тыс. руб. или на 5,4%, за счет роста цен выросла на 124 тыс. руб. или на 16,6% и за счет изменения структуры снизилась на 174 тыс. руб. или на 18,9 %.
Средняя цена выросла на 1,284тыс. руб. или на 25,9%, в том числе увеличилась на 0,893тыс. руб. или на 16,6% за счет изменения цен, и выросла на 0,391тыс. руб. или на 7,9% за счет изменения структуры.
750 руб.

Похожие работы:

Курсовая работа по дисциплине: «Экономическая теория» на тему: «Разгосударствление российской экономики: цели, методы, результаты» 

ВВЕДЕНИЕ Тема моей курсовой работы «Разгосударствление российской экономики: цели, методы, результаты». Выбрана ...

Курсовая работа по истории России 

Достоверные сведения о славянах историческая наука имеет лишь с V-VI вв. н. э. Более ранняя же их история весьма ...

Курсовая работа на тему «Планирование на предприятиях здравоохранения» 

Введение Ресурсы здравоохранения в любом обществе всегда ограничены, поэтому вопросы их более эффективного ...

Курсовая работа по дисциплине "Информатика". 

Введение
Независимо от используемой операционной системы и программных приложений пользователь часто выполняет ...

Поиск по базе выполненных нами работ: