|
3. Анализ матрицы коэффициентов парных корреляций
Таблица 2
№ фактора
N
P
S
V
B
N
1.00
-0.22
-0.06
0.44
0.12
P
-0.22
1.00
0.91
0.68
0.74
S
-0.06
0.91
1.00
0.86
0.91
V
0.44
0.68
0.86
1.00
0.85
B
0.12
0.74
0.91
0.85
1.00
Из таблицы 2 находим тесно коррелирующие факторы. Налицо мультиколлениарность факторов P и S ( 0.91 ). Оставим только один фактор P . И действительно если скорость в сети высокая то она может без значительных задержек во времени обработать значительное кол-во запросов от пользователей, значит чем больше скорость в сети тем больше в ней пользователей. Тем загруженее сеть.
4. Построение уравнения регрессии
Используя программное обеспечение «ОЛИМП» (которое в свою очередь использует для расчетов указанные выше принципы и формулы чем значительно облегчает нам жизнь), найдем искомое уравнение множественной регрессии, исключив из расчетов, как указывалось выше, факторы S – скорость сети (чел/день )
Путем перебора возможных комбинаций оставшихся факторных признаков получим следующую модель:
Функция N = +12.567-0.005*P+0.018*V
Оценки коэффициентов линейной регрессии
№
Значение
Дисперсия
Среднеквадратическое отклонение
Значение tрасч
1
12.57
2.54
1.59
7.88
2
-0.01
0
0
-3.60
3
0.02
0
0
4.07
Кpитические значения t-pаспpеделения
пpи 8 степенях свободы
имеют следующие значения:
веpоятность t-значение
0.900 1.400
0.950 1.863
0.990 2.887
В нашей модели |tрасч |> tкритич у всех коэффициентов регрессии значит можно утверждать, что модель является адекватной моделируемому явлению, т.е. гипотеза о значимости уравнения не отвергается, о чем говорят также данные выдаваемые компьютером:
Характеристики остатков
Среднее значение...................………….. -0.000
Оценка дисперсии...................…………. 3.6
Оценка приведенной дисперсии......…. 4.95
Средний модуль остатков...........……… 1.391
Относительная ошибка аппроксимации. 9.898
Критерий Дарбина-Уотсона...........……. 1.536
Коэффициент детерминации...........…… 0.690
F - значение ( n1 = 3, n2 = 8).………. 143
Гипотеза о значимости уравнения не отвергается с вероятностью 0.950
При увеличении количества вакансий в день, количество посетивших сайт людей будет увеличиваться . Это означает что в настоящий момент сайт не полностью удовлетворяет запросы пользователей, что необходимо увеличить количество вакансий, но в связи со сложившимся в экономике России положением это представляется проблематичным.
При увеличении загруженности внутренней сети в которой расположен сервер содержащий исследуемый сайт количество людей посетивших сайт будет уменьшатся из-за снижения скорости доступа к нему а также из-за возможных перегрузках в узлах сети, в связи с чем сервер содержащий сайт может не отвечать на запросы пользователей. Также с перегрузкой связаны различные сбои в работе системы, что отрицательно сказывается на работе сайта. Коэффициент детерминации у линейной модели - 0.69. Это означает , что факторы , вошедшие в модель объясняют изменение количества посетивших сайт людей на 69%. Следовательно значения полученные с помощью линейной модели близки к фактическим.
«Теория статистики» учебник под редакцией проф. Р.А.Шмойловой Издательство «Финансы и статистика» 1996 г.
При использовании материалов активная ссылка на источник обязательна.