Рефераты. Регрессионный анализ в моделировании систем. Исследование посещаемости WEB сайта

Регрессионный анализ в моделировании систем. Исследование посещаемости WEB сайта


 

Кафедра математической статистики и эконометрики

 

 

Дополнительная  работа

По курсу:

“Математическая статистика”

 

По теме:

“Регрессионный анализ моделировании систем”

 

Исследование посещаемости WEB сайта


 

 

Группа: ДИ 202

Студент: Шеломанов Р.Б.

 

Руководитель: Шевченко К.К.

 

 

Москва 1999





Содержание


Теоретическая часть работы...................................................................... 3

Основные задачи корреляционно-регрессионного анализа................... 3

Корреляция случайных величин............................................................. 4

Линейная регрессия................................................................................. 5

Оценка существенности связи, принятие решения на основе уравнения регрессии.       10

Практическая часть работы...................................................................... 11

1. Описание объекта............................................................................... 11

2. Факторы формирующие  моделируемое явление.............................. 12

3. Анализ матрицы коэффициентов парных корреляций...................... 13

4. Построение уравнения регрессии...................................................... 13

5. Смысл модели.................................................................................... 15

Литература................................................................................................. 16


 



Теоретическая часть работы


Основные задачи корреляционно-регрессионного анализа


Все явления и процессы, характеризующие социально-экономическое развитие и составляющие единую систему национальных счетов, тесно взаимосвязаны и взаимозависимы между собой.

В статистике показатели, характеризующие эти явления, могут быть связаны либо корреляционной зависимостью, либо быть независимыми Корреляционная зависимость является частным случаем стохастиче­ской зависимости, при которой изменение значений факторных признаков (х 1 х2 ..., хn ) влечет за собой изменение среднего значения результативно­го признака.

Корреляционная зависимость исследуется с помощью методов корре­ляционного и регрессионного анализов.

Корреляционный анализ изучает взаимосвязи показателей и позволяет решить следующие задачи.

1. Оценка тесноты связи между показателями с помощью парных, ча­стных и множественных коэффициентов корреляции

2. Оценка уравнения регрессии.

Основной предпосылкой применения корреляционного анализа явля­ется необходимость подчинения совокупности значений всех факторных (х1 х2 .... хn) и результативного (У) признаков r-мерному нормальному закону распределения или близость к нему. Если объем исследуемой сово­купности достаточно большой ( n > 50), то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсо­на,  Боярского, Колмогорова, чисел Вастергарда и т. д. Если n < 50, то закон распределения исходных данных определяется на базе построения и визуального анализа поля корреляции. При этом если в рас­положении точек имеет место линейная тенденция, то можно предполо­жить, что совокупность исходных данных  подчиняется нормальному распределению.

Целью регрессионного анализа является оценка функциональной за­висимости условного среднего значения результативного признака (У) от факторных (х1. Х2..., хn).

Основной предпосылкой регрессионного анализа является то, что толь­ко результативный признак (У) подчиняется нормальному закону распре­деления, а факторные признаки х1. Х2..., хn  могут иметь произвольный закон распределения. В анализе динамических рядов в качестве фактор­ного признака выступает время t При этом в регрессионном анализе зара­нее подразумевается наличие причинно-следственных связей между ре­зультативным (У) и факторными х1. Х2..., хn признаками.

Уравнение регрессии, или статистическая модель связи социально-эко­номических явлений, выражаемая функцией Y=f(х1. Х2..., хn) является достаточно адекватным реальному моделируемому явлению или процессу в случае соблюдения следующих требований их построе­ния.

1. Совокупность исследуемых исходных данных должна быть одно­родной и математически описываться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколь­кими уравнениями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (цифровое) выражение.

4. Наличие достаточно большого объема исследуемой выборочной со­вокупности.

5. Причинно-следственные связи между явлениями и процессами сле­дует описывать линейной или приводимой к линейной формой зависимо­сти.

6. Отсутствие количественных ограничений на параметры модели свя­зи.

7. Постоянство территориальной и временной структуры изучаемой совокупности.

Соблюдение данных требований позволяет исследователю построить статистическую модель связи, наилучшим образом аппроксимирующую моделируемые социально-экономические явления и процессы.


Корреляция случайных величин

Прямое токование термина  корреляция  —  стохастическая,  вероятная, возможная связь между двумя  (парная)  или  несколькими  (множественная) случайными величинами.

Для числовой оценки возможной связи между двумя случайными  величинами: Y(со средним  My и среднеквадратичным  отклонением  Sy) и —  X (со средним Mx   и среднеквадратичным  отклонением  Sx)   принято использовать так называемый  коэффициент корреляции

Rxy= .

Этот коэффициент может принимать значения  от -1 до +1  —  в зависимости от тесноты связи между данными случайными величинами.

Если коэффициент корреляции  равен нулю, то X и Y называют некоррелированными.  Считать их независимыми обычно нет оснований —  оказывается,  что  существуют  такие,  как  правило —  нелинейные  связи   величин, при  которых  Rxy = 0, хотя величины зависят друг от друга. Обратное всегда верно —  если  величины независимы, то Rxy = 0.  Но, если  модуль Rxy = 1, то есть все основания предполагать наличие линейной связи между  Y и X. Именно поэтому часто говорят о линейной корреляции при  использовании такого способа оценки связи между СВ.

В отдельных случаях приходится решать  вопрос  о  связях нескольких (более 2) случайных величин или вопрос  о  множественной корреляции.

Пусть X, Y и Z - случайные величины, по наблюдениям над которыми  мы установили их средние Mx, My,Mz и среднеквадратичные отклонения Sx, Sy, Sz.

Тогда можно найти парные коэффициенты корреляции Rxy, Rxz, Ryz по приведенной выше формуле. Но этого явно недостаточно - ведь мы  на  каждом из трех этапов попросту забывали о наличии третьей случайной  величины! Поэтому в  случаях  множественного  корреляционного  анализа иногда требуется отыскивать т. н. частные коэффициенты корреляции —  например,  оценка виляния Z  на связь между X и  Y производится с помощью коэффициента

Rxy.z  =                                                       


И, наконец, можно поставить вопрос — а какова связь между данной СВ и совокупностью остальных? Ответ на такие вопросы дают коэффициенты множественной корреляции   Rx.yz, Ry.zx, Rz.xy,  формулы для вычисления которых построены по тем же принципам  —  учету связи одной из величин со всеми  остальными в совокупности.

На сложности вычислений всех описанных  показателей  корреляционных связей можно не обращать особого внимания -  программы  для  их  расчета достаточно просты и имеются в готовом виде  во  многих  ППП  современных компьютеров. Например программное обеспечение «Олимп» с помощью которого производится ряд расчетов в этой работе.


  Линейная регрессия

Страницы: 1, 2, 3



2012 © Все права защищены
При использовании материалов активная ссылка на источник обязательна.