microbik.ru
1 2 3 4


Министерство образования Российской Федерации

Всероссийский заочный финансово-экономический институт

КУРСОВАЯ РАБОТА

по статистике

на тему

Корреляционно-регрессионный анализ в экономических исследованиях”

Студент 3-го курса:

группа:

специальность:

личное дело:

руководитель:

Челябинск

2005

Оглавление
Введение………………………………………………………………….....2

Теоретическая часть……………………………………………………......4

  1. Взаимосвязанные признаки и графики связи………………………4

  2. Виды связей между признаками…………………………………….6

  3. Уравнение регрессии………………………………………………...8

  4. Корреляционная таблица……………………………………..……13

  5. Эмпирическое корреляционное отношение………………………15

  6. Коэффициент линейной корреляции и индекс корреляции……..17

  7. Множественная корреляция…………………………………….….19

Расчетная часть……………………………………………………………20

Аналитическая часть………………………………………………………25

Заключение………………………………………………………………...30

Список использованной литературы………………………………….….31

Введение

Обработка статистических данных уже давно применяется в самых разнообразных видах человеческой деятельности. Вообще говоря, трудно назвать ту сферу, в которой она бы не использовалась. Но, пожалуй, ни в одной области знаний и практической деятельности обработка статистических данных не играет такой исключительно большой роли, как в экономике, имеющей дело с обработкой и анализом огромных массивов информации о социально-экономических явлениях и процессах. Всесторонний и глубокий анализ этой информации, так называемых статистических данных, предполагает использование различных специальных методов, важное место среди которых занимает корреляционный и регрессионный анализы обработки статистических данных, поэтому тема моей курсовой работы очень актуальна.

В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа. Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей. Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.

Основными задачами корреляционного анализа являются оценка силы связи и проверка статистических гипотез о наличии силе корреляционной связи. Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.

Использование возможностей современной вычислительной техники, оснащенной пакетами программ машинной обработки статистической информации на ЭВМ, делает практически осуществимым оперативное решение моей задачи изучения связи между размером среднегодовой стоимости основных производственных фондов и выпуском продукции в расчетной части курсовой работы.

При машинной обработке исходной информации на ЭВМ, оснащенных пакетами стандартных программ ведения анализов, вычисление параметров применяемых математических функций является быстро выполняемой счетной операцией.

Для полного усвоения корреляционно-регрессионного анализа в экономических исследованиях в аналитической части работы будет приведено еще одно решение задачи.

Данная работа посвящена изучению возможности обработки статистических данных методами корреляционного и регрессионного анализа с использованием пакета прикладных программ Microsoft Excel.

Взаимосвязанные признаки и графики связи
Марксистко-ленинская философия учит, что существует всеобщая связь явлений, представляющая собой результат универсального взаимодействия всех предметов и явлений.

При рассмотрении влияния одних признаков явлений на другие из цепи признаков, характеризующих данное явление, выделяются признаки факторные и результативные. Выделение признаков производится прежде всего при помощи логического анализа. Например, производительность труда рабочих зависит от многих факторов, в том числе и от стажа работы этих рабочих. Производительность труда выступает здесь как результативный признак, а стаж работы называется функцией, факторный - аргументом.

Наиболее простым методом оценки связи двух или нескольких признаков является метод группировки, при котором факторные признаки являются основанием группировки.

Статистическую связь между двумя признаками можно изобразить графически. Для этой цели в математике результативный признак принято обозначать через , факторный признак – через . Имея численные значения обоих признаков, можно каждую пару чисел, относящуюся к определенной единице совокупности, графически представить на плоскости, образуемой системой прямоугольных координат, в виде точки. Согласно правилам математики по оси абсцисс откладываются значения факторного признака, а по оси ординат – результативного. Соединив полученные точки прямыми линиями, в итоге получаем ломаную, которую называют ломаной регрессии. Число точек ломаной регрессии зависит от числа единиц, по которым даны значения обоих признаков.

График связи можно применить лишь при иллюстрации зависимости между двумя признаками, т. е., как говорят, при парной корреляции. При графическом изображении связи между несколькими взаимосвязанными признаками используется метод графов. Метод графов не позволяет судить о форме связи между признаками, а дает возможность графически представить, какие из факторов влияют на результативный признак, а также взаимосвязи факторных признаков. Граф представляет собой точки(вершины), соединенные линиями(ребрами).

Виды связей между признаками

В статистике взаимосвязь явлений изучается методом корреляции. Основоположниками теории корреляции считаются английские биометрики Ф. Гальтон (1822-1911 гг.) и К. Пирсон (1857-1936 гг.).

Всеобщая связь явлений составляет внутреннее структурное единство всех элементов и свойств в каждой целостной системе. Всеобщая связь явлений имеет бесконечное разнообразие проявлений. Связи могут быть существенными и несущественными, прямыми и косвенными, функциональными и статистическими. Всеобщая связь явлений тесно связана с причинностью, однако причина и следствие, как таковые, могут рассматриваться лишь вне универсальной связи одних явлений с другими.

Связь называется функциональной, если изменение одних явлений вызывает вполне определенное изменение других. Такие связи проявляются в виде закона, который обладает точной количественной определенностью и может быть, в принципе, выражен в форме уравнения. Так, площадь круга зависит от квадрата его радиуса. Площадь круга в этом случае является функцией радиуса круга (аргумента). Таким образом, при функциональных связях факторный признак полностью определяет величину результативного признака.

В массовых явлениях общественной жизни функциональные связи встречаются реже. Эти явления отличаются сложностью и многообразием существующих и проявляющихся между ними взаимосвязей. Стохастической называется связь между случайными величинами. Эта связь проявляется в том, что изменение одной величины вызывает изменение распределения другой, связанной с ней случайной величиной. Частным случаем стохастических связей являются статистические.

Итак, связи, возникающие при большом числе наблюдений и проявляющиеся в том, что изменение среднего значения одного признака приводит в общем и в целом к изменению среднего значения другого признака, называются связями статистическими. Статистические связи подразделяются на связи корреляционные и регрессионные. Величины называются корреляционно связанными, если изменение математического ожидания одной из них изменяет математическое ожидание другой, при этом оба взаимосвязанных признака должны выражаться случайными величинами. Регрессионные связи выражают зависимость между случайными и неслучайными величинами. Результативными признаками здесь являются случайные величины, а факторными – неслучайные величины.

Уравнение регрессии

Уравнение, отображающее статистическую связь между признаками, называется уравнением регрессии. Если уравнение регрессии связывает лишь два признака, то оно называется уравнением парной регрессии или уравнением регрессии одного фактора. Если уравнение связи отражает зависимость результативного признака от двух или более факторных признаков, оно называется уравнением множественной регрессии.

При определении вида уравнения парной регрессии используют, главным образом, графическое изображение статистической связи. Полученная ломаная регрессии дает исследователю возможность определить, какую функцию надо применить для отображения связи.

Геометрически уравнение регрессии видоизменяется при парной регрессии, как прямая или кривая линия, при множественной регрессии - как гиперповерхность (в линейной связи – гиперплоскость) в (n+1)-мерном пространстве, вокруг которой рассеяны фактические данные.

Прямая связь, при которой результативный признак изменяется по арифметической прогрессии, а факторный – более быстро требует применения параболической или показательной регрессии. Уравнение множественной регрессии часто выражают прямой, зависящей от многих переменных, или степенной функцией.

Определить уравнение регрессии означает найти его параметры. При этом обычно применяют правило наименьших квадратов, согласно которому сумма квадратов отклонений фактических значений результативного признака () от его значений, найденных по уравнению регрессии ( или , или и т. д.) должна быть наименьшей:

min

Это выражение после дифференцирования превращается в систему нормальных уравнений, решение которой позволяет определить параметры уравнения регрессии. Всегда число нормальных уравнений на одно больше числа входящих в уравнение регрессии независимых переменных.

Доказано, что уравнение регрессии отражает связь между признаками более точно, если оно построено на основании достаточно большого числа наблюдений для однородной совокупности экономических явлений. Поскольку оно выражает приближенную связь, его часто называют моделью связи между явлениями.

Линейная регрессия одного фактора

Уравнение линейной регрессии одного фактора записывается в виде уравнения прямой: +, где - факторный признак; - результативный признак; и - параметры уравнения. Чтобы определить параметры пользуются методом наименьших квадратов и находят минимум функций S= Σ ( - -). В этой функции за переменные принимаются последовательно значения и . Экстремум функции двух переменных определяется, если приравнять частные производные по этим переменным нулю.

После определения частных производных функции по и , приравнивания их нулю, и небольших преобразований получим систему нормальных уравнений:

+Σ = Σ;

Σ+Σ = Σ,

Решение которой и позволяет определить величины параметров и , а следовательно и уравнение регрессии.

Параметры уравнения линейной регрессии одного фактора можно находить и по формулам:

=; = - .

Ясно, что практически приемлемым является наименее трудоемкий вариант расчета. В уравнении прямой параметр экономического смысла не имеет. Параметр является коэффициентом регрессии и показывает изменение результативного признака при изменении факторного признака на единицу.

Кроме линейной функции связи в экономическом анализе часто применяются степенная, гиперболическая и параболическая функции.

Расчет параметров степенной функции

Если значения факторного признака расположены в порядке геометрической прогрессии и соответствующие значения результативного признака также образуют геометрическую прогрессию, то связь между признаками может быть представлена степенной функцией вида



Для определения параметров степенной функции методом наименьших квадратов необходимо привести ее к линейному виду путем логарифмирования:

.

Система нормальных уравнений имеет вид:

ΣΣ,

ΣΣΣ.

Параметры можно определить, решая систему нормальных уравнений или по формулам:

, .


следующая страница >>