Курсовая работа по эконометрике. Работа 3Парная корреляция и регрессия - исследование по корреляционной таблице связи между компонентами двумерной случайной величины и зависимости одной величины от другой (выполняется с применением программ Описательная статистика, Однофакторный дисперсионный анализ, Корреляция и Регрессия надстройки Анализ данных пакета Microsoft Excel).Задача. Исследуется связь между расходами дилеров некоторой компании на рекламу продукции (X, тыс. ден. ед.) и их объемами продаж (У, тыс. ден. ед.) и зависимость объема продаж У от расходов на рекламу X. Сведения по 60 случайно отобранным дилерам сгруппированы в корреляционную таблицу и приведены для каждого варианта в прил. 3.Исходные данные:При выполнении данной задачи в курсовой работе по эконометрике требуется:1. Выяснить, существует ли корреляционная зависимость объема продаж У от величины расходов на рекламу X. Для этого необходимо:а) построить поле корреляции; вычислить групповые средние - средние объемы продаж для указанных в корреляционной таблице интервалов расходов на рекламу; на том же графике построить линию групповых средних - линию, соединяющую точки (x'; y'x'), где х' - центр соответствующего интервала значений расходов на рекламу х;б) используя случайную модель однофакторного дисперсионного анализа, проверить гипотезу об отсутствии влияния интервала вложенных в рекламу средств на объем продаж;в) при отклонении гипотезы оценить влияние величины вложенных в рекламу средств на объем продаж, используя корреляционное отношение ρ(У | X) и коэффициент детерминации ρ2(У | X).2. Исследовать правомерность предположения о линейности корреляционной связи между X и У. Для этого:а) вычислить оценку r(X,Y) коэффициента корреляции r(X,Y) и оценку r2(X,Y) коэффициента линейной детерминации r2(X,Y); предположив нормальность распределения случайной величины (X, У), на 5%-ном уровне значимости проверить гипотезу Н0: r(Х,У) = 0 при альтернативной гипотезе Н1: r(Х,У) ≠ 0; при отклонении Н0 дать содержательную интерпретацию r(X,Y) и r2(X,Y);б) найти оценки â0, â1, sERL параметров а0, а1 и σERL, модели линейной регрессии Y = а0 + а1х + ε [где ε = N (0; σERL)] и прямой линией выровнять линию групповых средних;в) на 5%-ном уровне значимости проверить гипотезу Н0: а1 = 0 при альтернативной гипотезе Н0: а1 ≠ 0; при отклонении Н0:- дать содержательную интерпретацию коэффициента â1;- построить 95%-ную интервальную оценку параметра а1 и дать содержательную интерпретацию ее границ; построить 95%-ную интервальную оценку параметра а0;- дать точечные и 95%-ные интервальные прогнозы генерального среднего объема продаж и объема продаж для центров интервалов расходов на рекламу; найденные интервальные прогнозы изобразить на том же графике, где изображено поле корреляции.г) на 5%-ном уровне значимости проверить гипотезу о линейности функции регрессии Y на х. Курсовая работа по эконометрике. Работа 4Множественный линейный регрессионный анализ - алгоритм пошагового исключения, регрессоров (выполняется с применением программ Корреляция и Регрессия надстройки Анализ данных пакета Microsoft Excel).Задача. Изучается линейная (в среднем) зависимость результативного признака Y от пяти факторных признаков - регрессоров х(1), х(2), х(3), х(4), х(5) по числовым данным, собранным на n = 52 объектах.При выполнении данной задачи в курсовой работе по эконометрике требуется:1. Записать модель множественного линейного регрессионного анализа признака Y, предъявляемые к ней требования и соответствующую функцию регрессии.2. Рассчитать с помощью программы Корреляция матрицу (6 х 6) оценок коэффициентов парной корреляции между признаками и сделать вывод о силе линейной связи результативного признака с каждым из регрессоров и о силе линейной связи каждой пары регрессоров. Найти коллинеарные регрессоры (на практике коллинеарными считаются такие регрессоры, коэффициент корреляции между которыми по модулю больше 0.7 - 0,8). Матрицу (52 х 6) значений признаков сохранить для использования в работе 5.3. Вычислить оценки â0, â1, â2, â3, â4, â5 и sERL, параметров модели множественной линейной регрессии Y = â0+â1x(1)+â2x(2)+â3x(3)+â4x(4)+â5x(5) + ε [где ε = N (0; σERL)] с помощью программы Регрессия с Выводом остатка, приняв уровень надежности равным 95%; записать уравнение регрессии и его стандартную ошибку (sERL); используя Остатки, вычислить среднюю относительную ошибку аппроксимации δ; привести формулы расчета показателей Регрессионной статистики, пояснив их смысл.4. Предположив выполнение условий линейного регрессионного анализа:а) оценить статистическую значимость уравнения регрессии (проверить на 5%-ном уровне значимости гипотезу Н0: а1 = а2 = а3 = а4 = а5 = 0, используя для этого в таблице Дисперсионный анализ F-статистику и значимость F- рассчитанный уровень значимости; привести алгоритм заполнения таблицы Дисперсионный анализ;б) оценить статистическую значимость коэффициентов уравнения регрессии (проверить на 5%-ном уровне значимости гипотезы H0(j) : aj = 0 при альтернативных гипотезах H0(j) : aj ≠ 0, j=1,2,3,4,5), используя для этого: t-статистику, Р-значение - рассчитанный уровень значимости, 95%-ную интервальную оценку параметра аj.5. При наличии в уравнении регрессии хотя бы одного незначимого коэффициента исключить тот регрессор, при котором коэффициент незначим, а соответствующая этому коэффициенту величина Р-значения является наибольшей (или, иначе, значение модуля соответствующей t-статистики является наименьшим). Выполнить пп. 3 - 4 с оставшимися регрессорами. Процедуру пошагового исключения регрессоров продолжать до тех пор, пока не будет получено значимое уравнение регрессии со значимыми коэффициентами.Систематизировать результаты пошаговой регрессии, выписав для каждого шага:- уравнение регрессии;- коэффициент линейной детерминации (R-квадрат), нормированный коэффициент линейной детерминации (нормированный R-квадрат), стандартную ошибку sELR, ошибку аппроксимации δ, значение F-статистики и критическую точку f0.05;k;n-k-1, найденную с помощью функции FPACПOБP;- под оценками параметров аj - 95%-ные доверительные интервалы для этих параметров;- под доверительными интервалами - числовые значения t-статистик и критическую точку t0.05;m-n-1, найденную с помощью функции СТЬЮДРАСПОБР;- под значениями t-статистик -соответствующие Р-значения.6. Выбрать лучшее уравнение и, используя его, ответить на следующие вопросы:а) Какой процент выборочной дисперсии признака Y обусловлен линейным влиянием включенных в уравнение регрессоров?б) Каковы точечная и 95%-ная интервальная оценки генерального среднего значения признака Y при значениях регрессоров на первом объекте?в) Увеличение какого регрессора на единицу его измерения (при неизменных значениях других регрессоров) ведет к наибольшему изменению среднего значения результативного признака; увеличение какого регрессора на единицу его измерения (при неизменных значениях других регрессоров) ведет к наибольшему максимально возможному с 95%-ной вероятностью изменению среднего значения результативного признака?г) Увеличение среднего значения какого регрессора на 1% (по отношению к его среднему значению) при неизменных значениях других регрессоров ведет к наибольшему процентному изменению среднего значения результативного признака (по отношению к его среднему значению); увеличение среднего значения какого регрессора на 1% (по отношению к его среднему значению) при неизменных значениях других регрессоров ведет к наибольшему максимально возможному с 95%-ной вероятностью процентному изменению среднего значения результативного признака? Курсовая работа по эконометрике. Работа 5Компонентный и факторный анализ (выполняется с применением программы Factor analysis пакета SPSS).Задача. Научается система из пяти признаков X(1), X(2), X(3), X(4), X(5) по числовым данным, собранным на n = 52 объектах. Цель - выявить общие для этих признаков латентные факторы (компоненты), влиянием которых обусловлены вариации признаков и их ковариации. Варианты признаков и их числовые значения приведены для каждого варианта в прил. 4 (они совпадают с вариантами факторных признаков в работе 4, Курсовая работа по эконометрике). При выполнении данной задачи в курсовой работе по эконометрике требуется:1. Записать модель компонентного анализа и предъявляемые к ней требования. Используя в качестве исходных данных матрицу (52 х 5) значений признаков X(1), X(2), X(3), X(4), X(5) (сохраненную при выполнении п. 2 работы 4), обратиться к программе Factor analysts и реализовать метод главных компонент (principal components), задав максимальное число факторов равным пяти.2. В окне результатов работы программы Factor analysis:а) выбрав для просмотра таблицу Total variance explained, определить доли общей дисперсии признаков (в процентах), приходящиеся на каждую компоненту, и накопленные доли этой дисперсии (в процентах);б) выбрав для просмотра таблицу Component matrix:- определить матрицу (5 х 5) нагрузок признаков на компоненты;- записать выражения исходных признаков через компоненты и выражения компонент через признаки.3. Снизить размерность системы исходных признаков, ограничившись несколькими первыми главным компонентами, на долю которых приходится не менее 70% общей дисперсии признаков. Дать содержательную интерпретацию этих компонент, используя матрицу нагрузок исходных признаков на главные компоненты и факторную диаграмму (unrotafed factor solution). Рассчитать значения отобранных главных компонент на 52 объектах и сохранить эти значения для использования в работе 6 (п. 5).4. Провести регрессионный анализ признака Y (из работы 4) на отобранные главные компоненты. Сравнить его результаты с окончательными результатами регрессионного анализа признака У на исходные пять факторных признаков x(1), x(2), x(3), x(4), x(5) (полученными в работе 4 Курсовая работа по эконометрике).5. Записать модель факторного анализа и предъявляемые к ней требования. Считая, что число общих факторов не превышает числа главных компонент, на долю которых приходится не менее 71)% общей дисперсии исходных признаков, обратиться к программе Factor analysis и реализовать метод максимального правдоподобия (maximum likehood), воспользовавшись методом Varimax для вращения факторного пространства; проверить значимость модели факторного анализа. Рассчитать значения полученных общих факторов на 52 объектах и сохранить эти значения для использования в работе 6 (п. б).6. Сравнить факторные диаграммы до вращения (unrotafed factor solution) и после вращения (rotated solution) и предложить на основании анализа матрицы факторных нагрузок и факторной диаграммы после вращения содержательную интерпретацию факторов; сравнить полученные факторы с главными компонентами, построенными в п. 4.7. Провести регрессионный анализ признака Y на общие факторы. Сравнить его результаты с результатами регрессионного анализа признака Y на исходные пять факторных признаков x(1), x(2), x(3), x(4), x(5) (полученными в работе 4 Курсовая работа по эконометрике). Курсовая работа по эконометрике. Работа 6Кластерный анализ (выполняется с применением программ Hierarchical cluster analysis и K-Means cluster пакета SPSS).Задача. Изучается система из пяти признаков x(1), x(2), x(3), x(4), x(5) по числовым данным, собранным на n = 52 объектах. При выполнении данной задачи в курсовой работе по эконометрике требуется:1. Используя в качестве исходных данных матрицу (52 х 5) значений признаков x(1), x(2), x(3), x(4), x(5) на объектах, провести вычисления по программе Hierarchical cluster analysis, выбрав для классификации все пять признаков, и реализовать метод ближайшего соседа (nearest neighbor) с выбором евклидовой метрики расстояний (eudidean distance), предварительно стандартизовав исходные данные (standardize); построить дендрограмму (dendrogram); сохранить протокол объединения (agglomeration schedule) и матрицу расстояний (proximity matrix),2. В окне результатов иерархического кластерного анализа:а) просмотрев матрицу расстояний, выписать расстояние между первым и двадцатым объектами и привести формулу его расчета;б) выписать первые пять строк протокола объединения, объяснить их смысл и привести алгоритм пересчета матрицы расстояний между объектами на каждом, шаге объединения;в) проанализировав по дендрограмме иерархию объединения кластеров (первые пять шагов сопоставить с протоколом объединения), предложить (если это возможно) разбиение исходных 20 объектов на два кластера - класса и указать объекты, относящиеся к каждому классу.3. Выполнить пп. 1 - 2 для методов дальнего соседа (furthest neighbor) и средней связи (between-groups linkage),4. Провести вычисления по программе K-Means cluster, выбрав для классификации пять признаков x(1), x(2), x(3), x(4), x(5) (с предварительной стандартизацией) и указав в качестве количества кластеров число 2.5. Выполнить пп. 1 - 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x(5), а главные компоненты, на долю которых приходится не менее 70% общей дисперсии исходных признаков, (полученные в работе 5),6. Выполнить пп. 1 - 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x
План (содержание) работы Курсовая работа по эконометрике:
Курсовая работа по эконометрике, курсовая
Курсовая работа по эконометрике
Комментариев нет:
Отправить комментарий