THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама

Матрица парных коэффициентов корреляции

Y X1 X2 X3 X4 X5
Y
X1 0,732705
X2 0,785156 0,706287
X3 0,179211 -0,29849 0,208514
X4 0,667343 0,924333 0,70069 0,299583
X5 0,709204 0,940488 0,691809 0,326602 0,992945

В узлах матрицы находятся парные коэффициенты корреляции, характеризующие тесноту взаимосвязи между факторными признаками. Анализируя эти коэффициенты, отметим, что чем больше их абсолютная величина, тем большее влияние оказывает соответствующий факторный признак на результативный. Анализ полученной матрицы осуществляется в два этапа:

1. Если в первом столбце матрицы есть коэффициенты корреляции, для которых /r / < 0,5, то соответствующие признаки из модели исключаются. В данном случае в первом столбце матрицы коэффициентов корреляции исключается фактор или коэффициент роста уровня инфляции. Данный фактор оказывает меньшее влияние на результативный признак, нежели оставшиеся четыре признака.

2. Анализируя парные коэффициенты корреляции факторных признаков друг с другом, (r XiXj), характеризующие тесноту их взаимосвязи, необходимо оценить их независимость друг от друга, поскольку это необходимое условие для дальнейшего проведения регрессионного анализа. В виду того, что в экономике абсолютно независимых признаков нет, необходимо выделить, по возможности, максимально независимые. Факторные признаки, находящиеся в тесной корреляционной зависимости друг с другом, называются мультиколлинеарными. Включение в модель мультиколлинеарных признаков делает невозможным экономическую интерпретацию регрессионной модели, так как изменение одного фактора влечет за собой изменение факторов с ним связанных, что может привести к «поломке» модели в целом.

Критерий мультиколлениарности факторов выглядит следующим образом:

/r XiXj / > 0,8

В полученной матрице парных коэффициентов корреляции этому критерию отвечают два показателя, находящиеся на пересечении строк и . Из каждой пары этих признаков в модели необходимо оставить один, он должен оказывать большее влияние на результативный признак. В итоге из модели исключаются факторы и , т.е. коэффициент роста себестоимости реализованной продукции и коэффициент роста объёма её реализации.

Итак, в регрессионную модель вводим факторы Х1 и Х2.

Далее осуществляется регрессионный анализ (сервис, анализ данных, регрессия). Вновь составляет таблица исходных данных с факторами Х1 и Х2. Регрессия в целом используется для анализа воздействия на отдельную зависимую переменную значений независимых переменных (факторов) и позволяет корреляционную связь между признаками представить в виде некоторой функциональной зависимости называемой уравнением регрессии или корреляционно-регрессионной моделью.

В результате регрессионного анализа получаем результаты расчета многомерной регрессии. Проанализируем полученные результаты.

Все коэффициенты регрессии значимы по критерию Стьюдента. Коэффициент множественной корреляции R составил 0,925, квадрат этой величины (коэффициент детерминации) означает, что вариация результативного признака в среднем на 85,5% объясняется за счет вариации факторных признаков, включенных в модель. Коэффициент детерминированности характеризует тесноту взаимосвязи между совокупностью факторных признаков и результативным показателем. Чем ближе значение R-квадрат к 1, тем теснее взаимосвязь. В нашем случае показатель, равный 0,855, указывает на правильный подбор факторов и на наличие взаимосвязи факторов с результативным показателем.

Рассматриваемая модель адекватна, поскольку расчетное значение F-критерия Фишера существенно превышает его табличное значение (F набл =52,401; F табл =1,53).

В качестве общего результата проведенного корреляционно-регрессионного анализа выступает множественное уравнение регрессии, которое имеет вид:

Полученное уравнение регрессии отвечает цели корреляционно-регрессионного анализа и является линейной моделью зависимости балансовой прибыли предприятия от двух факторов: коэффициента роста производительности труда и коэффициента имущества производственного назначения.

На основании полученной модели можно сделать вывод о том, что при увеличении уровня производительности труда на 1% к уровню предыдущего периода величина балансовой прибыли возрастет на 0,95 п.п.; увеличение же коэффициента имущества производственного назначения на 1% приведет к росту результативного показателя на 27,9 п.п. Слелдовательно, доминирующее влияние на рост балансовой прибыли оказывает увеличение стоимости имущества производственного назначения (обновление и рост основных средств предприятия).

По множественной регрессионной модели выполняется многофакторный прогноз результативного признака. Пусть известно, что Х1 = 3,0, а Х3 = 0,7. Подставим значения факторных признаков в модель, получим Упр = 0,95*3,0 + 27,9*0,7 – 19,4 = 2,98. Таким образом, при увеличении производительности труда и модернизации основных средств на предприятии балансовая прибыль в 1 квартале 2005 г. по отношению к предыдущему периоду (IV квартал 2004 г.) возрастет на 2,98%.

Множественная регрессия не является результатом преобразования уравнения:

-
;

-
.

Линеаризация подразумевает процедуру …

- приведения уравнения множественной регрессии к парной;

+ приведения нелинейного уравнения к линейному виду;

- приведения линейного уравнения к нелинейному виду;

- приведения нелинейного уравнения относительно параметров к уравнению, линейному относительно результата.

Остатки не изменяются;

Уменьшается количество наблюдений

В стандартизованном уравнении множественной регрессии переменными являются:

Исходные переменные;

Стандартизованные параметры;

Средние значения исходных переменных;

Стандартизованные переменные.

Одним из методов присвоения числовых значений фиктивным переменным является. . .

+– ранжирование;

Выравнивание числовых значений по возрастанию;

Выравнивание числовых значений по убыванию;

Нахождение среднего значения.

В матрице парных коэффициентов корреляции отображены значения парных коэффициентов линейной корреляции между. . . .

Переменными;

Параметрами;

Параметрами и переменными;

Переменными и случайными факторами.

Метод оценки параметров моделей с гетероскедастичными остатками называется ____________ методом наименьших квадратов:

Обычным;

Косвенным;

Обобщенным;

Минимальным.

Дано уравнение регрессии . Определите спецификацию модели.

Полиномиальное уравнение парной регрессии;

Линейное уравнение простой регрессии;

Полиномиальное уравнение множественной регрессии;

Линейное уравнение множественной регрессии.

В стандартизованном уравнении свободный член ….

Равен 1;

Равен коэффициенту множественной детерминации;

Равен коэффициенту множественной корреляции;

Отсутствует.

В качестве фиктивных переменных в модель множественной регрессии включаются факторы,

Имеющие вероятностные значения;

Имеющие количественные значения;

Не имеющие качественных значений;

Не имеющие количественных значений.

Факторы эконометрической модели являются коллинеарными, если коэффициент …

Корреляции между ними по модулю больше 0,7;

Детерминации между ними по модулю больше 0,7;

Детерминации между ними по модулю меньше 0,7;

Обобщенный метод наименьших квадратов отличается от обычного МНК тем, что при применении ОМНК …

Преобразуются исходные уровни переменных;

Остатки не изменяются;

Остатки приравниваются к нулю;

Уменьшается количество наблюдений.

Объем выборки определяется …

Числовыми значением переменных, отбираемых в выборку;

Объемом генеральной совокупности;

Числом параметров при независимых переменных;

Числом результативных переменных.

11. Множественная регрессия не является результатом преобразования уравнения:

+-
;

-
;

-
.

Исходные значения фиктивных переменных предполагают значения …

Качественные;

Количественно измеримые;

Одинаковые;

Значения.

Обобщенный метод наименьших квадратов подразумевает …

Преобразование переменных;

Переход от множественной регрессии к парной;

Линеаризацию уравнения регрессии;

Двухэтапное применение метода наименьших квадратов.

Линейное уравнение множественной регрессии имеет вид . Определите какой из факторовили:

+- , так как 3,7>2,5;

Оказывают одинаковое влияние;

- , так как 2,5>-3,7;

По этому уравнению нельзя ответить на поставленный вопрос, так как коэффициенты регрессии несравнимы между собой.

Включение фактора в модель целесообразно, если коэффициент регрессии при этом факторе является …

Нулевым;

Незначимым;

Существенным;

Несущественным.

Что преобразуется при применении обобщенного метода наименьших квадратов?

Стандартизованные коэффициенты регрессии;

Дисперсия результативного признака;

Исходные уровни переменных;

Дисперсия факторного признака.

Проводится исследование зависимости выработки работника предприятия от ряда факторов. Примером фиктивной переменной в данной модели будет являться ______ работника.

Возраст;

Уровень образования;

Заработная плата.

Переход от точечного оценивания к интервальному возможен, если оценки являются:

Эффективными и несостоятельными;

Неэффективными и состоятельными;

Эффективными и несмещенными;

Состоятельными и смещенными.

Матрица парных коэффициентов корреляции строится для выявления коллинеарных и мультиколлинеарных …

Параметров;

Случайных факторов;

Существенных факторов;

Результатов.

На основании преобразования переменных при помощи обобщенного метода наименьших квадратов получаем новое уравнение регрессии, которое представляет собой:

Взвешенную регрессию, в которой переменные взяты с весами
;

;

Нелинейную регрессию, в которой переменные взяты с весами
;

Взвешенную регрессию, в которой переменные взяты с весами .

Если расчетное значение критерия Фишера меньше табличного значения, то гипотеза о статистической незначимости уравнения …

Отвергается;

Незначима;

Принимается;

Несущественна.

Если факторы входят в модель как произведение, то модель называется:

Суммарной;

Производной;

Аддитивной;

Мультипликативной.

Уравнение регрессии, которое связывает результирующий признак с одним из факторов при зафиксированных на среднем уровне значении других переменных, называется:

Множественным;

Существенным;

Частным;

Несущественным.

Относительно количества факторов, включенных в уравнение регрессии, различают …

Линейную и нелинейную регрессии;

Непосредственную и косвенную регрессии;

Простую и множественную регрессию;

Множественную и многофакторную регрессию.

Требованием к уравнениям регрессии, параметры которых можно найти при помощи МНК является:

Равенство нулю значений факторного признака4

Нелинейность параметров;

Равенство нулю средних значений результативной переменной;

Линейность параметров.

Метод наименьших квадратов не применим для …

Линейных уравнений парной регрессии;

Полиномиальных уравнений множественной регрессии;

Уравнений, нелинейных по оцениваемым параметрам;

Линейных уравнений множественной регрессии.

При включении фиктивных переменных в модель им присваиваются …

Нулевые значения;

Числовые метки;

Одинаковые значения;

Качественные метки.

Если между экономическими показателями существует нелинейная связь, то …

Нецелесообразно использовать спецификацию нелинейного уравнения регрессии;

Целесообразно использовать спецификацию нелинейного уравнения регрессии;

Целесообразно использовать спецификацию линейного уравнение парной регрессии;

Необходимо включить в модель другие факторы и использовать линейное уравнение множественной регрессии.

Результатом линеаризации полиномиальных уравнений является …

Нелинейные уравнения парной регрессии;

Линейные уравнения парной регрессии;

Нелинейные уравнения множественной регрессии;

Линейные уравнения множественной регрессии.

В стандартизованном уравнении множественной регрессии
0,3;
-2,1. Определите, какой из факторовилиоказывает более сильное влияние на:

+- , так как 2,1>0,3;

По этому уравнению нельзя ответить на поставленный вопрос, так как неизвестны значения «чистых» коэффициентов регрессии;

- , так как 0,3>-2,1;

По этому уравнению нельзя ответить на поставленный вопрос, так как стандартизированные коэффициенты несравнимы между собой.

Факторные переменные уравнения множественной регрессии, преобразованные из качественных в количественные называются …

Аномальными;

Множественными;

Парными;

Фиктивными.

Оценки параметров линейного уравнения множественной регрессии можно найти при помощи метода:

Средних квадратов;

Наибольших квадратов;

Нормальных квадратов;

Наименьших квадратов.

Основным требованием к факторам, включаемым в модель множественной регрессии, является:

Отсутствие взаимосвязи между результатом и фактором;

Отсутствие взаимосвязи между факторами;

Отсутствие линейной взаимосвязи между факторами;

Наличие тесной взаимосвязи между факторами.

Фиктивные переменные включаются в уравнение множественной регрессии для учета действия на результат признаков …

Качественного характера;

Количественного характера;

Несущественного характера;

Случайного характера.

Из пары коллинеарных факторов в эконометрическую модель включается тот фактор,

Который при достаточно тесной связи с результатом имеет наибольшую связь с другими факторами;

Который при отсутствии связи с результатом имеет максимальную связь с другими факторами;

Который при отсутствии связи с результатом имеет наименьшую связь с другими факторами;

Который при достаточно тесной связи с результатом имеет меньшую связь с другими факторами.

Гетероскедастичность подразумевает …

Постоянство дисперсии остатков независимо от значения фактора;

Зависимость математического ожидания остатков от значения фактора;

Зависимость дисперсии остатков от значения фактора;

Независимость математического ожидания остатков от значения фактора.

Величина остаточной дисперсии при включении существенного фактора в модель:

Не изменится;

Будет увеличиваться;

Будет равно нулю;

Будет уменьшаться.

Если спецификация модели отображает нелинейную форму зависимости между экономическими показателями, то нелинейно уравнение …

Регрессии;

Детерминации;

Корреляции;

Аппроксимации.

Исследуется зависимость, которая характеризуется линейным уравнением множественной регрессии. Для уравнения рассчитано значение тесноты связи результативной переменной с набором факторов. В качестве этого показателя был использован множественный коэффициент

Корреляции;

Эластичности;

Регрессии;

Детерминации.

Строится модель зависимости спроса от ряда факторов. Фиктивной переменной в данном уравнении множественной регрессии не является _________потребителя.

Семейное положение;

Уровень образования;

Для существенного параметра расчетное значение критерия Стьюдента …

Больше табличного значения критерия;

Равно нулю;

Не больше табличного значения критерия Стьюдента;

Меньше табличного значения критерия.

Систему МНК, построенную для оценки параметров линейного уравнения множественной регрессии можно решить …

Методом скользящего среднего;

Методом определителей;

Методом первых разностей;

Симплекс-методом.

Показатель, характеризующий на сколько сигм изменится в среднем результат при изменении соответствующего фактора на одну сигму, при неизменном уровне других факторов, называется ____________коэффициентом регрессии

Стандартизованным;

Нормализованным;

Выровненным;

Центрированным.

Мультиколлинеарность факторов эконометрической модели подразумевает …

Наличие нелинейной зависимости между двумя факторами;

Наличие линейной зависимости между более чем двумя факторами;

Отсутствие зависимости между факторами;

Наличие линейной зависимости между двумя факторами.

Обобщенный метод наименьших квадратов не используется для моделей с _______ остатками.

Автокоррелированными и гетероскедастичными;

Гомоскедастичными;

Гетероскедастичными;

Автокоррелированными.

Методом присвоения числовых значений фиктивным переменным не является:

Ранжирование;

Присвоение цифровых меток;

Нахождения среднего значения;

Присвоение количественных значений.

Нормально распределенных остатков;

Гомоскедастичных остатков;

Автокорреляции остатков;

Автокорреляции результативного признака.

Отбор факторов в модель множественной регрессии при помощи метода включения основан на сравнении значений …

Общей дисперсии до и после включения фактора в модель;

Остаточной дисперсии до и после включения случайных факторов в модель;

Дисперсии до и после включения результата в модель;

Остаточной дисперсии до и после включения фактора модель.

Обобщенный метод наименьших квадратов используется для корректировки …

Параметров нелинейного уравнения регрессии;

Точности определения коэффициента множественной корреляции;

Автокорреляции между независимыми переменными;

Гетероскедастичности остатков в уравнении регрессии.

После применения обобщенного метода наименьших квадратов удается избежать_________ остатков

Гетероскедастичности;

Нормального распределения;

Равенства нулю суммы;

Случайного характера.

Фиктивные переменные включаются в уравнения ____________регрессии

Случайной;

Парной;

Косвенной;

Множественной.

Взаимодействие факторов эконометрической модели означает, что …

Влияние факторов на результирующий признак зависит от значений другого неколлинеарного им фактора;

Влияние факторов на результирующий признак усиливается, начиная с определенного уровня значений факторов;

Факторы дублируют влияние друг друга на результат;

Влияние одного из факторов на результирующий признак не зависит от значений другого фактора.

Тема Множественная регрессия (Задачи)

Уравнение регрессии, построенное по 15 наблюдениям, имеет вид:

Пропущенные значения, а также доверительный интервал для

с вероятностью 0,99 равны:

Уравнение регрессии, построенное по 20 наблюдениям, имеет вид:

с вероятностью 0,9 равны:

Уравнение регрессии, построенное по 16 наблюдениям, имеет вид:

Пропущенные значения, а также доверительный интервал для с вероятностью 0,99 равны:

Уравнение регрессии в стандартизированном виде имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

Стандартизованное уравнение регрессии имеет вид:

Частные коэффициенты эластичности равны:

По 18 наблюдениям получены следующие данные:

;
;
;
;

равны:

По 17 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 22 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 25 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 24 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 28 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

По 26 наблюдениям получены следующие данные:

;
;
;
;

Значения скорректированного коэффициента детерминации, частных коэффициентов эластичности и параметра равны:

В уравнении регрессии:

Восстановить пропущенные характеристики; построить доверительный интервал для с вероятностью 0,95, еслиn=12

Задание 2

1. Построить матрицу парных коэффициентов корреляции. Проверить наличие мультиколлинеарности. Обосновать отбор факторов в модель.

2. Построить уравнение множественной регрессии в линейной форме с выбранными факторами.

3. Оценить статистическую значимость уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента.

4. Построить уравнение регрессии со статистически значимыми факторами. Оценить качество уравнения регрессии с помощью коэффициента детерминации R 2 . Оценить точность построенной модели.

5. Оценить прогноз объема выпуска продукции, если прогнозные значения факторов составляют 75% от их максимальных значений.

Условия задачи (Вариант 21)

По данным, представленным в таблице 1 (n =17), изучается зависимость объема выпуска продукции Y (млн. руб.) от следующих факторов (переменных):

X 1 – численность промышленно-производственного персонала, чел.

X 2 – среднегодовая стоимость основных фондов, млн. руб.

X 3 – износ основных фондов, %

X 4 – электровооруженность, кВт×ч.

X 5 – техническая вооруженность одного рабочего, млн. руб.

X 6 – выработка товарной продукции на одного работающего, руб.

Таблица 1. Данные выпуска продукции

Y X 1 X 2 X 3 X 4 X 5 X 6
39,5 4,9 3,2
46,4 60,5 20,4
43,7 24,9 9,5
35,7 50,4 34,7
41,8 5,1 17,9
49,8 35,9 12,1
44,1 48,1 18,9
48,1 69,5 12,2
47,6 31,9 8,1
58,6 139,4 29,7
70,4 16,9 5,3
37,5 17,8 5,6
62,0 27,6 12,3
34,4 13,9 3,2
35,4 37,3 19,0
40,8 55,3 19,3
48,1 35,1 12,4


Построить матрицу парных коэффициентов корреляции. Проверить наличие мультиколлинеарности. Обосновать отбор факторов в модель

В таблице 2 представлена матрица коэффициентов парной корреляции для всех переменных, участвующих в рассмотрении. Матрица получена с помощью инструмента Корреляция из пакета Анализ данных в Excel.

Таблица 2. Матрица коэффициентов парной корреляции

Y X1 X2 X3 X4 X5 X6
Y
X1 0,995634
X2 0,996949 0,994947
X3 -0,25446 -0,27074 -0,26264
X4 0,12291 0,07251 0,107572 0,248622
X5 0,222946 0,166919 0,219914 -0,07573 0,671386
X6 0,067685 -0,00273 0,041955 -0,28755 0,366382 0,600899

Визуальный анализ матрицы позволяет установить:

1) У имеет довольно высокие парные корреляции с переменными Х1, Х2 (>0,5) и низкие с переменными Х3,Х4,Х5,Х6 (<0,5);

2) Переменные анализа Х1, Х2 демонстрируют довольно высокие парные корреляции, что обуславливает необходимость проверки факторов на наличие между ними мультиколлинеарности. Тем более, что одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных.

Для выявления мультиколлинеарности факторов выполним тест Фаррара-Глоубера по факторам Х1,Х2,Х3,Х4,Х5,Х6 .

Проверка теста Фаррара-Глоубера на мультиколлинеарность факторов включает несколько этапов.

1) Проверка наличия мультиколлинеарности всего массива переменных .

Одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных. Для выявления мультиколлинеарности между факторами вычисляется матрица межфакторных корреляций R с помощью Пакета анализа данных (таблица 3).

Таблица 3.Матрица межфакторных корреляций R

X1 X2 X3 X4 X5 X6
X1 0,994947 -0,27074 0,07251 0,166919 -0,00273
X2 0,994947 -0,26264 0,107572 0,219914 0,041955
X3 -0,27074 -0,26264 0,248622 -0,07573 -0,28755
X4 0,07251 0,107572 0,248622 0,671386 0,366382
X5 0,166919 0,219914 -0,07573 0,671386 0,600899
X6 -0,00273 0,041955 -0,28755 0,366382 0,600899

Между факторами Х1 и Х2, Х5 и Х4, Х6 и Х5 наблюдается сильная зависимость (>0,5).

Определитель det (R) = 0,001488 вычисляется с помощью функции МОПРЕД. Определитель матрицы R стремится к нулю, что позволяет сделать предположение об общей мультиколлинеарности факторов.

2) Проверка наличия мультиколлинеарности каждой переменной с другими переменными:

· Вычислим обратную матрицу R -1 с помощью функции Excel МОБР (таблица 4):

Таблица 4. Обратная матрица R -1

X1 X2 X3 X4 X5 X6
X1 150,1209 -149,95 3,415228 -1,70527 6,775768 4,236465
X2 -149,95 150,9583 -3,00988 1,591549 -7,10952 -3,91954
X3 3,415228 -3,00988 1,541199 -0,76909 0,325241 0,665121
X4 -1,70527 1,591549 -0,76909 2,218969 -1,4854 -0,213
X5 6,775768 -7,10952 0,325241 -1,4854 2,943718 -0,81434
X6 4,236465 -3,91954 0,665121 -0,213 -0,81434 1,934647

· Вычисление F-критериев , где – диагональные элементы матрицы , n=17, k = 6 (таблица 5).

Таблица 5. Значения F-критериев

F1 (Х1) F2 (Х2) F3 (Х3) F4 (Х4) F5 (Х5) F6 (Х6)
89,29396 89,79536 0,324071 0,729921 1,163903 0,559669

· Фактические значения F-критериев сравниваются с табличным значением F табл = 3,21 (FРАСПОБР(0,05;6;10)) при n1= 6 и n2 = n - k – 1=17-6-1=10 степенях свободы и уровне значимости α=0,05, где k – количество факторов.

· Значения F-критериев для факторов Х1 и Х2 больше табличного, что свидетельствует о наличии мультиколлинеарности между данными факторами. Меньше всего влияет на общую мультиколлинеарность факторов фактор Х3.

3) Проверка наличия мультиколлинеарности каждой пары переменных

· Вычислим частные коэффициенты корреляции по формуле , где – элементы матрицы (таблица 6)

Таблица 6. Матрица коэффициентов частных корреляций

X1 X2 X3 X4 X5 X6
X1
X2 0,996086
X3 -0,22453 0,197329
X4 0,093432 -0,08696 0,415882
X5 -0,32232 0,337259 -0,1527 0,581191
X6 -0,24859 0,229354 -0,38519 0,102801 0,341239

· Вычисление t -критериев по формуле (таблица 7)

n - число данных = 17

K - число факторов = 6

Таблица 7.t-критерии для коэффициентов частной корреляции

X1 X2 X3 X4 X5 X6
X1
X2 35,6355
X3 -0,72862 0,636526
X4 0,296756 -0,27604 1,446126
X5 -1,07674 1,13288 -0,4886 2,258495
X6 -0,81158 0,745143 -1,31991 0,326817 1,147999

t табл = СТЬЮДРАСПОБР(0,05;10) = 2,23

Фактические значения t-критериев сравниваются с табличным значением при степенях свободы n-k-1 = 17-6-1=10 и уровне значимости α=0,05;

t21 > tтабл

t54 > tтабл

Из таблиц 6 и 7 видно, что две пары факторов X1 и Х2, Х4 и Х5 имеют высокую статистически значимую частную корреляцию, то есть являются мультиколлинеарными. Для того чтобы избавиться от мультиколлинеарности, можно исключить одну из переменных коллинеарной пары. В паре Х1 и Х2 оставляем Х2, в паре Х4 и Х5 оставляем Х5.

Таким образом, в результате проверки теста Фаррара-Глоубера остаются факторы: Х2, Х3, Х5, Х6.

Завершая процедуры корреляционного анализа, целесообразно посмотреть частные корреляции выбранных факторов с результатом Y.

Построим матрицу парных коэффициентов корреляции, исходя из данных таблицы 8.

Таблица 8. Данные выпуска продукции с отобранными факторами Х2, Х3, Х5, Х6.

№ наблю-дения Y X 2 X 3 X 5 X 6
39,5 3,2
46,4 20,4
43,7 9,5
35,7 34,7
41,8 17,9
49,8 12,1
44,1 18,9
48,1 12,2
47,6 8,1
58,6 29,7
70,4 5,3
37,5 5,6
12,3
34,4 3,2
35,4
40,8 19,3
48,1 12,4

В последнем столбце таблицы 9 представлены значения t-критерия для столбца У.

Таблица 9.Матрица коэффициентов частной корреляции с результатом Y

Y X2 X3 X5 X6 t критерий (t табл (0,05;11)= 2,200985
Y 0,996949 -0,25446 0,222946 0,067685
X2 0,996949 -0,26264 0,219914 0,041955 44,31676
X3 -0,25446 -0,26264 -0,07573 -0,28755 0,916144
X5 0,222946 0,219914 -0,07573 0,600899 -0,88721
X6 0,067685 0,041955 -0,28755 0,600899 1,645749

Из таблицы 9 видно, что переменная Y имеет высокую и одновременно статистически значимую частную корреляцию с фактором Х2.


Y X 1 X 2 X 3 X 4 X 5 X 6
Y
X 1 0,519
X 2 -0,273 0,030
X 3 0,610 0,813 -0,116
X 4 -0,572 -0,013 -0,022 -0,091
X 5 0,297 0,043 -0,461 0,120 -0,359
X 6 0,118 -0,366 -0,061 -0,329 -0,100 -0,290

Анализ межфакторных (между «иксами»!) коэффициентов корреляции показывает, что значение 0,8 превышает по абсолютной величине только коэффициент корреляции между парой факторов Х 1 –Х 3 (выделен жирным шрифтом). Факторы Х 1 –Х 3 , таким образом, признаются коллинеарными.

2. Как было показано в пункте 1, факторы Х 1 –Х 3 являются коллинеарными, а это означает, что они фактически дублируют друг друга, и их одновременное включение в модель приведет к неправильной интерпретации соответствующих коэффициентов регрессии. Видно, что фактор Х 3 имеет больший по модулю коэффициент корреляции с результатом Y , чем фактор Х 1: r y , x 1 =0,519; r y , x 3 =0,610; (см. табл. 1 ). Это свидетельствует о более сильном влиянии фактора Х 3 на изменение Y . Фактор Х 1 , таким образом, исключается из рассмотрения.

Для построения уравнения регрессии значения используемых переменных (Y , X 2 , X 3 , X 4 , X 5 , X 6) скопируем на чистый рабочий лист (прил. 3) . Уравнение регрессии строим с помощью надстройки «Анализ данных… Регрессия » (меню «Сервис» ® «Анализ данных… » ® «Регрессия »). Панель регрессионного анализа с заполненными полями изображена на рис. 2 .

Результаты регрессионного анализа приведены в прил. 4 и перенесены в табл. 2 . Уравнение регрессии имеет вид (см. «Коэффициенты» втабл. 2 ):

Уравнение регрессии признается статистически значимым, так как вероятность его случайного формирования в том виде, в котором оно получено, составляет 8,80×10 -6 (см. «Значимость F» втабл. 2 ), что существенно ниже принятого уровня значимости a=0,05.

Х 3 , Х 4 , Х 6 ниже принятого уровня значимости a=0,05 (см. «P-Значение» втабл. 2 ), что свидетельствует о статистической значимости коэффициентов и существенном влиянии этих факторов на изменение годовой прибыли Y .

Вероятность случайного формирования коэффициентов при факторах Х 2 и Х 5 превышает принятый уровень значимости a=0,05 (см. «P-Значение» втабл. 2 ), и эти коэффициенты не признаются статистически значимыми.

рис. 2. Панель регрессионного анализа модели Y (X 2 , X 3 , X 4 , X 5 , X 6)

Таблица 2

Y (X 2 , X 3 , X 4 , X 5 , X 6)

Регрессионная статистика
Множественный R 0,868
R-квадрат 0,753
Нормированный R-квадрат 0,694
Стандартная ошибка 242,3
Наблюдения
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 3749838,2 749967,6 12,78 8,80E-06
Остаток 1232466,8 58688,9
Итого 4982305,0
Уравнение регрессии
Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 487,5 641,4 0,760 0,456
X2 -0,0456 0,0373 -1,224 0,235
X3 0,1043 0,0194 5,375 0,00002
X4 -0,0965 0,0263 -3,674 0,001
X5 2,528 6,323 0,400 0,693
X6 248,2 113,0 2,197 0,039

3. По результатам проверки статистической значимости коэффициентов уравнения регрессии, проведенной в предыдущем пункте, строим новую регрессионную модель, содержащую только информативные факторы, к которым относятся:

· факторы, коэффициенты при которых статистически значимы;

· факторы, у коэффициентов которых t ‑статистика превышает по модулю единицу (другими словами, абсолютная величина коэффициента больше его стандартной ошибки).

К первой группе относятся факторы Х 3 , Х 4 , Х 6 , ко второй - фактор X 2 . Фактор X 5 исключается из рассмотрения как неинформативный, и окончательно регрессионная модель будет содержать факторы X 2 , X 3 , X 4 , X 6 .

Для построения уравнения регрессии скопируем на чистый рабочий лист значения используемых переменных (прил. 5) и проведем регрессионный анализ (рис. 3 ). Его результаты приведены в прил. 6 и перенесены в табл. 3 . Уравнение регрессии имеет вид:

(см. «Коэффициенты» втабл. 3 ).

рис. 3. Панель регрессионного анализа модели Y (X 2 , X 3 , X 4 , X 6)

Таблица 3

Результаты регрессионного анализа модели Y (X 2 , X 3 , X 4 , X 6)

Регрессионная статистика
Множественный R 0,866
R-квадрат 0,751
Нормированный R-квадрат 0,705
Стандартная ошибка 237,6
Наблюдения
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 3740456,2 935114,1 16,57 2,14E-06
Остаток 1241848,7 56447,7
Итого 4982305,0
Уравнение регрессии
Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 712,2 303,0 2,351 0,028
X2 -0,0541 0,0300 -1,806 0,085
X3 0,1032 0,0188 5,476 0,00002
X4 -0,1017 0,0223 -4,560 0,00015
X6 227,5 98,5 2,310 0,031

Уравнение регрессии статистически значимо: вероятность его случайного формирования ниже допустимого уровня значимости a=0,05 (см. «Значимость F» втабл. 3 ).

Статистически значимыми признаются и коэффициенты при факторах Х 3 , Х 4 , Х 6: вероятность их случайного формирования ниже допустимого уровня значимости a=0,05 (см. «P-Значение» втабл. 3 ). Это свидетельствует о существенном влиянии годового размера страховых сборов X 3 , годового размера страховых выплат X 4 и формы собственности X 6 на изменение годовой прибыли Y .

Коэффициент при факторе Х 2 (годовой размер страховых резервов) не является статистически значимым. Однако этот фактор все же можно считать информативным, так как t ‑статистика его коэффициента превышает по модулю единицу, хотя к дальнейшим выводам относительно фактора Х 2 следует относиться с некоторой долей осторожности.

4. Оценим качество и точность последнего уравнения регрессии, используя некоторые статистические характеристики, полученные в ходе регрессионного анализа (см. «Регрессионную статистику » в табл. 3 ):

· множественный коэффициент детерминации

показывает, что регрессионная модель объясняет 75,1 % вариации годовой прибыли Y , причем эта вариация обусловлена изменением включенных в модель регрессии факторов X 2 , X 3 , X 4 и X 6 ;

· стандартная ошибка регрессии

тыс. руб.

показывает, что предсказанные уравнением регрессии значения годовой прибыли Y отличаются от фактических значений в среднем на 237,6 тыс. руб.

Средняя относительная ошибка аппроксимации определяется по приближенной формуле:

где тыс. руб. - среднее значение годовой прибыли (определено с помощью встроенной функции «СРЗНАЧ »; прил. 1 ).

Е отн показывает, что предсказанные уравнением регрессии значения годовой прибыли Y отличаются от фактических значений в среднем на 26,7 %. Модель имеет неудовлетворительную точность (при - точность модели высокая, при - хорошая, при - удовлетворительная, при - неудовлетворительная).

5. Для экономической интерпретации коэффициентов уравнения регрессии сведем в таблицу средние значения и стандартные отклонения переменных в исходных данных (табл. 4 ) . Средние значения были определены с помощью встроенной функции «СРЗНАЧ », стандартные отклонения - с помощью встроенной функции «СТАНДОТКЛОН » (см. прил. 1 ).

Коллинеарными являются факторы …

И коллинеарны.

4. В модели множественной регрессии определитель матрицы парных коэффициентов корреляции между факторами , и близок к нулю. Это означает, что факторы , и … мультиколлинеарность факторов.

5. Для эконометрической модели линейного уравнения множественной регрессии вида построена матрица парных коэффициентов линейной корреляции (y – зависимая переменная; х (1) , х (2) , х (3) , x (4) – независимые переменные):


Коллинеарными (тесно связанными) независимыми (объясняющими) переменными не являются x (2) и x (3)

1. Дана таблица исходных данных для построения эконометрической регрессионной модели:

Фиктивными переменными не являются

стаж работы

производительность труда

2. При исследовании зависимости потребления мяса от уровня дохода и пола потребителя можно рекомендовать …

использовать фиктивную переменную – пол потребителя

разделить совокупность на две: для потребителей женского пола и для потребителей мужского пола

3. Изучается зависимость цены квартиры (у ) от ее жилой площади (х ) и типа дома. В модель включены фиктивные переменные, отражающие рассматриваемые типы домов: монолитный, панельный, кирпичный. Получено уравнение регрессии: ,
где ,
Частными уравнениями регрессии для кирпичного и монолитного являются …

для типа дома кирпичный

для типа дома монолитный

4. При анализе промышленных предприятий в трех регионах (Республика Марий Эл, Республика Чувашия, Республика Татарстан) были построены три частных уравнения регрессии:

для Республики Марий Эл;

для Республики Чувашия;

для Республики Татарстан.

Укажите вид фиктивных переменных и уравнение с фиктивными переменными, обобщающее три частных уравнения регрессии.

5. В эконометрике фиктивной переменной принято считать …

переменную, принимающую значения 0 и 1

описывающую количественным образом качественный признак

1. Для регрессионной модели зависимости среднедушевого денежного дохода населения (руб., у ) от объема валового регионального продукта (тыс. р., х 1 ) и уровня безработицы в субъекте (%, х 2 ) получено уравнение . Величина коэффициента регрессии при переменной х 2 свидетельствует о том, что при изменении уровня безработицы на 1% среднедушевой денежный доход ______ рубля при неизменной величине валового регионального продукта.

изменится на (-1,67)

2. В уравнении линейной множественной регрессии: , где – стоимость основных фондов (тыс. руб.); – численность занятых (тыс. чел.); y – объем промышленного производства (тыс. руб.) параметр при переменной х 1 , равный 10,8, означает, что при увеличении объема основных фондов на _____ объем промышленного производства _____ при постоянной численности занятых.


на 1 тыс. руб. … увеличится на 10,8 тыс. руб.

3. Известно, что доля остаточной дисперсии зависимой переменной в ее общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет … 0,8

4. Построена эконометрическая модель для зависимости прибыли от реализации единицы продукции (руб., у ) от величины оборотных средств предприятия (тыс. р., х 1 ): . Следовательно, средний размер прибыли от реализации, не зависящий от объема оборотных средств предприятия, составляет _____ рубля. 10,75

5. F-статистика рассчитывается как отношение ______ дисперсии к ________ дисперсии, рассчитанных на одну степень свободы. факторной … остаточной

1. Для эконометрической модели уравнения регрессии ошибка модели определяется как ______ между фактическим значением зависимой переменной и ее расчетным значением. Разность

2. Величина называется … случайной составляющей

3. В эконометрической модели уравнения регрессии величина отклонения фактического значения зависимой переменной от ее расчетного значения характеризует … ошибку модели

4. Известно, что доля объясненной дисперсии в общей дисперсии равна 0,2. Тогда значение коэффициента детерминации составляет … 0,2

5. При методе наименьших квадратов параметры уравнения парной линейной регрессии определяются из условия ______ остатков . минимизации суммы квадратов

1. Для обнаружения автокорреляции в остатках используется …

статистика Дарбина – Уотсона

2. Известно, что коэффициент автокорреляции остатков первого порядка равен –0,3. Также даны критические значения статистики Дарбина – Уотсона для заданного количества параметров при неизвестном и количестве наблюдений , . По данным характеристикам можно сделать вывод о том, что …автокорреляция остатков отсутствует



THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама