Домой Россельхозбанк Подбор формул по графику. Линия тренда Подбор формул со многими неизвестными Расчет стоимости недвижимости Оценка эффективности рекламы Подбор формул по графику

Подбор формул по графику. Линия тренда Подбор формул со многими неизвестными Расчет стоимости недвижимости Оценка эффективности рекламы Подбор формул по графику

Если изучаемый процесс приводит к замедлению роста ка­кого-то показателя, но при этом рост не прекращается, не стремится к какому-либо ограниченному пределу, то гипербо­лическая форма тренда уже не подходит. Тем более не подходит парабола с отрицательным ускорением, по которой замедляю­щийся рост перейдет со временем в снижение уровней. В указан­ном случае тенденция изменения лучше всего отображается логарифмической формой тренда: = a + b ln .

Логарифмы возрастают значительно медленнее, чем сами числа (номера периодов ), но рост логарифмов неограничен. Подбирая начало отсчета периодов (моментов) времени, мож­но найти такую скорость снижения абсолютных изменений, ко­торая наилучшим образом отвечает фактическому временному ряду.

Примером тенденций, соответствующих логарифмическому тренду, может служить динамика рекордных достижений в спорте.

Основные свойства логарифмического тренда:

1. Если b>0, то уровни возрастают, но с замедлением, а если b<0, то уровни тренда уменьшаются, тоже с замедлением.

2. Абсолютные изменения уровней по модулю всегда умень­шаются со временем.

3. Ускорения абсолютных изменений имеют знак, противо­положный самим абсолютным изменениям, а по модулю посте­пенно уменьшаются.

4. Темпы изменения (цепные) постепенно приближаются к 100% при .

Можно сделать общий вывод о том, что логарифмический тренд отражает, так же как и гиперболический тренд, посте­пенно затухающий процесс изменений. Различие состоит в том, что затухание по гиперболе происходит быстро при приближе­нии к конечному пределу, а при логарифмическом тренде зату­хающий процесс продолжается без ограничения гораздо медленнее

Адаптивные методы

Опр . Адаптивными методами прогнозирования (или моделями экспоненциального сглаживания) называется методы, позволяющие строить самокорректирующиеся ЭММ, которые учитывают результат реализации прогноза, сделанного на предыдущем шаге, и строят прогноз с учетом полученных результатов.

Инструментом прогноза в адаптивных методах прогнозирования служат математические модели, изначальная оценка параметров, которых осуществляется обычно по некоторой выборке исходного ряда, называемого обучающей последовательностью.



Алгоритм построения модели адаптивного прогнозирования укладывается в следующую схему:

Для начала делается оценка начальных условий (так называемые нулевые значения адаптируемых параметров), затем делается прогноз на один шаг вперед, полученные прогнозные значения сравниваются с фактическими значениями. Если ошибка прогноза превышает заданной наперед определенной погрешности, то производят модификацию модели, и с учетом этого строят новый прогноз, далее на второй шаг, и опять сравнивают полученный прогноз с фактической реализацией процесса. Процесс повторяют до тех пор, пока разница, между прогнозным и фактическим значениями, не станет минимальной. Таким образом, будут получены параметры адаптируемой модели, и с учетом их значений строят ретроспективный прогноз.

37 . Модель Брауна.

Самой простой моделью адаптивного прогнозирования является модель Брауна, которая выглядит следующим образом:

х с волной(?)=а0т+ а1т* т (1).где - прогноз, выполненный на? шагов вперед на t-м шаге адаптации, - адаптируемые параметры модели, ? – период упреждения. Параметры рассчитываются по формулам:

система:а0т=2St (1) - St (2), f1t=1 -бетта/бетта *(St(1)- St(2)), (2) где - экспоненциальные средние соответственно 1-го и 2-го порядков; ? – параметр сглаживания (адаптации). Иногда параметр сглаживания обозначают как?=1-? Экспоненциальная средняя 1- го порядка представляет собой сумму взвешенных значений переменной за весь предшествующий период адаптации и определяется формулой:St(1)=(1-бетта)*хе + бетта*St-1(1),: (3)

где? – параметр сглаживания, или так называемый весовой коэффициент, - фактическое значение обучающего множества, - экспоненциальная средняя на предшествующем шаге.

Экспоненциальную среднюю можно выразить через предшествующую экспоненциальную среднюю: St-1(1)=(1-бетта)*хе-1 + бетта*St-2(1), (4) подставив (4) в (2) получим:St(1)=(1-бетта)*хе+бетта*(1-бетта)*хt-1+бетта в кв* St-2(1),(5)Аналогично можно выразить через предшествующую экспоненциальную среднюю и подставить в уравнение (3) и, и, и т.д. Отсюда имеем St-2 (1)= (1-бетта)*сумма от 0 до 1 БЕТТА (j)*хt-j+бетта (t)*S0(1).(6) Таким образом, применив такую процедуру экспоненциального сглаживания к исходному ряду, получим сглаженный ряд первого порядка. Повторное применение процедуры экспоненциального сглаживания уже к сглаженному ряду первого порядка, называется процедурой экспоненциального сглаживания второго порядка (к применяем формулу (3)):St(2)=(1- бетта)*St(1)+ бетта*St-1 (2),(7) Начальные значения экспоненциальных средних будут определяться по формулам:система:S0(1)=a00- (бетта/1- бетта) *а10; S0 (2)=a00-(2*бетта/(1-бетта))*а10,(8),Система (8) получена решением системы (2) относительно при t=0.

Начальные значения параметров (необходимы для решения системы (8)) рассчитываются как коэффициенты регрессии хт=а00+а10*т.Отметим, что значение параметра адаптации?=1-? лежит в интервале (1; 0). Выбор значения? зависит от того, каким значениям исходного ряда (начальным или конечным) придается больший вес. Если требуется придать вес более поздним значения ряда (увеличить степень реагирования модели на последние изменения), то берут значения? больше 0,5. Если же хотят получить более сглаженную картину тенденции развития ряда, то есть стремятся избежать краткосрочных изменений и повысить степень устойчивости модели, то значения? берут меньше 0,5, и таким образом придают вес ранним наблюдениям ряда.

Будем рассматривать два способа определения параметра адаптации?:

1) метод Брауна алфа=2/m+1, где m –число наблюдений в ряду.

2) метод выбора?, исходя из минимума средней квадратической ошибки между расчетным и фактическим значениями.

Иногда адаптивную модель Брауна называют моделью линейного роста Брауна.

Модель Хольта.

Модель Хольта, содержащая два параметра адаптации, выглядит следующим образом: х с волной е(р)=ае+бе*р (3.1.),где - прогноз, выполненный на? шагов вперед после t шагов адаптации, - корректируемые параметры модели на каждом шаге t, ? – период упреждения прогноза. Адаптация параметров модели происходят по следующим формулам:система:ае=альфа1*х1+ (1- альфа)*(ае-1+бе-1); бт=альфа2*(фе-фе-1)+(1-фльфа2)*бт-1,(3.2) где? – параметры адаптации.

  1. Модель Хольта-Уинтерса.

Модель Хольта-Уинтерса имеет другое название адаптивной сезонной модели с линейным трендом имеет три параметра адаптации. Различают аддитивную и мультипликативную модель Хольта-Уинтерса в зависимости от того, как включена сезонная составляющая (умножение или сложение). Рекуррентные формулы для обновления мультипликативной модели:система:а0е=альфа*(хт/фт-1)+(1-альфа1)*(ф0е-1+ф1т-1); а1т=альфа2*(а0т-а0т-1)+(1-альфа2)*ат-1;фе=альфа3*(хт/а0т)+(1-альфа3)*фе-ий

(4.1) где - адаптируемые параметры линейного тренда на t-м шаге адаптации, - параметры адаптации, - адаптируемый параметр сезонных коэффициентов на t- м шаге адаптации, l – период сезонности. Прогнозирование в мультипликативной модели на? шагов вперед осуществляется по формуле:х с фолной т+р=а0т+ф1т*р+фе-1+р, 4.5)Определение начальных параметров а00,а10,фий-1 (i=0, 1, …,l) для параметров адаптации альфа 1 2 3 исходит из следующих требований: параметры а00,а10 определяются как коэффициенты регрессии хт=а00+а10*т, адаптируемые же коэффициенты сезонности определяются как среднее арифметическое значение индексов фс волной т=хт-у расч.т (для мультипликативной модели) и ф с волной=хт-у расч.т.

(для аддитивной модели), причем рассчитываются они для каждой одноименной фазы периода (-расчетные значения линейного тренда).

Параметры альфа 1,2,3 определяются обычно из условия минимизации суммы квадратов ошибок, причем необходимо учитывать, что альфа 2 параметр сглаживания тренда, а - альфа3 параметр адаптации сезонных коэффициентов

Рисунок 7. Экспоненциальный тренд

Экспоненциальный тренд описывает процессы, развивающиеся в условиях отсутствия значимых ограничений изменения уровня. Уровни тренда представляют собой геометрическую прогрессию. Очевидно, что обычно он имеет место на ограниченных отрезках времени.

Основное выражение гиперболического тренда

Рисунок 8. Гиперболический тренд

Свободный член уравнения, таким образом – это предел, к которому стремятся уровни ряда. Такая тенденция характерна для процессов демонстрирующих тенденцию к замедляющемуся снижению значений показателя, которые, однако, не могут уменьшиться более некоторого нижнего значения. Например, такими свойствами могут обладать тенденции снижения затрат на производство . В случае b < 0 с течением времени уровни тренда, наоборот, возрастают, стремясь к а .

Если изучаемый и прогнозируемый процесс приводит к замедлению роста показателя, но не вызывает прекращения роста, то вполне адекватным отображением тенденции может стать уравнение логарифмического тренда:

.

Рисунок 9. Логарифмический тренд

Подбирая начало отсчета периодов, можно найти такую скорость изменений, которая наиболее точно отвечает фактическому временному ряду .

Логистическая форма уравнения тренда подходит для описания процесса, когда изучаемый показатель проходит полный цикл развития, начиная от нижнего (как правило, нулевого) уровня, сначала медленно с ускорением возрастая, после чего тенденция становится приблизительно прямолинейной. В завершающей части цикла рост замедляется по гиперболе по мере приближения к пределу. В некоторых зарубежных прикладных пакетах статистического анализа логистическая кривая называется S-образной кривой.

Можно считать логисту объединением сразу трех видов тенденций: парабола – прямая – гипербола. Но есть и доводы за рассмотрение логистического тренда как самостоятельного. Его выделение позволяет уже на первом этапе определить всю траекторию развития явления, выяснить сроки перехода от ускоренного роста к замедленному, что может оказаться весьма важно для прогноза.

Рисунок 10. Логистический тренд

При изменении уровней от нулевого уравнение тренда по логисте имеет вид

.

При а0 > 0 и а1 < 0 с ростом номера периодов времени будет иметь место тенденция роста уровней. Если нужно начать рост почти с нуля, то должно быть а0 ≈ 10 . Чем больше будет модуль а1 , тем быстрее будут возрастать уровни. При а1 < 0 и а2 > 0 имеет место тренд снижения уровней ряда, если нужно начать снижение почти от 1 , то должно быть а0 ≈ –10 . Чем больше будет а1 , тем быстрее будут снижаться уровни.

Если диапазон изменения уровней ограничен не нулем и единицей, а обозначенными исходя из условий ymax и ymin , то формула логистического тренда примет вид

Графическое отображение во многих случаях позволяет приближенно выявить вид тип уравнения, наиболее адекватный тенденции временного ряда. Но при этом следует соблюдать некоторые правила построения графика. Требуется точное соблюдение масштаба как по величине уровней ряда, так и по шкале времени. Время откладывается обычно по оси абсцисс, величины уровней – по оси ординат. По каждой оси следует установить такой масштаб, чтобы ширина графика была примерно в 1,5 раза больше его высоты. Если уровни ряда различаются в десятки, сотни, тысячи раз, ось ординат имеет смысл разместить в логарифмическом представлении, равные отрезки будут означать различие уровней в одинаковое число раз. Тогда изменится и интерпретация графика: при линейном масштабе прямая будет означать прямолинейную тенденцию, при логарифмическом – экспоненту. Нужно соблюдать равенство величин, отображающих время на горизонтальной оси, тут логарифмическая шкала не рекомендуется, это значительно осложнит прочтение графика.

Но графический метод не всегда дает хороший результат. Например, таким путем трудно бывает отличить параболу от экспоненты, логарифмическую кривую от гиперболы и т. д. Хотя специализированные прикладные программные пакеты значительно облегчают анализ, в них нередко встроены средства быстрого расчета и нанесения на график линии тренда в соответствии с различными предположениями о его характере (например, нанесение линии тренда на диаграммы в MS Excel). Кроме того, не всегда вариант уравнения тренда, «лучший» внешне, является лучшим с аналитической и статистической точек зрения. Поэтому имеет смысл использовать и иные методы определения типа уравнения тренда: метод последовательных разностей , МНК (выбор уравнения тенденции, дающего наименьшую сумму квадратов отклонений)…

3.1.3. Особенности прогнозирования на основе трендовых моделей

Трендовое прогнозирование обладает свойств:

Для крупных сложных объектов и систем, обладающих большой инерционностью развития, прогноз по тренду, выявленному на базе изучения предыдущего развития, как правило, вполне реален и надежен;

Выясненные параметры тренда (то есть константы аппроксимирующих тренд выражений) должны быть статистически надежны, что достаточно легко проверить. Если они не надежны, то ненадежен и прогноз;

Срок упреждения прогноза должен быть не более половины периода основания прогноза (лучше – не более трети). То есть, если период основания прогноза, в рамках которого изучалась тенденция явления, составляет, скажем, 30 лет, то возможных период упреждения – 10 – 15 лет максимум.

У прогнозирования на базе временных рядов с помощью выясненной тенденции развития есть некоторые преимущества перед другими методами прогнозирования, есть и недостатки.

Уравнение тренда имеет преимущества перед «обычной» статистической регрессией по потенциальной ширине охвата факторов, влияющих на динамику изучаемого явления. Коэффициент при номере пе­риода в уравнении тренда – это комплексный коэффициент регрессии при всех реальных факто­рах, влияющих на уровень изменяющегося показателя, которые сами изменяются во времени. «Обычная» регрессия (которая, кстати, составляет основу эконометрических моделей) позволяет учесть только часть факторов, влияние остальных «списывается» на ошибку регрессии.

Второе преимущество состоит в том, что уравнение тренда есть модель динамики процесса, и на ее основании мы прогно­зируем динамику, т. е. логическая основа тренда соответствует задаче. Напротив, уравнение многофакторной регрессии – это модель вариации уровня показателя в статической совокупнос­ти. Логическая база прогноза по многофакторной регрес­сии в статике не совсем адекватна задаче прогнозирования.

Последнее, хотя и не очень существенное преимущество про­гноза по тренду заключается в том, что для него не требуется большого объема исходной информации о факторах, как для множественной регрессии. Достаточ­но однородного по характеру тенденции периода, допустим, за 20 – 25 лет.

Но прогноз на основе временного тренда может не давать корректных результатов в случае высокой нестабильности объекта предсказания. Нет возможности проигрывать разные вариан­ты прогноза при разных сочетаниях значений факторов, что обычно делается при прогнозе по регрессионной модели с уп­равляемыми факторами (то есть сделать прогноз действительно вариативным). Кроме того, наилучшие результаты трендовое прогнозирование дает на относительно коротких периодах упреждения (краткосрочный, если по годам – среднесрочный прогноз).

Прогноз производится по такому общему алгоритму:

1. упорядочение прошлых данных;

2. сглаживание временного ряда;

3. выделение тренда;

4. определение уравнения тренда;

5. расчет прогнозного значения;

6. оценка доверительного интервала с заданной вероятностью.

В процессе выяснения тренда показателя может потребоваться учет повторяющихся колебаний в рамках самой основной тенденции, своего рода тренда внутри тренда. В данном случае речь идет о периодической колеблемости неслучайного характера, например, о сезонности. В этом случае трендовую модель имеет смысл дополнить до модели тренда и сезонности.

Такую коррекцию можно провести с помощью индексов сезонности. Сезонность – явление, имеющее обычно ежегодную повторяемость. Для ее определения желательно проанализировать данные по 7-ми – 10-ти периодам, в которых имеет она место. Можно обойтись и меньшим числом периодов (например, лет), но тогда достоверность наличия выявленной закономерности снижается.

Можно рассчитывать индексы сезонности как собой частное от деления отдельных уровней ряда на средний по всему ряду, для которого определяется сезонность, уровень. Например, сезонность в рамках года определима индексами, получаемыми в результате деления месячных уровней на среднемесячное значение уровня ряда за весь год. Умножение на 100 даст величину индекса в процентах.

Возможен и расчет сезонных индексов с использованием весов. Тогда используется несколько иной алгоритм расчетов. Обратимся к примеру расчета квартальной сезонности в течение года на основе помесячных данных за несколько лет:

1. определяются индексы сезонности путем соотнесения эмпирических данных (yi ) с рассчитанными по уравнению тренда (https://pandia.ru/text/78/235/images/image028_9.gif" width="71" height="61">;

2..gif" width="21 height=28" height="28">) для каждого уже укрупненного периода времени – собственно сезона (квартал). Роль весов играют средние значения уровней ряда для годов, рассчитанные ранее, где – индексы сезонности по месяцам:

.

Учет периодической колеблемости может осуществляться и иными способами (например, на основе рядов Фурье).

3.2. Эконометрическое моделирование

3.2.1. Общее понятие эконометрических моделей

Эконометрические модели (в основе которых лежат методы статистики, точнее – регрессионного анализа) из всех формализованных методов прогнозирования используются, возможно, наиболее часто (по крайней мере, за рубежом).

В качестве самостоятельной отрасли знания эконометрика оформилась в начале 30-х годов XX века. Термины «эконометрика» и «эконометрия» стали общеупотребительными благодаря норвежскому экономисту Р. Фришу. Согласно Р. Фришу, эконометрика объединяет «как чистую экономическую теорию , так и статистическую проверку законов чистой экономической теории». Более конкретно: «сущность эконометрики заключается во взаимном переплетении количественной экономической теории и статистических оценок». Отсюда следует, что к числу эконометрических относятся отнюдь не все модели, а лишь такие, которые позволяют проводить статистические операции. Существует не мало моделей и развернутых на их основе «количественных теорий», являющихся экономико-математическими, но вовсе не эконометрическими. Поскольку за каждой переменной эконометрической модели стоит определенный статистический индикатор, с той или иной точностью измеряющий какую-то сторону хозяйственного механизма, расчеты на базе этой модели, как правило, имеют достаточно высокую практическую ценность. Они могут быть использованы при выработке экономической политики государства , рыночной стратегии фирмы и решении других конкретных задач.

Методологическая особенность эконометрики заключается в применении общих гипотез о статистических свойствах экономических параметров и ошибок при их измерении. Полученные при этом результаты могут оказаться нетождественными тому содержанию, которое вкладывается в реальный объект. Поэтому важная задача эконометрики – создание как более универсальных, так и специальных методов для обнаружения наиболее устойчивых характеристик в поведении реальных экономических показателей. Эконометрика разрабатывает методы «подгонки» формальной модели с целью наилучшего имитирования ею поведения моделируемого объекта на основе гипотезы о том, что отклонение модельных параметров от реально наблюдаемых случайны и вероятностные характеристики их известны.

Главным инструментом эконометрики служит эконометрическая модель – модель факторного анализа , параметры которой оцениваются средствами математической статистики. Такая модель выступает в качестве средства анализа и прогнозирования конкретных экономических процессов на основе реальной статистической информации.

Можно выделить два основных класса эконометрических моделей:

1) Регрессионные модели с одним уравнением. В таких моделях зависимая (объясняемая) переменная Y представляется в виде функции , где x 1 , …, хn – независимые (объясняющие) переменные, β1, …, β m – параметры. В зависимости от вида функции f (x , β) модели делятся на линейные и нелинейные . Например, можно исследовать среднедушевой уровень потребления населения как функцию от уровня доходов населения и численности населения, или зависимость заработной платы от возраста, пола, уровня образования, стажа работы и т. п. По математической форме они могут быть схожи с моделями временных рядов, в которых в качестве независимой переменной выступает значение момента времени

Область применения таких моделей, даже линейных, значительно шире, чем моделей временных рядов. Проблемам теории оценивания, верификации (проверки на практике), отбора значимых параметров и другим посвящен огромный объем литературы. Эта тема – стержневая в эконометрике.

2) Системы одновременных уравнений. Эти модели описываются системами уравнений. Системы могут состоять из тождеств и регрессионных уравнений, каждое из которых (кроме независимых переменных) может включать в себя также зависимые переменные из других уравнений системы. В результате имеется набор зависимых переменных, связанных через уравнения системы, решаемые одновременно. Примером может служить модель Уортона, имеющая очень большую размерность (уортоновская квартальная модель американской экономики содержит более 1 тыс. уравнений).

3.2.2. Линейная регрессия. Метод наименьших квадратов (МНК)

С помощью методов регрессионного анализа, основных для эконометрического моделирования, строятся и проверяются модели, характеризующие связь между одной эндогенной (зависимой) переменной и одной или более экзогенными (независимыми) переменными. Независимые переменные называются регрессором.

Направленность связи между переменными определяется путем предварительного обоснования и включается в модель в качестве исходной гипотезы. Задача регрессионного анализа – проверка статистической состоятельности модели, если данная гипотеза верна. Регрессионный анализ не в состоянии «доказать» гипотезу, он может лишь подтвердить ее статистически или отвергнуть.

Рассмотрим методологию построения регрессионных эконометрических моделей на примере моделей из одного уравнения . Модели в виде системы уравнений, обладая своими особенностями (в частности, при определении параметров-коэффициентов модели) также базируются на ней.

В общем виде регрессионное уравнение выглядит так:

,

где – функция, которая описывает детерминированную составляющую модели (само уравнение регрессии), ε представляет собой «случайную» компоненту.

Обычно наиболее часто для отображения зависимости используются линейные регрессионные уравнения, отображающие зависимость в виде прямой в многомерном пространстве. В случае с парной линейной регрессией это знакомое всем со школы уравнение прямой:

.

Здесь α – постоянная составляющая, то есть даже если х = 0 , то Y все равно будет иметь какое-либо положительное или отрицательное значение; β обычно называют коэффициентом регрессии, он отражает наклон линии графика, вдоль которой рассеяны значения Y , выявленные в результате наблюдения за поведением Y , а не в результате расчетов в соответствии с моделью; ε – ошибка или значение помехи, также называемая остатком. Существование остатка может объяснимо либо тем, что кроме рассматриваемого фактора х на значение зависимой переменной могут влиять и другие факторы, неучтенные в модели, либо трудностями измерения х . Математическое ожидание (среднее значение) ошибки ε равно нулю.

В качестве факторной переменной может учитываться показатель времени t . Тогда мы имеем дело с уравнением тренда. В случае с линейным трендом значения t = 1, 2, 3 … n .

Метод наименьших квадратов (МНК, англ. Ordinary Least Squares , OLS ) является одним из основных методов определения параметров регрессионных уравнений, Он заключается в том, чтобы определить вид кривой, характер которой в наибольшей степени соответствует выраженной эмпирическими данными зависимости. Такая кривая должна обеспечить наименьшее значение суммы квадратов отклонений эмпирических значений величин показателя от значений, вычисленных согласно уравнению этой кривой. Меняя вид теоретических кривых, приближенно отображающих динамику рассматриваемого показателя, пытаются добиться как можно меньшего значения этой разности.

Пусть теоретическая зависимость линейна (парная регрессия, прямая в двухмерном пространстве) и выражена регрессионным уравнением:

Коэффициент b можно определить по формуле

Найдем a , подставив в уравнение прямой, параметры которого находим, значение уже известного параметра b и средние значения x ср и Y ср :

Допустим, связь между двумя показателями парной регрессии выражена функцией

то есть в виде многочлена степени k .

– матрица коэффициентов системы (2.19). В случае, когда величины х i (то есть, в различных наблюдениях i ) различны, столбцы матрицы Х линейно независимы. Тогда вектор-столбец коэффициентов многочлена Y (х) является единственным решением матричного уравнения:

,

где – вектор столбец последовательных значений величины Y . Отсюда a (вектор оценок параметров) может быть найден по формуле:

,

Линейная многомерная регрессионная модель (модель множественной линейной регрессии ) является обобщением модели парной линейной регрессии. Она имеет вид:

где Х mt – значение фактора-регрессора Х m в момент наблюдения t , при α 0 вектор независимых переменных Х0 = (1, 1, …, 1) . В этом случае α 0 – так называемый свободный член. Такая модель с учетом допущений, перечисленных выше, называется нормальной линейной регрессионной моделью .

Удобно будет представить формулу (2.23) в матричном виде. Обозначим через Y вектор-столбец значений зависимой переменной (Y 1 , Y2, …, Yn ) ; α вектор-столбец коэффициентов (α 0 , α 1 , α 2 , …, αm ) ; ε – вектор-столбец стохастических компонент (ошибок) (ε 0 , ε 1 , ε 2 , …, εn ) ; Х – матрица независимых переменных размерности nxm :

Получим матричную запись системы, состоящей из уравнений вида

.

Отсюда, учитывая обратимость матрицы XTX , находим вектор оценок коэффициентов системы, при чем это будет сделано в соответствии с формулой, в точности повторяющей уже знакомую нам формулу:

.

Для обоснованного применения метода наименьших квадратов данные должны соответствовать ряду допущений:

1) Математическая форма зависимости эндогенных переменных от экзогенных переменных модели носит линейный характер (другие типы уравнений, отражающих зависимость значения одной переменной от других, должны быть приведены к линейному виду, прежде чем возможно будет использовать метод наименьших квадратов), и независимые переменные модели являются единственными значимыми факторами, определяющими поведение зависимой переменной;

2) Значение ошибки ε нормально распределено со средней, равной 0 , и постоянной дисперсией , . То есть, хотя значение переменной Y значимо определяется только учтенными в модели факторными признаками, существует также ряд второстепенных факторов, некоторые из которых будут положительно влиять на величину Y , некоторые – отрицательно. В случае множества как положительных, так и отрицательных влияний значение ошибки ε будет нормально распределено. Нормальное распределение полностью определяется двумя параметрами: средней и средним квадратическим отклонением (дисперсией σ 2 ). Чем больше случайных величин действует вместе, тем точнее проявляется закон нормального распределения. Допущение о постоянной дисперсии говорит о постоянности разброса значений ε , вне зависимости от величины значения факторов. Тогда значение ошибки обладает свойством гомоскедастичности . Если разброс значений ошибки ε непостоянен, то имеет место явление гетероскедастичности .

3) Последующие значения ошибок независимы друг от друга, то есть ковариация в парах значений ε равна нулю (cov ε i ε j = 0 ). Это означает, что второстепенные факторы или факторы-причины ошибки для одной из величин Y, не приводят автоматически к ошибкам для всех наблюдений Y . Когда значения ε независимы, то данные неавтокоррелированы. Если же значения ε не являются независимыми, то данные демонстрируют наличие автокорреляции .

4) Независимые переменные являются нестохастическими, то есть их значения для модели детерминированы, заданы изначально.

Процесс построения и использования эконометрических моделей является достаточно сложным и подразумевает следующее:

1) после определения цели исследования необходимо построить систему показателей и логически рассортировать факторы, в наибольшей степени влияющие на каждый показатель;

2) осуществляется выбор формы связи изучаемых показателей между собой и отобранными факторами, другими словами, выбор типа эконометрической модели (линейная, нелинейная, степенная и т. д.);

3) решается проблемы сбора исходных данных и анализа информации;

4) строится эконометрическая модель, то есть определяются ее параметры;

5) проверяется качество построенной модели, в первую очередь ее адекватность изучаемому явлению, после чего модель может быть использована для экономического анализа и прогнозирования.

3.2.3. Отбор переменных эконометрической модели

Особое внимание следует обратить на построение системы показателей и определение совокупности факторов, влияющих на каждый из показателей. К включаемым в эконометрическую модель факторам предъявляются требования:

· включение каждого фактора в модель следует обосновать теоретически;

· целесообразно учитывать только те факторы, которые оказывают существенное влияние на изучаемые показатели, при этом рекомендуется, чтобы количество включаемых в модель факторов не превышало одной трети от числа наблюдений в выборке (длины временного ряда);

· между факторами не должно существовать линейной зависимости, поскольку ее наличие будет означать, что они характеризуют влияние одной и той же по сути причины на показатель. Например, размер заработной платы работников зависит в том числе и от роста производительности труда и от объема выпускаемой продукции. Однако эти два фактора могут быть тесно взаимосвязаны, коррелированны, следовательно в модель целесообразно включить лишь один из них. Включение в модель линейно зависимых факторов приводит к возникновению мультиколлинеарности , которая отрицательно сказывается на качестве модели;

· в одну модель не следует включать какой-либо фактор одновременно с образующими его частными факторами. Это приведет к не соответствующему реальности увеличению их влияния на зависимые переменные модели и, как следствие, к искажению отображения реальной действительности.

При отборе факторов, влияющих на зависимые переменные модели, используются статистические методы отбора. Так, существенного сокращения числа факторов (а значит – сделать модель менее громоздкой) можно достичь с помощью применения пошаговых процедур отбора переменных . Их можно сочетать и с другими подходами к решению проблемы, например, с экспертными методами оценки значимость факторов. Среди пошаговых процедур отбора факторов часто используются процедуры пошагового включения и исключения факторов.

Метод исключения предполагает построение уравнения, включающего некоторую начальную совокупность переменных с последующим последовательным сокращением их числа до тех пор, пока не будет выполнено заданное изначально при составлении уравнения условие. Применение метода включения подразумевает последовательное включение в модель все новых переменных, пока модель не станет соответствовать установленному критерию качества модели. Последовательность включения переменных в модель определяется с помощью частных коэффициентов корреляции: те переменные, для которых значение такого коэффициента, показывающего их связь с исследуемым показателем, больше, чем для прочих, включаются в регрессионное уравнение в первую очередь.

Одним из критериев одновременного включения или невключения нескольких признаков-факторов в модель является их линейная независимость. Если данная предпосылка не выполняется, то возникает явление мультиколлинеарности, то есть наличие сильной корреляции между некоторыми независимыми переменными модели (факторами). В содержательном аспекте мультиколлинеарность приводит к искажению смысла коэффициентов регрессии и затрудненности выявления наиболее влиятельных факторов.

Основные причины мультиколлинеарности: независимые переменные либо характеризуют одно и то же свойство изучаемого явления, либо их влияния являются составными элементами влияния одного и того же признака.

Наиболее распространенным методом выявления мультиколлинеарности является метод корреляции . Устраняют мультиколлинеарность чаще всего исключением одного из таких факторов.

3.2.4. Оценка качества параметров и анализ эконометрической модели

Описывавшиеся выше модели линейной регрессии являются вероятностными, а определяемые на основе метода наименьших квадратов параметры уравнений регрессии – только лишь оценками a и b истинных параметров a и b зависимости эндогенной переменной от некоторых экзогенных. Таким образом, нужно проверить, насколько данные оценки верны относительно истинных коэффициентов. Это осуществляется путем проверки:

­ статистической значимости коэффициентов регрессии;

­ близости расположения фактических данных к рассчитанной линии регрессии.

Оценки коэффициентов регрессии так же, как и ошибка (стохастическая компонента уравнения регрессии), предположительно нормально распределены. Статистическая значимость коэффициентов измеряется степенью вариации вокруг оценочного значения. Для измерения величины вариации нормально распределенных ошибок, остатков используется среднее квадратическое отклонение этих остатков – стандартные ошибки коэффициентов. Для определения степени значимости коэффициентов используется t-критерий . Для того чтобы иметь возможность их определить, нужно узнать оценки их дисперсий и, таким образом, средних квадратических отклонений.

После можно проверить гипотезу относительно коэффициентов либо определить для них доверительные интервалы.

Оценки параметров уравнения парной линейной регрессии. Надежность полученных оценок коэффициентов α и β , очевидно, зависит от дисперсии стохастической компоненты уравнения регрессии ε. Однако по данным выборки значений переменных модели дисперсия ε не может быть оценена, то при анализе надежности оценок коэффициентов регрессии используется дисперсия отклонений эмпирических значений переменной Y от рассчитанных на основе полученного уравнения: еi = Yi – a – bxi.

В случае парной линейной регрессии дисперсия b – оценки β равна:

Дисперсия α равна

мера разброса значений зависимой переменной вокруг линии регрессии – так называемая «необъясненная дисперсия», «остаточная дисперсия». Sa и Sb стандартные отклонения случайных величинa и b . Коэффициент b – коэффициент наклона линии регрессии. Чем больше разброс значений зависимой переменной вокруг линии регрессии, тем большей (в среднем) окажется ошибка в определении наклона линии регрессии. Если же все значения Y расположены на линии регрессии (ei = 0 , а, значит, σ² = 0 ), то ошибки в определении значений коэффициентов a и b отсутствуют (отсюда – s 2 , соответствующее σ² , равно нулю).

Формально значимость оцененного коэффициента регрессии b может быть проверена с помощью анализа его отношения к своему стандартному отклонению . Эта величина в случае соблюдения исходных предпосылок модели характеризуется t-распределением Стьюдента с n –2 степенями свободы, где n – число наблюдений:

Для t-статистики проверяется гипотеза о равенстве ее нулю. t = 0 будет означать b = 0 .

При оценке коэффициента линейной регрессии можно использовать следующее грубое правило. Если стандартная ошибка коэффициента больше его модуля (t │<1 ), то он не может быть признан «хорошим», значимым, поскольку доверительная вероятность при двусторонней альтернативной гипотезе составляет менее приблизительно 0,7 . Если стандартная ошибка меньше модуля коэффициента, но больше его половины (1<│ t │<2 ), то данная оценка коэффициента может рассматриваться как более или менее значимая (доверительная вероятность от 0,7 до 0,95 ). Значение t от 2 до 3 свидетельствует о наличии весьма значимой связи (доверительная вероятность от 0,95 до 0,99 ), │t│>3 означает практически стопроцентное подтверждение ее наличия. Несомненно, в каждом случае определенную роль играет количество наблюдений: чем их больше, тем надежнее при прочих равных условиях выводы о наличии связи и тем меньше граница доверительного интервала для данного числа степеней свободы и уровня значимости. Однако эти различия существенны лишь для малых n , а при n≥10 сформулированные правила приблизительно верны.

Для осуществления проверки значимости оценок коэффициентов регрессии нужно решить, будет ли она односторонней или двусторонней. Выбор определяется теоретическим обоснованием модели связи зависимой и независимой переменных. При этом односторонняя проверка предполагает, что характер связи между X и Y однозначен: либо связь отрицательна, либо положительна, но не то и другое одновременно. При двусторонней проверке исходят из предположения, что связь между X и Y может быть как положительной, так и отрицательной.

С помощью рассчитанных стандартных отклонений и значений t-статистики можно определить доверительный интервал значений α и β с заданной доверительной вероятностью. Предполагаемые значения α и β будут находиться в рамках этого интервала, если же нет, то придется отвергнуть предположение, выдвинутое относительно величины α и β :

Подбор формул по графику. Линия тренда
Для всех рассмотренных выше задач удавалось построить уравнение или систему уравнений. Но во многих случаях при решении практических задач имеются лишь экспериментальные (результаты измерений, статистические , справочные, опытные) данные. По ним с определенной мерой близости пытаются восстановить эмпирическую формулу (уравнение), которая может быть использована для поиска решения, моделирования, оценки решений, прогнозов.

Процесс подбора эмпирической формулы P (x ) для опытной зависимости F (x ) называется аппроксимацией (сглаживанием). Для зависимостей с одним неизвестным в Excel используются графики, а для зависимостей со многими неизвестными – пары функций из группы Статистические ЛИНЕЙН и ТЕНДЕНЦИЯ, ЛГРФПРИБЛ и РОСТ.

В настоящем разделе рассматривается аппроксимация экспериментальных данных с помощью графиков Excel: на основе данных стоится график, к нему подбирается линия тренда , т.е. аппроксимирующая функция, которая с максимальной степенью близости приближается к опытной зависимости. Excel предоставляет 5 видов аппроксимирующих функций:


  1. Линейная – y = cx + b . Это простейшая функция, отражающая рост и убывание данных с постоянной скоростью.

  2. Полиномиальная – y = c 0 + c 1 x + c 2 x 2 +…+ c 6 x 6 . Функция описывает попеременно возрастающие и убывающие данные. Полином 2-ой степени может иметь один экстремум (min или max), 3-ей степени – до 2-х экстремумов, 4-ой степени – до 3-х и т.д.

  3. Логарифмическая – y = c lnx + b . Эта функция описывает быстро возрастающие (убывающие) данные, которые затем стабилизируются.

  4. Степенная – y = cx b , (х >0 и y >0). Функция отражает данные с постоянно увеличивающейся (убывающей) скоростью роста.

  5. Экспоненциальная – y = ce bx , (e – основание натурального логарифма). Функция описывает быстро растущие (убывающие) данные, которые затем стабилизируются.
Степень близости подбираемой функции оценивается коэффициентом детерминации R 2 . Если нет других теоретических соображений , то выбирают функцию с коэффициентом R 2 , стремящимся к 1. Отметим, что подбор формул с использованием линии тренда позволяет установить как вид эмпирической формулы, так и определить численные значения неизвестных параметров.
Для всех 5 видов функций используется аппроксимация данных по методу наименьших квадратов. Подробнее о формулах расчета линии тренда и коэффициента детерминации смотрите в справке по F1, введя поиск слов «линия тренда».
В качестве примера рассмотрим зависимость продаж от рекламы, заданную следующими статистическими данными по некоторой фирме:

Реклама (тыс. руб)

1,5

2

2,5

3

3,5

4

4,5

5

5,5

6

Продажи (тыс. шт)

3

13

25

35

40

45

48

50

51

Необходимо построить функцию, наилучшим образом отражающую эту зависимость. Кроме того, необходимо оценить продажи для рекламных вложений в 6 тыс. руб.

Приступим к решению: в первую очередь введите эти данные в Excel и постройте график , как на рис. 2.48. Как видно, график построен на основании диапазона B2:J2. Далее, щелкнув правой кнопкой мыши по графику, добавьте линию тренда, как показано на рис. 2.48.

В открывшемся окне настройки (рис. 2.49), в закладке Тип выберите для аппроксимации логарифмическую линию тренда (по виду графика). В закладке Параметры установите флажки , отображающие на графике уравнение и коэффициент детерминации.

После нажатия ОК Вы получите результат, как на рис. 2.50. Коэффициент детерминации R 2 = 0.9846, что является неплохой степенью близости. Для подтверждения правильности выбранной функции (поскольку других теоретических соображений нет) спрогнозируйте развитие продаж на 10 периодов вперед. Для этого щелкните правой кнопкой по линии тренда – измените формат – после этого в поле Прогноз: вперед на: (рис. 2.49) установите значение 10.


Рис. 2.48


Рис. 2.49

Рис. 2.50
После установки прогноза Вы увидите изменение кривой графика на 10 периодов наблюдения вперед, как на рис. 2.51. Он с большой долей вероятности отражает дальнейшее увеличение продаж с увеличением рекламных вложений.

Рис. 2.51
Теперь вернитесь к состоянию рис. 2.50, нажав кнопку Отменить на Панели инструментов. Попробуйте изменить формат линии тренда – установите полиномиальную линию тренда полиномом 2-ой степени – получите рис. 2.52.

Рис. 2.52
Как видно, полученная формула аппроксимирует исходную зависимость (на отрезке B2:J2) с большей степенью близости, т.к. R 2 = 0.9973. В то же время, если сделать прогноз на 10 периодов вперед, то он будет не совсем верно отражать реальность: продажи не могут уменьшаться с увеличением рекламных вложений. Убедитесь в этом: сделайте прогноз на 10 периодов наблюдения вперед и получите график.

Опять вернитесь к состоянию рис. 2.50, нажав кнопку Отменить . Для вычисления продаж при рекламе в 6 тыс. руб. запишите в ячейку К2 формулу =23,796*LN(K1)+0,5961: должно получиться 43,2 тыс. штук.

В Excel имеется функция ПРЕДСКАЗ , которая вычисляет будущее значение Y по существующим парам значений X и Y значениям с использованием линейной регрессии. Функция Y по возможности должна быть линейной, т.е. описываться уравнением типа c + bx . Функция предсказания для нашего примера запишется так: =ПРЕДСКАЗ(K1;B2:J2;B1:J1). Запишите – должно получится значение 64.4.

Обратите внимание, что на рис. 2.50 ось Х подписана номерами периодов наблюдения, а на рис. 2.52 - значениями в точках наблюдения. Для нанесения значений на ось Х щелкните правой кнопкой мыши по графику и в выпавшем меню выберите пункт И сходные данные :

В открывшемся одноименном окне , в закладке Ряд , в поле П одписи оси Х , укажите диапазон ячеек, где записаны значения Х (здесь $B$1:$K$1).


  1. Постройте функцию, наилучшим образом отражающую зависимость и спрогнозируйте значения для следующего периода наблюдения со значением 5, основываясь на следующих данных:

Цена (руб)

1

1,5

2

2,5

3

3,5

4

4,5

5

Спрос (шт)

1300

700

500

200

100

70

50

40

  1. Концентрация ядовитого вещества в водоеме изменялась во времени согласно таблице:

Определите вид зависимости концентрации от времени и расчетную концентрацию в момент выброса.

Подбор формул со многими неизвестными
Использование линии тренда графиков Excel – наиболее наглядный и информативный способ восстановления зависимости и исследования связи между двумя переменными. Для зависимостей со многими неизвестными подбор формул выполняют с помощью специальных функций из группы Статистические - ЛИНЕЙН и ЛГРФПРИБЛ. Кроме того, функции ТЕНДЕНЦИЯ и РОСТ позволяют вычислить значения аппроксимирующей функции в диапазоне наблюдения. Еще один инструмент для подбора формул со многими неизвестными Регрессия , входящий в Пакет анализа (С е рвис Ана л из данных… ), будет рассмотрен в следующем разделе.

В настоящем разделе рассматривается аппроксимация экспериментальных данных с помощью функций ЛИНЕЙН, ТЕНДЕНЦИЯ, ЛГРФПРИБЛ и РОСТ. Функции ЛИНЕЙН и ТЕНДЕНЦИЯ применяют для восстановления линейных зависимостей вида y=b+a 1 x 1 +a 2 x 2 +…+a n x n , а функции ЛГРФПРИБЛ и РОСТ - для нелинейных (показательных) зависимостей вида y=ba 1 X 1 a 2 X 2 …a n Xn .

Функции ЛИНЕЙН и ЛГРФПРИБЛ возвращают массив с т.н. регрессионной статистикой, в котором содержатся вычисленные значения параметров (b,a 1 ,a 2 ,…a n), коэффициент детерминации R 2 и другие данные, характеризующие аппроксимирующую функцию. Формат функций ЛИНЕЙН, ЛГРФПРИБЛ и их применение поясним на примере.

Расчет стоимости недвижимости
Агентство недвижимости оценивает однокомнатные квартиры по трем переменным: х1 – общая площадь, х2 – площадь кухни, х3 – этаж квартиры , предполагая, что между каждой переменной х1, х2, х3 и зависимой переменной y (стоимость) существует линейная зависимость. Подобрать формулу для вычисления стоимости однокомнатных квартир и вычислить стоимость квартиры с данными: х1=42кв.м, х2=11кв.м, х3=5эт. Собранные рекламные данные занесены в приведенную ниже таблицу.


Последовательность действий для решения задачи следующая:


  1. Заведите приведенную таблицу в Excel, в ячейки A1:D14.

  2. Выделите диапазон ячеек B17:E21 (рис. 2.54) для сохранения результатов вычислений функции ЛИНЕЙН – массива регрессионной статистики.

  3. Вызовите мастер функций, выберите статистическую функцию ЛИНЕЙН и заполните параметры функции как на рис. 2.53. Параметр Изв_знач_ y содержит диапазон D2:D14, т.е. известные значения y. Параметр Изв_знач_х содержит диапазон A2:C14, т.е. известные значения х. Параметр Стат=1 , поскольку мы хотим получить дополнительную статистику.

Рис. 2.53


  1. После нажатия ОК встаньте на строку формул и нажмите Ctrl+Shift+Enter. В результате должен получиться массив значений, показанный на рис. 2.54. Интересующие нас коэффициенты выделены на рисунке (подробнее см. справку F1). Коэффициент детерминации R 2 =0.9725 вполне удовлетворителен. Таким образом, искомая формула имеет вид:

Y = 1,36*х1 + 0,1*х2 – 0,21*х3 – 19,27



Рис. 2.54


  1. После подбора формулы осталось вычислить стоимость при х1=42, х2=11, х3=5. В любую ячейку запишите выражение =1,36*42+0,1*11–0,21*5–19,27. В результате получится y=37.9 тыс. $.

Использование функции ТЕНДЕНЦИЯ покажем на этом же примере для расчета стоимостей различных вариантов квартир, как показано на рис. 2.55.



Рис. 2.55
Новые значения Х, для которых надо рассчитать стоимость , следует ввести в ячейки F2:H14. Диапазон I2:I14 используйте для записи рассчитанных значений y, Вызовите мастер функций и функцию ТЕНДЕНЦИЯ. Параметры функции заполните как на рис. 2.56. Как видно параметр Нов_знач_х содержит диапазон F2:H14, т.е. новые значения х. После нажатия ОК встаньте на строку формул и нажмите Ctrl+Shift+Enter – результат, заполненный диапазон I2:I14 на рис. 2.55.

Рис. 2.56

Оценка эффективности рекламы
Следующий пример. Подобрать формулу для вычисления процента увеличения оборота при различных затратах на рекламу. Экспериментально известны проценты увеличения оборота при затратах в 5, 10, 15, 20 тыс.$ в 3-х масс-медиа - на телевидении, радио и в прессе:


5 тыс. $

10 тыс. $

15 тыс. $

20 тыс. $

1. TV

28%

43%

61%

95%

2. Радио

15%

24%

34%

50%

3. Пресса

6%

9%

13%

20%

Кроме этого, надо вычислить процент увеличения оборота в прессе при затратах 2 тыс.$ и на телевидении при затратах в 22 тыс.$. Дополнительно вычислите проценты для всех масс-медиа при затратах 2, 17 и 25 тыс.$.

Для решения задачи в первую очередь следует правильно разместить данные – рис. 2.57.

Рис. 2.57
Затем вычислите массив с регрессионной статистикой функцией ЛИНЕЙН: выделите диапазон ячеек F2:H6 и проделайте известные из предыдущего примера действия. В итоге должен получиться массив:

Как видно, коэффициент детерминации R 2 =0.8757 не удовлетворителен. Поэтому выполните подбор формулы с помощью функции для нелинейных зависимостей ЛГРФПРИБЛ: выделите диапазон ячеек F2:H6 и проделайте известные из предыдущего примера действия. В итоге должен получиться массив:

В этом случае коэффициент детерминации R 2 =0.989 вполне удовлетворителен и можно записать искомую аппроксимирующую формулу показательного типа (т.к. использована функция ЛГРФПРИБЛ):

Y = 0,44 * 0,46 х1 * 1,08 х2


Теперь вычислите проценты увеличения оборота из условия задачи: введите формулы и не забудьте установить процентный формат отображения значений в ячейках. Результаты приведены в таблице:

Пресса, 2 тыс.$

5,0%

=0,44*0,46^3*1,08^2

TV, 22 тыс.$

110,0%

=0,44*0,46^1*1,08^22

В заключении , вычислите проценты для всех масс-медиа при затратах 2, 17 и 25 тыс.$. Подготовьте данные, колонки J и K, как на рис. 2.58.

Для вычисления значений Y используем функцию РОСТ, поскольку уже известно, что зависимость нелинейная, показательная. Выделите диапазон ячеек L2:L10 и введите функцию РОСТ ; заполнение параметров функции показано на рис. 2.59.

Рис. 2.58

Рис. 2.59
После нажатия ОК и Ctrl+Shift+Enter на строке формул, колонка L будет заполнена как на рис. 2.58. Сравните результаты с результатами вычисления по подобранной формуле.
Задачи для самостоятельного выполнения:


  1. Источник радиоактивного излучения помещен в жидкость. Датчик расположен на расстоянии (х1) 20, 50 и 100 см от источника. Измерения интенсивности излучения (y, мРн) проводились через 1, 5 и 10 суток (х2) после установки источника. Необходимо подобрать аппроксимирующее уравнение. Результаты измерений приведены в таблице:

х1 / х2

1

5

10

20

61.2

43.6

28.3

50

33.6

24.0

15.6

100

12.3

8.8

5.7

  1. В бассейне проводится ежедневная частичная смена воды. Необходимо подобрать формулу для вычисления уровня воды в бассейне, которая зависит от двух переменных: х1 – длительность впуска воды, х2 – длительность выпуска воды. Кроме этого, необходимо вычислить значения уровня воды для х1 с шагом 10 и х2 с шагом 5. Исходные данные - результаты наблюдений за неделю приведены в таблице:

х1

х2

y

120

20

3.2

100

25

2.8

130

20

3.3

100

15

3.3

110

23

3.0

105

26

2.8

112

13

3.3

Важной управленческой задачей, решаемой с использованием рядов динамики, является определение общей тенденции развития . На развитие явления во времени могут оказывать влияние различные по своему характеру и силе воздействия факторы. Одни из них оказывают более или менее постоянное воздействие и формируют в рядах динамики определенную тенденцию развития. Воздействие же других факторов может быть кратковременным. При изучении в рядах динамики общей тенденции развития применяются различные приемы и методы. Одним из наиболее элементарных способов изучения общей тенденции в ряду динамики является укрупнение интервалов . Этот способ основан на укрупнении периодов, к которым относятся уровни ряда динамики.

Пример 11.3 . Имеются данные о выпуске продукции группой предприятий по месяцам (млн. руб.):

Для выявления общей тенденции роста выпуска продукции произведем укрупнение интервалов. Для этой цели исходные (месячные) данные о выработке продукции объединяем в квартальные и получаем показатели выпуска продукции группой предприятий по кварталам:

I - 64,5;

II - 76,9;

III - 78,8;

IV - 85,9.

В результате укрупнения интервалов общая тенденция роста выпуска продукции данной группой предприятий выступает отчетливо:

64,5


    1. Метод скользящей средней.

Выявление общей тенденции ряда динамики можно произвести путем сглаживания ряда динамики с помощью метода скользящей средней . Сущность этого приема состоит в том, что по исходным уровням ряда (эмпирическим данным) определяют расчетные (теоретические) уровни. При этом посредством осреднения эмпирических данных индивидуальные колебания погашаются и общая тенденция развития явления выражается в виде некоторой плавной линии (теоретические уровни).

Основное условие применения этого метода состоит в вычислении звеньев подвижной (скользящей) средней из такого числа уровней ряда, которое соответствует длительности наблюдаемых в ряду динамики циклов.

Пример 11.4 . Имеются следующие данные о реализации продукции по городу (среднедневная выручка в сопоставимых ценах):


Квартал

Год

1

2

3

4

I

175

247

420

426

II

263

298

441

449

III

326

366

453

482

IV

2973

341

399

460

Специфический для данного явления характер колебаний уровней ряда можно видеть из графического представления исходных (эмпирических) данных (рис. 11.1).

Увеличение уровней объема реализации во II и III кварталах и относительное их снижение в IV квартале характерны для каждого из представленных годовых периодов. Для выражения общей тенденции развития явления методом сглаживания рядов динамики необходимо прежде всего определить по эмпирическим данным скользящие средние.

Для ряда внутригодовой динамики с сезонными циклами развития явления по одноименным кварталам года применяют четырехчленные скользящие средние. Расчет состоит в определении средних величин из четырех уровней ряда с отбрасыванием при вычислении каждой новой средней одного уровня ряда слева и присоединением одного уровня справа. Применительно к исходным данным получаем 13 средних.

Особенность сглаживания по четному числу уровней состоит в том, что каждая из исчисленных четырехчленных средних относится к соответствующим промежуткам между смежными кварталами. Так, первая средняя относится к промежутку между II и III кварталом 1-го года, вторая - к промежутку между III и IV кварталом 2-го года и т.д.

Для получения значений сглаженных уровней соответствующих кварталов необходимо произвести центрирование расчетных средних. Так, для определения сглаженного среднего уровня III квартала 1-го года произведем центрирование первой и второй средних. Для определения сглаженного среднего уровня IV квартала 1-го года произведем центрирование второй и третьей средних. Ход расчета необходимых данных для получения средних (теоретических) уровней представим в таблице сглаживания ряда.


Период

Исходный уровень

Средняя из суммы четырех уровней ряда

^ Сглаженный средний уровень (с центрированием)

1

175

1061:4 = 265,25

274,25

2

263

3

326

4

297

1033:4 = 283,25

287,60

5

247

1168:4 = 292,00

297,00

6

298

1208:4 = 302,00

307,50

7

366

1252:4 = 313,00

334,60

8

341

1425:4 = 356,35

374,10

9

420

1568:4 = 392,00

402,90

10

441

1655:4 = 413,75

421,00

11

453

1713:4 = 428,25

429,00

12

399

1719:4 = 429,75

430,75

13

426

1727:4=431,75

435,37

14

449

1756:4 = 439,00

446,62

Недостатком способа сглаживания рядов динамики является то, что полученные средние не дают теоретических закономерностей (моделей) рядов, в основе которых лежала бы математически выраженная закономерность и это позволяло бы не только выполнить анализ, но и прогнозировать динамику ряда на будущее.

Значительно более совершенным приемом изучения общей тенденции в рядах динамики является аналитическое выравнивание . При изучении общей тенденции методом аналитического выравнивания исходят из того, что изменения уровней ряда динамики могут быть с той или иной степенью точности приближения выражены усредненно с помощью определенных математических функций. Путем теоретического анализа выявляется характер развития явления и на этой основе выбирается то или иное математическое выражение типа изменения явления: по прямой, по параболе второго порядка, показательной (логарифмической) кривой и т.п.


    1. ^ Трендовые модели временных рядов и МНК.

Уровни временных рядов формируются под совокупным влиянием множества длительно и кратковременно действующих факторов, в т.ч. различного рода случайностей. Изменение условий развития явления приводит к более или менее интенсивной смене самих факторов, к изменению силы и результативности их воздействия и, в конечном счете, к вариации уровня изучаемого явления во времени.

Динамика рядов экономических показателей в общем случае складывается из четырех компонентов :

1) тенденции, характеризующей долговременную основную закономерность развития исследуемого явления;

2) периодичного компонента, связанного с влиянием сезонности развития изучаемого явления;

3) циклического компонента, характеризующего циклические колебания, свойственные любому воспроизводству;

4) случайного компонента как результата влияния множества случайных факторов.

Тенденция - некоторое общее направление развития. Тенденцию ряда динамики представляют в виде гладкой кривой (траектории), которая аналитически выражается некоторой функцией времени, называемой трендом . Тренд характеризует основную закономерность движения во времени, свободную в основном (но не полностью) от случайных воздействий.

В зависимости от вида функции различают следующие основные формы тренда.

^ Линейная форма тренда:

y e = at + b , (11.1)

где у - уровни, освобожденные от колебаний, выровненные по прямой;

b - начальный уровень тренда в момент или период, принятый за начало отсчета времени;

а - среднегодовой абсолютный прирост (среднее изменение за единицу времени t; константа тренда).

^ Линейный тренд хорошо отражает тенденцию изменений при действии множества разнообразных факторов, изменяющихся различным образом по разным закономерностям. Равнодействующая этих факторов при взаимном погашении особенностей отдельных факторов (ускорение, замедление, нелинейность) часто выражается в примерно постоянной абсолютной скорости изменения, т.е. в прямолинейном тренде.

^ Параболическая форма тренда:

у = а + bt + ct 2 , (11.2)

где с - квадратический параметр, равный 1/2 ускорения; константа параболического тренда.

^ Параболический тренд выражает ускоренное или замедленное изменение уровней ряда с постоянным ускорением. Такой характер развития можно ожидать при наличии важных факторов прогрессивного (регрессивного) развития.

^ Экспоненциальная форма тренда:

где k - темп изменения в разах;

e - константа тренда.

Если k > 1, экспоненциальный тренд выражает тенденцию ускоренного и все более ускоряющегося возрастания уровней. При росте по экспоненте абсолютный прирост пропорционален достигнутому уровню. Так росло население Земли в эпоху «демографического взрыва» в XX столетии.

При k
^ Логарифмическая форма тренда:

y = а + b log(t) . (11.4)

Логарифмический тренд пригоден для отображения тенденции замедляющегося роста уровней при отсутствии предельного возможного значения.

Для определения параметров уравнения тренда применяют метод наименьших квадратов (МНК) . Применение МНК для определения параметров линейного тренда y e = at + b дает систему двух линейных уравнений, решение которой выбирается таким образом, чтобы Σ t = 0. В рядах с нечетным числом членов это выполняется при условии, что для центрального члена ряда t = 0 и вправо t - +1, +2, +3..., а влево: -1, -2, -3...

Пример 11.4 . Реализация молочной продукции в магазинах группы городов по кварталам 1995-1998 гг. характеризуется следующими данными:


Период

Реализовано продукции, тыс. тонн

1995 г.

I квартал

39,9

II квартал

65,5

III квартал

63,9

IV квартал

38,5

1996 г.

I квартал

38,1

II квартал

82,3

III квартал

83,4

IV квартал

45,1

1997 г.

I квартал

45,9

II квартал

101,5

III квартал

103,8

IV квартал

63,8

1998 г.

I квартал

55,7

II квартал

115,5

III квартал

121,7

IV квартал

65,5

^ Существенной особенностью данного ряда является наличие ярко выраженной тенденции роста. Темп роста (базисный относительно 1995 г.) t = 172,97%.

Во многих случаях, когда в рядах динамики наблюдаются явно выраженные периодические колебания, для описания тренда следует использовать

Из данной статьи вы узнаете:

Примеры применения логарифмического тренда в бизнесе;

Логарифмический тренд y(x)=a*ln(x)+b разложим на запчасти;

5 способов расчета значений логарифмического тренда в Excel ;

Как можно скорректировать значения логарифмического тренда;

Логарифмический тренд применяется для прогнозирования временного ряда, данные которого вначале быстро растут или убывают, а затем постепенно стабилизируются.

Например, выводим новый товар на рынок , за счет роста клиентской базы продажи быстро растут, затем мы набираем постоянных клиентов, продажи стабилизируются, и новые клиенты уже не основной фактор роста, а основной фактор роста - это развитие продаж постоянным клиентам.

Или вводим продукцию в новую торговую точку, и по истечении определенного периода решаем увеличить количество фейсов на полке (т.е. увеличить размер полки для одного вида товара) (фейс - это единица продукции, которая стоит лицом к покупателю) или продублировать выкладку в другой части зала. Почему здесь лучше использовать логарифм ? Потому что увеличение количества фейсингов на полке в 2 раза по одной группе товаров, к сожалению, не ведёт к увеличению продаж в 2 раза, причём с ростом количества фейсов темп прироста продаж уменьшаются для каждого последующего фейса. Именно поэтому для прогнозирования продаж для этой ситуации лучше всего использовать логарифмический тренд.

Логарифмический тренд – это функция y(x)=a*ln(x)+b, где

Значение x – это номера периода во временном ряду (например, номер месяца, квартала, дня; .)

y – это последовательность значений, которые мы анализируем и прогнозируем (например, объём продаж по месяцам.)

b – точка пересечения с осью y на графике;

a – это значение, на которое увеличивается следующее значение временного ряда;

Причем, если a>0, то динамика роста положительная,

Если а<0, то динамика тренда отрицательная.

При построении логарифмического тренда используют как положительные, так и отрицательные данные временных рядов.

Рассмотрим логарифмический тренд на примере построения прогноза продаж в Excel по месяцам.

Временной ряд - продажи по месяцам по новому товару

В этом временном раде у нас есть 2 переменных

1. Время - месяцы- x;

2. Объёмы продаж по месяцам - y;

Уравнение логарифмического тренда y(x)=a*ln(x)+b, где y - это объёмы продаж, x - месяцы.

5 способов расчета логарифмического тренда в Excel.

1-й способ - с помощью графика.

Строим график в Excel и видим по оси x - наш временной рад (1, 2, 3... - ноябрь, декабрь, январь...), по оси y объёмы продаж + добавляем на график линию тренда и уравнение тренда .

Получаем уравнение тренда y=2 673 493 ln(x) + 2 913 282

При расчете значений логарифмического тренда нам будут известны:

  1. Время - значение по оси Х;
  2. Значение "a" и "b" уравнения логарифмического тренда y(x)=a*ln(x)+b;

Рассчитываем значения тренда для каждого анализируемого периода времени от 1 до 13, а также для будущих периодов с 14 месяца до 20.

Например , для 14 месяца значение тренда рассчитывается по следующей схеме: в уравнение подставляем x=14 и получаем y=2 673 493 ln(14) + 2 913 282=9 968 782

20-го y=2 673 493 ln(20) + 2 913 282=10 922 350

2-й способ - с помощью функции Excel =Линейн().

Для расчета коэффициентов логарифмического тренда воспользуемся функцией Excel =ЛИНЕЙН() .

Для этого в функцию =ЛИНЕЙН() введем:

1. известные значения y – объем продаж;

2. известные значения x – номера периодов, причём введенные, как LN(номера периодов);

3. константа – вводим 1 для расчёта коэффициента b уравнения y(x)=a*ln(x)+b;

4. Статистика - 1 или 0;

Формула будит выглядеть вот так =ЛИНЕЙН(C2:O2;LN(C1:O1); ИСТИНА;ИСТИНА)


Теперь формулу вводим как формулу массива, выделяем 2 ячейки и нажимаем F2, а затем одновременно - клавиши CTRL + SHIFT + ВВОД.

Коэффициенты «а» и «b» логарифмического тренда y(x)=a*ln(x)+b рассчитаны;

Получаем уравнение тренда y=2673492*ln(x)+2913281

Для прогнозирования нам необходимо продлить линию тренда и определить её значения. При её продлении нам будет известен только один параметр - это время, т.е. значения по оси X.

Рассчитываем значения тренда с 1-го месяца (ноябрь) до 20 (июнь)- y=2673492*ln(14)+2913281=9968782

17-го - y=2673492*ln(17)+2913281=10487857

3-й способ - с помощью функции Excel =ТЕНДЕНЦИЯ().

Расчет значений логарифмического тренда с помощью функции Excel =ТЕНДЕНЦИЯ().

Для этого в функцию =ТЕНДЕНЦИЯ() вводим:

1. Известные значения y - объёмы продаж за анализируемый период;

2. Известные значений x - порядковые номера периодов (месяцев), причем введенные как LN(Известные значений x);

3. Новые значения x- порядковые номера периодов, для которых хотим рассчитать значения трендов, причем введенные как LN(Новые значения x);

4. Константа - ставим «1», если хотим рассчитать значения тренда y(x)=a*ln(x)+b с коэффициентом b.

Формула будет выглядеть вот так =ТЕНДЕНЦИЯ(C4:O4;LN(C2:O2);LN(Q2:W2); 1)

Затем, вводим формулу =ТЕНДЕНЦИЯ(), как формулу массива . Для этого

1. Выделяем диапазон ячеек с 1-го по 20-й период, в первой ячейке введена формула =ТЕНДЕНЦИЯ();

2. Нажимаем F2, а затем одновременно - клавиши CTRL + SHIFT + ВВОД.

Значения логарифмического тренда с помощью формулы Excel =тенденция() рассчитаны .

4-й способ - функция Excel =предсказ().

Расчёт значений логарифмического тренда - с помощью функции Excel

Для этого вводим в функцию =предсказ(

1. X - номер периода, для которого рассчитываем прогноз, причем вводим как LN(x);

2. Известные значения y - объёмы продаж по месяцам, фиксируем диапазон , выделяем его и нажимаем F4. Получаем ссылку, как на картинке:

3. Известные значения x - порядковые номера периодов , для которых хотим рассчитать значения логарифмического тренда, причем вводим как LN(Известные значения x) + фиксируем выделенный диапазон, выделяем его и нажимаем F4;

Получаем формулу =ПРЕДСКАЗ(LN(Q2); $C$4:$O$4;LN($C$2:$O$2))

Протягиваем формулу, значения логарифмического тренда рассчитаны .

5-й способ - Forecast4AC PRO

Расчет значений логарифмического тренда - с помощью программы Forecast4AC PRO .

1. Устанавливаем курсор в начало временного ряда, выбираем в настройках программы:

Что рассчитываем - значения тренда;

Тренд – Логарифмический тренд;

Временной ряд - месячный;

и сохраняем;

2. Заходим в меню программы и нажимаем «Start_Forecast» - готово, значения логарифмического тренда рассчитаны!

Коэффициенты сезонности рассчитаем с помощью программы Forecast4AC PRO (лист " Лист2FYMLn ") или по аналоги, только для рассчета коэффициентов сезонности вместо линейного тренда используем логарифмический.

Теперь значения тренда умножаем на коэффициенты сезонности и прогноз готов .

Отношение прогноза к предыдущему периоду получилось 116%, т.е. прогнозируется рост на 16%.

Как мы можем скорректировать прогнозные значения логарифмического тренда?

Если нас рост не устраивает, и мы планируем, что он будет больше, мы можем увеличить рост, скорректировав коэффициенты логарифмического тренда.

Скорректируем значение "a" и "b" рассчитанного нами выше тренда y=2673492*ln(x)+2913281

При изменении значений «a» и «b» логарифмического тренда y(x)=a*ln(x)+b, получаем увеличение значений тренда, причем увеличение коэффициента "а" на 10% даёт больший рост, чем увеличение коэффициента «b» на 20%.

Теперь рассчитаем коэффициенты сезонности для логарифмического тренда с помощью Forecast4AC PRO (лист " Лист2FYMLn "). Умножим скорректированные значения тренда на сезонность . Также при прогнозировании стоит учесть дополнительные факторы, которые значительно влияют на объём продаж. Прогноз продаж готов!

С помощью программы Forecast4AC PRO вы сможете в Excel одним нажатием клавиши рассчитать значения логарифмического тренда, коэффициенты сезонности и прогноз для более чем 5000 строк одновременно.

Точных вам прогнозов!

Присоединяйтесь к нам!

Скачивайте бесплатные приложения для прогнозирования и бизнес-анализа :


  • Novo Forecast Lite - автоматический расчет прогноза в Excel .
  • 4analytics - ABC-XYZ-анализ и анализ выбросов в Excel.
  • Qlik Sense Desktop и QlikView Personal Edition - BI-системы для анализа и визуализации данных.

Тестируйте возможности платных решений:

  • Novo Forecast PRO - прогнозирование в Excel для больших массивов данных.

Новое на сайте

>

Самое популярное