Априорный анализ и его роль в статистическом моделировании

Оценка эффективности и деловой активности субъектов экономического процесса и состояния социальной инфраструктуры общества во многом зависит от качества статистического анализа эмпирического материала, от того, насколько точно будут выявлены и научно обоснованны закономерности и тенденции развития.

Основные трудности, связанные с применением количественных математико-статистических методов, заключаются в том, что они достаточно нейтральны к исследуемым социально-экономическим явлениям и процессам.

Поэтому основным этапом проведения статистического исследования на информационной базе, характеризующей реальные социально-экономические явления, является критическая оценка исходных данных с точки зрения их достоверности и научной обоснованности, которая в статистическом моделировании реализуется методами априорного анализа, включающего в себя:

· выявление экономически обоснованных и существенных причинно-следственных связей между признаками и явлениями;

· оценку однородности исследуемой совокупности;

· анализ характера распределения совокупности по изучаемым признакам.

Понятия и категории, используемые при проведении анализа статистическими методами, должны быть точно определены.

Необходимо четко определить, к какому моменту или периоду времени относится исследуемое явление или процесс.

Одной из основополагающих предпосылок проведения научно-обоснованного статистического анализа, адекватно отражающего причинно-следственные связи и зависимости, тенденции развития реальных явлений и процессов в динамике, является однородность статистической совокупности.

Анализ однородности статистической совокупности целесообразно проводить в следующей последовательности:

· определение степени однородности всей совокупности по одному или нескольким существенным признакам;

· определение и анализ аномальных наблюдений;

· выбор оптимального варианта выделения однородных совокупностей.

В статистической теории и практике разработаны различные подходы к оценке степени однородности.

Проблемой оценки однородности совокупности занимались такие известные ученые, как Ю. Аболенцев, Г. Кильдишев, В. Овсиенко и другие.

Наиболее сложным и дискуссионным является вопрос о способах и критериях выделения однородных групп объектов в пределах исходной совокупности.

Важной предпосылкой получения научно-обоснованных результатов статистического анализа и моделирования является проверка гипотезы о близости распределения эмпирических данных нормальному закону. Для нормального закона распределения характерно:

;A_s = 0; E_x = 0

Одним из недостатков данного подхода к оценке характера распределения является наличие субъективности в анализе достаточности величины отклонения от M_e и M_o от M_e для подтверждения гипотезы.

Любая исследуемая совокупность, наряду со значениями признаков, сложившихся под влиянием факторов, непосредственно характерных для анализируемого объекта, может содержать и значения факторов, полученных под воздействием иных факторов, не характерных для изучаемого объекта, так называемых аномальных наблюдений.

Такие значения резко отличаются от других значений в исследуемой совокупности и, следовательно, использование методологии статистического анализа без изучения аномальных наблюдений приводит к серьезным ошибкам.

Причинами появления в совокупности аномальных наблюдений могут быть ошибки, которые возникают при измерении и передаче информации, агрегировании показателей и так далее. Такие нехарактерные аномальные значения подлежат устранению и Половников В.А. в своей работе, такие наблюдения называет ошибками первого рода. В изучаемой совокупности так же аномальные наблюдения могут возникать из- за воздействия на экономический процесс факторов, объективно существующих, но которые проявляют свои экстремальные воздействия крайне редко. Эти ошибки исследователи относят к ошибкам второго рода и считают, что устранять их при анализе совокупности не следует. Таким образом, причины появления в совокупности аномальных наблюдений можно условно разделить на две группы:

1. Внешние, возникающие в результате технических ошибок (ошибки первого рода).

2. Внутренние, факторы объективно существующие в совокупности ( ошибки второго рода).

Существует ряд методов выявления и устранения аномальных наблюдений

Выбор того или иного метода выявления и анализа аномальных наблюдений определяется объемом совокупности, характером исследуемых процессов и задачами анализа.

При анализе динамической или статической информации, наиболее широкое применение получил метод выявления аномальных наблюдений, основанный на определении q – статистики, предложенный в работе Хан Г. и Шапиро С.:

(1.1)

где:

y_t – отдельные уровни ряда;

– средний уровень ряда;

σ_y– среднеквадратическое отклонение эмпирических значений уровней ряда от их среднего уровня.

Если для расчетного значения выполняется неравенство:

q_t ≥ q_кр (р) (1.2)

с заранее заданным уровнем вероятности, то данное наблюдение считается аномальным и, после экономического анализа причин ошибок аномальности, подлежит замене скорректированным значением (в случае ошибки «I») и не подлежат корректировке (в случае ошибки «II»).Если же аномальное значение получилось из-за ошибок первого рода, то рассчитывают его новое значение по следующему алгоритму:

1. Рассчитывается новое значение yi¢по формуле :

yi¢=qa ×sy +`y(1.3)

2. В исходном ряду уровень yiзаменяется на yi¢и вычисляются новые характеристики ряда `yi¢и sy¢и величину yi¢¢по формуле (1.3):

3. Вычисляется очередное новое значение данного уровня:

yi¢¢=qa ×sy¢¢ +`y¢ (1.4)

4.Производится сравнение

½ yi¢ - yi¢¢½£ e(1.5).

ε – заданный уровень точности определения .

Если данное условие выполняется, то значение является скорректированным, не аномальным значением, занимает место в ряду и анализу подвергается .

Если условие не выполняется, то рекомендуется рассчитать и проверить на аномальность.

Процесс корректировки носит итерационный характер.

В анализе временных рядов наибольшее распространение получил метод Ирвина, основанный на определении λ – статистики. При его использовании выявление аномальных наблюдений производится по формуле:

(1.6)

Если расчетное значение превысит уровень критического (с заданным уровнем точности и числом наблюдений) (таблица 1.1), то расчетное значение признается аномальным.

Схема реализации данного метода аналогична предыдущей с той лишь разницей, что заменяется на y_t_-1(предыдущее значение уровня ряда).

Способ, основанный на расчете q – статистики применим для относительно стационарных рядов, так как при использовании для анализа временных рядов, имеющих ярко выраженную тенденцию, он приводит к ошибкам.

Таблица 1.1

Табулированные значения λ_t

Число наблюдений	λ_кр
0,95	0,99
	2,8 2,2 1,5 1,3 1,3 1,1 1,0	3,7 2,9 2,0 1,8 1,7 1,6 1,5

Более корректным методом выявления аномальных наблюдений, по мнению авторов ХанГ., Шапиро С., является использование статистики, в которой определяются отклонения от теоретических значений, полученных по уравнению тренда :

(1.7)

В общем виде, схему градации статистических методов выявления аномальности в исходных данных можно представить следующим образом (рис. 1.1).

Основной задачей статистического исследования на этапе априорного анализа является выделение однородных групп (даже аномальных). В данном случае эффективно применять в анализе комбинационные группировки с развернутым сказуемым.

Рис. 1.1. Методы анализа аномальных наблюдений

Раздел II

5rik.ru

Материалы для учебы и работы

Априорный анализ и его роль в статистическом моделировании