Программный продукт для обработки информации тремя статистическими методами. С помощью корреляционного анализа, дисперсионного анализа, а также анализа рядов динамики
Постановка задачи.
Назначение и возможности программного продукта.
Описание структуры исходных данных и результатов.
Описание основных алгоритмов расчета.
Описание процесса управления работой программного продукта.
Контрольный пример.
Инструкция по использованию разработанного программного продукта.
Заключение и выводы.
Постановка задачи
Данный программный продукт разработан для обработки информации тремя статистическими методами. С помощью корреляционного анализа, дисперсионного анализа, а также анализа рядов динамики.
Программный продукт работает в рамках программы Excel. Причем желательно использовать версию 5.0, т.к. в остальных версиях он может работать некорректно.
Назначение и возможности программного продукта
Назначением любого программного продукта является облегчение работы с громоздкими базами данных, со сложными статистическими или другими методами обработки информации, а также облегчение восприятия пользователем выводимых программой результатов. ППП помогает более четко выделить границы требований предъявляемых пользователю при работе с ним, обеспечивает доступный контроль производимых вычислений и обработки полученных результатов с помощью меню, диалоговых окон, кнопок быстрого доступа, отбора, контроля и др.
Данный программный продукт предназначен для обработки вводимой информации следующими статистическими методами :
Корреляционный анализ.
С помощью него изучается теснота связи между признаками. В нашем случае имеется два фактора и результативный показатель. Для расчета ожидаемых значений результативного признака используется уравнение множественной регрессии. Коэффициенты корреляции характеризуют тесноту связи между признаками. Изучается теснота связи между факторами и результативными признаками.
Дисперсионный анализ.
Программный продукт позволяет найти общую дисперсию как сумму остаточной дисперсии, дисперсии взаимодействия факторов, а также факторов I и II и факторов 1,2,3 и дисперсии повторений.
Анализ рядов динамики.
Программный продукт производит выравнивание ряда динамики с помощью наименьших квадратов. Этот метод заключается в отыскании уравнения кривой, которая наиболее точно отражала бы основную тенденцию изменения уровней в зависимости от времени. Параметры уравнения находят способом наименьших квадратов. Программный продукт осуществляет выравнивание динамического ряда по прямой y=a+b*t и по параболе y=a+b*t+c*t^2.
Для начала работы с каким-либо статистическим методом, предусмотренным в программе необходимо нажать одноименную кнопку в главном меню.
Для удобства работы с любым статистическим методом на каждом листе данной программы имеется набор кнопок.
Кнопка «Ввод».
Имеется в каждом из трёх статистических анализов. Она выполняет следующие операции:
a) Снимает защиту с листа
b) Скрывает всю ненужную на данный момент информацию
c) Удаляет исходные данные предыдущей задачи
d) Раздвигает строки
e) Снимает блокировку с тех ячеек, куда будет осуществляться ввод
f) Ставит курсор в левый верхний угол поля ввода
g) Восстанавливает защиту листа
Кнопка «Результат».
Предназначена для вывода результатов обработки введенной информации и выполняет следующие операции:
a) Снимает защиту с листа
b) Показывает строки и столбцы с результатами вычислений
c) Блокирует ячейки с исходными данными
d) Восстанавливает защиту листа
Кнопка «Корректировка».
Обеспечивает возможность исправления не верно введенных исходных данных:
a) Снимает защиту с листа
b) Снимает блокировку ячеек, в которых содержатся исходные данные
c) Ставит курсор в левый верхний угол поля ввода
Кнопка «Восстановить».
Позволяет проводить контроль исходных данных, а также контроль всех вычислений, осуществляемых программой.
a) Снимает защиту с листа
b) Показывает все скрытые строки и столбцы (для контроля производимых программой расчётов)
Кнопка «Скрыть»
Предназначена для скрытия восстановленных с целью контроля за вычислениями строк и столбцов.
a) Снимает защиту с листа
b) Скрывает строки и столбцы с производимыми вычислениями
Кнопка «Печать».
Обеспечивает вывод исходных данных и результатов на печатающее устройство.
Корреляционный анализ.
При нажатии кнопки «Ввод» появится окне диалоговое окно, где нужно указать количество строк таблицы (не менее 10) и нажать кнопку «Ок» Затем необходимо ввести в таблицу значения результативного признака в графу «Z», значение первого фактора «X1» и значение второго фактора «X2».
Дисперсионный анализ.
В таблице исходных данных каждая градация фактора А включает в себя градации фактора В. В таблице 6 строк и 6 столбцов. После нажатия кнопки «Ввод» диапазон ввода исходных данных очищается, и можно вводить другие данные. Необходимо помнить, что исправить уже введенные данные можно с помощью кнопки «Корректировка».
Анализ рядов динамики.
После нажатия кнопки «Ввод» появится диалоговое окно, в котором нужно указать количество наблюдений (лет) и номер года, с которого будет производиться отсчет. После нажатия кнопки «Ок» в пустые ячейки нужно ввести исходные данные отражающие значение признака.
Формы представления результатов.
Для корреляционного анализа результатами являются:
* Коэффициенты парной корреляции и множественной регрессии;
* Корреляционная матрица.
Для двухфакторного дисперсионного анализа результаты оформляются в виде таблицы. Первая графа содержит название дисперсии в зависимости от источника вариации, вторая – значение дисперсии, а третья - число степеней свободы.
Для анализа рядов динамики результатами будут:
* График, в котором построены фактические значения, а по ним прямая и парабола;
* Коэффициенты для уравнения прямой и параболы.
Описание основных алгоритмов расчета.
Алгоритм статистического анализа.
Корреляционный анализ. В таблицу вводят значения результативного признака (Z) и двух факторов (X1 и X2). В скрытых столбцах рассчитываются значения X1*X1, X2*X2, Z*Z, произведения X1*Z, X2*Z, расчетное значение результативного признака (Z1) , разность (Z-Zсред), (Z-Zсред)^2, разность (Z1-Z1сред), а также ее квадрат. Находятся простые средние значения результативного признака фактические и расчетные. Чтобы найти Z1, необходимо подставить значения факторов в уравнение множественной регрессии. Z1=a0+a1*X1+a2*X2 Коэффициенты а0, а1, а2 находим из системы уравнений методом Гаусса.
?Z=a0n+ a1?X1+a2?X2
?ZX1= a0?X1+a1?X1X1+a2?X1X2
?ZX2=a0?X2+a1?X1X2+a2?X2^2
Коэффициент множественной регрессии находим по формуле Rмн=?Dy1/Dy2, где Dy1=?(Y1-Yсред)^2/N, а Dy=?(Y-Yсред)^2/N.
Коэффициент парной регрессии
Rx1x2=(?X1X2 - ?X1*?X2/N)/((?X1^2-(?X1*?X1/N)*(?X2^2 – (?X2*?X2/N))).
Аналогично рассчитываются Rzx1 и Rzx2.
Дисперсионный анализ.
Находим средние по строкам и столбцам заполненной таблицы, среднее по всей таблице и средние I II и 1,2,3 факторов.
Дисперсия по повторения находится следующим образом: вычисляется разность средних по повторениям и общей средней; находим квадрат полученного числа; находим сумму квадратов и умножаем ее на произведение количества градаций фактора А, на количество градаций фактора В. Аналогично находится дисперсия по фактору I II и фактору 1,2,3. Общую дисперсию находят по формуле ?(Y-Yср)^2/N. Остаточную как разность общей дисперсии и суммы дисперсий по повторениям, по фактору I II , фактору 1,2,3 и взаимодействия.
Анализ рядов динамики.
В таблицу вводятся значения года и фактическое значение анализируемого показателя (X). В скрытых столбцах рассчитывается произведение xt, где t- порядковый номер значения, далее рассчитываются t^2, t^3, t^4 и xt^2. Находят суммы этих столбцов. Уравнение прямой выглядит следующим образом y=a+bt. Коэффициенты а и b находим из системы
?X=an+b?t
?xt=a?t+b?t^2
рассчитываем коэффициенты, используя метод Гаусса.
Уравнение параболы y=a+b*t+ct^2. Коэффициенты a, b,c находим из системы
?x=an+ b?t+c?t^2
?xt=a?t+b?t^2+c?t^3
?xt^2=a?t^2+b?t^3+c?t^4
Описание процесса управления работой программного продукта.
Система меню представляет собой стандартный интерфейс, предлагаемый средствами Excel. Это набор псевдокнопок и диалоговых окон, используемых для получения вводной или исходной информации от пользователя.
Главное меню находится на листе Меню. В нем можно выбрать статистический метод.
Главное меню:
При нажатии кнопки с названием статистического метода, интересующего нас, мы переходим на лист с соответствующим названием. Эти листы находятся в файле Курсовая.xls. На каждом из этих листов ввод данных осуществляется с клавиатуры. Для этого создано меню, одинаковое для каждого из листов.
При нажатии кнопки ввод на листе
Корреляционный анализ появляется диалоговое окно, в котором нужно указать количество строк таблицы.
Дисперсионный анализ. Данные вводятся в таблицу, размерность которой не меняется.
Анализ рядов динамики в появившемся диалоговом окне следует ввести количество лет наблюдений (минимум 10) и номер года, от которого начинается отсчет.
С кнопкой Меню связан макрос перехода на лист с главным меню.
Контрольный пример
Для проверки работы и отладки каждого статистического метода использовался свой контрольный пример.
Базисные значения исходных данных, а также результаты расчетов при базисных значениях для каждого из статистических методов отражены в приложении. Получение базисных результатов контрольного примера проводилось в течение семестра под руководством преподавателя и сверялось с результатами работы ППП STRAZ.
Инструкция по использованию разработанного программного продукта.
Корреляционный анализ. Выберите в главном меню «Корреляционный анализ». На листе Корреляционный анализ, на который вы при этом перейдете нажмите кнопку «Ввод». На экране появится диалоговое окно, в котором вам необходимо будет указать количество строк таблицы. Затем в ячейки, предназначенные для ввода исходных данных, можно будет вводить соответствующие значения. В режиме ввода значения можно корректировать, установив курсор на ячейку с неправильными значениями и щелкнув два раза кнопкой мыши. По окончании ввода, чтобы просмотреть результаты анализа необходимо нажать кнопку «Результаты». Если данные требуют корректировки, нажмите кнопку «Корректировка» и внесите необходимые изменения. Чтобы просмотреть как выглядят исходные данные и результаты на листах для вывода на печать, нажмите кнопку «Печать». Если вам понадобятся промежуточные результаты расчетов необходимо нажать кнопку «Восстановить». Если вы закончили работу с анализом рядов динамики, нажмите кнопку «Меню» вы попадаете в главное меню.
Дисперсионный анализ. Все действия осуществляются аналогично корреляционному анализу. Но размер таблицы изменить нельзя, данные вводятся в пустые ячейки сразу же после нажатия кнопки «Ввод».
Анализ рядов динамики. Выбрав в главном меню «Анализ рядов динамики». Далее все действия выполняются аналогично корреляционному анализу, но в появившемся диалоговом окне указывается не только количество строк таблицы, но и значение первого года.
Для завершения работы с программой нужно выйти в главное меню и нажать на кнопку «Выход», если в программе были произведены изменения, будет выведен запрос о их сохранении. Можно воспользоваться этим запросом для сохранения ценной информации, или нажать кнопку «Отмена».
Заключение и выводы.
Данная программа позволяет облегчить работу пользователя при работе с тремя видами статистического анализа, оптимизировать ввод, контроль, а также вывод результатов расчетов.
Вообще, табличный процессор Excel фирмы Microsoft является мощным средством работы с массивами данных любого размера. А так же имеет очень много возможностей по обработке данных. К сожалению, программа нашего курса не сможет рассмотреть все аспекты работы, но, тем не менее, толчок был дан и если человека заинтересуют эти возможности, он найдёт способ изучить их.
Пакеты прикладных программ на базе Excel удобны и просты в применении, а так же и в написании, что делает их привлекательными.