4.1 Методы обработки данных
К оглавлению1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 18 19 20 21 22 23 24 25 26 27
Такие важные для анализа рынка недвижимости величины, как цена группы объектов, время экспозиции и др., называют случайными величинами. Методами изучения случайных величин занимается теория вероятностей и математическая статистика.
Случайная величина (СВ) - это такая величина, которая может принимать различные значения под воздействием случайных (неконтролируемых, нерегулируемых) факторов.
Случайная величина может изменяться также под воздействием неслучайных факторов. Например, цена объекта недвижимости изменяется в Зависимости от его размера или удаления от центра города. Однако, в ряде случаев закономерность таких изменений неизвестна, или конкретная задача не требует ее учета. Тогда и эти факторы относят к разряду случайных.
Генеральная совокупность значений СВ - это совокупность всех значений, которые она может принять под воздействием случайных факторов. Например, стоимость всех квартир жилищного фонда города в определенный момент времени, или все цены сделок в городе за определенный период времени.
Генеральная совокупность может разделяться на группы (подсовокупности) по определенному признаку (неслучайному фактору). Например, жилой фонд и сделки - по районам (зонам) города, типам домов, числу комнат. Доля подсовокупностей каждого типа характеризует структуру генеральной совокупности.
Структура генеральной совокупности - это доля (процентный состав) в ней подсовокупностей, выделенных по одному или нескольким признакам. Генеральная совокупность может также разделиться на выборки.
Выборка - это несколько Значений СВ, выбранных из генеральной
совокупности по случайному признаку.
Например, все проданные за определенный период квартиры в городе являются выборкой из жилфонда; квартиры, проданные той или иной фирмой, являются выборкой из жилфонда и также из всех квартир, проданных в городе.
Выборка по своей структуре может отличаться от генеральной совокупности. В этом случае говорят, что она нерепрезентативна относительно генеральной совокупности.
Репрезентативность (представительность) выборки - это ее достаточно близкое соответствие генеральной совокупности по основным характеристикам (прежде всего структуре).
Случайная величина (как ее генеральная совокупность, так и выборка) описывается различными способами. Первый да них это построение функции распределения, например, в виде гистограммы. Гистограмма - это представление СВ в виде столбчатого графика, отражающего долю (количество) попаданий СВ в различные диапазоны ее значений.
Другой способ описания СВ - это определение ее параметров, характеризующих среднее значение и разброс СВ вокруг среднего.
Значения средних и рассеяния, определенные для выборки и для генеральной совокупности, могут отличаться. Это отличие трактуется как ошибка в определении параметров генеральной совокупности по параметрам выборки.
Ошибка складывается из двух частей.
Первая — это систематическая ошибка, зависящая от степени репрезентативности выборки.
Вторая - это случайная ошибка, зависящая от объема выборки, Для различения параметров генеральной совокупности и выборки им иногда присваивают различные имена.
В качестве среднего значения СВ могут использоваться различные величины, например, медиана, мода, среднее арифметическое выборки (математическое ожидание генеральной совокупности).
Медианное значение СВ - это одно из ее значений в выборке, относительно которого половина значений превышает медианное, а другая половина не превышает. Разброс (рассеяние) СВ может оцениваться различными величинами, например, размахом (диапазоном разброса), дисперсией или среднеквадратическим отклонением, доверительным интервалом. Размах СВ - это разность между максимальным и минимальным ее значением.
Дисперсия (среднеквадратическое отклонение - СКО) СВ - это расчетная величина, определяемая по специальной формуле и характеризующая степень отклонения каждого из значений СВ от среднего. Среднеквадратическое отклонение генеральной совокупности обозначается греческой буквой «сигма», выборки — латинской «s».
Доверительный интервал — это размах СВ, определенный не по всем ее значениям, а по заданной доле значений, примыкающих к среднему. Доля значений, по которой определяется доверительный интервал, называется доверительной вероятностью. Выбор того или иного показателя определяется решаемой задачей. На практике может потребоваться любая из них.
Простейшей задачей, которую можно решать с использованием данных о ценах на единичные квартиры Ц1, Ц2 и т.д., накопленных за определенный промежуток времени, является определение средней цены Цср. по формуле среднего арифметического:
Цср.=(Ц1+Ц2+...+Цn)/n (1)
где n - число накопленных значений цен (объем выборки).
Для перехода к расчету средней цены
Сср.=(Ц1+Ц2+...+Цn)/(П+П2+...+Пn) (2)
Иногда удобнее применять равноценную формулу
Сср.=(С1+С2+...+Сn) (3)
где С1, С2 и т.д. — цена
С1=Ц1/П1ит. д.;
П1 и т.д. - общая площадь квартиры.
Пользуясь данными таблиц по ценам на квартиры за февраль, март и апрель 2006 года рассчитаем по формуле 2 среднюю стоимость одного квадратного метра для однокомнатных двухкомнатных и трехкомнатных квартир в рассматриваемых районах города.
Таблица — «Определение средней стоимости одного кв.м. квартир»
Период времени |
Район |
Кол-во комнат |
∑Цi |
∑Пi |
|
Февраль |
«Сода» |
1 |
9715 |
961,7 |
|
2 |
9620 |
986,6 |
|||
3 |
8670 |
886,2 |
|||
пр. Октября
|
1 |
10540 |
1086,2 |
||
2 |
14250 |
1429 |
|||
3 |
13730 |
1365,3 |
|||
Март |
«Сода» |
1 |
15840 |
1544,5 |
|
2 |
10960 |
1084,3 |
|||
3 |
12040 |
1277,8 |
17,76 19,48 15,29 15,49 18,58 15,46 17,07 18,36 16,19 16,92 |
||
пр. Октября
|
1 |
15640 |
1586,8 |
||
2 |
15240 |
1577,3 |
|||
3 |
14250 |
1474,3 |
|||
Апрель |
«Сода» |
1 |
14150 |
1431 |
|
2 |
13550 |
1376,2 |
|||
3 |
13500 |
1390,8 |
|||
пр. Октября
|
1 |
17860 |
1744,2 |
||
2 |
18000 |
1893,9 |
|||
3 |
17140 |
1781 |
Аналогично рассчитываются среднемесячные значения времени экспозиции и другие средние величины.
Выделение подвыборок цен для отдельных категорий квартир и зон города позволяет сузить разброс цен в выборке и создает предпосылки для изучения влияния параметров квартир одной категории на их цену.
Наличие нескольких выборок объемом пj, выделенных по
признаку типа жилья (хрущевки, стандартные квартиры, улучшенной планировки и
т.д.), либо размера (однокомнатные, двухкомнатные и т.д.), либо района
расположения (центр, вблизи центра, окраины), либо по сочетанию признаков позволяет
получить среднее значение цены
Сср.=(Сср.1×n1+Сср.2×n2+...+Сср.j×nj+...+Сср.m×nm)/n, (4)
где m - число выборок (выделенных категорий жилья).
Применение формулы не только облегчает расчеты при определении средней цены продажи или покупки квартир в городе, но и позволяет расширить круг решаемых задач.
Набор значений объемов выборок (n1, ..., nj, ..., nm)
характеризует структуру оцениваемой генеральной совокупности. Если известна
структура таких совокупностей, как жилищный фонд города; или приватизированный
жилой фонд, или вновь строящийся жилой фонд, то при наличии данных по средней
цене сделок в каждой категории квартир можно рассчитать среднюю цену
Другой пример проанализирован экспертами Агентства ТИТАН (Тверь) в отчете за 1995 год. Обнаружив парадоксальный факт превышения средней цены сделок над средней ценой предложения (при равенстве либо обратном соотношении индивидуальных цен); они правильно его объяснили различием в структуре совокупностей предлагаемых к продаже и проданных квартир.
Оценка дисперсии и среднеквадратического отклонения выборки производится по формулам (исключение выскакивающих значений)
s2 =(Сi-Сср) /(n-1), s=√ s2 (5)
После определения дисперсии необходимо исключить из выборки крайние (справа и слева) «выскакивающие» значения, и заново рассчитать параметры выборки. При этом используется«правило трех сигм»: исключаются значения, лежащие за пределами доверительного интервала в плюс/минус три среднеквадратических отклонения. Это соответствует доверительной вероятности 0,98 (т.е. исключаются из рассмотрения примерно 2% крайних значений). Применяются и более жесткие критерии, например, две сигмы (доверительная вероятность 0,95).
При отсутствии на фирме специалистов, владеющих методами математической статистики или соответствующими компьютерными программами, руководитель фирмы может грубо оценить величину разброса по формуле:
s=(Сmax-Сmin)/6, (6)
где Сmax, Сmin - максимальное и минимальное значения цен в выборке (за исключением "выскакивающих" значений).
Среднее значение случайной величины по данным репрезентативной выборки значений всегда рассчитывается с погрешностью, величина которой зависит от двух. факторов собственного разброса значений в выборке и ее объема. Если разброс измерен величиной среднеквадратического отклонения s, то приближенная оценка погрешности в определении средневыборочного при доверительной вероятности 0,95 равна:
(7)
Из формулы следует, что погрешность в определении среднего обратно пропорциональна корню квадратному из объема выборки и пропорциональна ее собственному разбросу. Наличие данных о погрешности в определении средних цен позволяет при сравнении двух выборок (например, по двум различным районам, или категориям квартир, или за два различных месяца) использовать следующее правило: выборки считаются различающимися незначимо, если разность их средних меньше суммы половины погрешностей. Например, при разнице средних в феврале и марте на 3,5% и погрешности в их определении +\-4% нельзя говорить о росте цен в феврале.
На практике используются два способа привязки данных к моменту времени: «на заданный момент времени» и «за определенный период времени» Общее правило состоит в том, что применение того или иного способа должно строго увязываться с характером данных. Так, данные о структуре жилфонда требуют первого способа, а данные о средней цене сделки - второго. Существуют и данные, которые могут описываться обоими способами, но при этом меняется их трактовка. Так, выражение «средняя цена предложения на 1.01.06» означает, что при расчете этой величины использовались все предложения, содержащиеся в листинге фирмы на эту дату, а выражение «средняя цена предложения за декабрь 05» - только предложения, поступившие за декабрь.
Исходя из изложенного, часто встречающееся в публикациях выражение «средняя цена квартир в городе N на 1.01.06» не имеет смысла, т.к. в нем нарушено правило об уточнении понятия цены (следует писать «средняя цена предложения квартир»); если же имелись в виду цены сделок, то следует писать «средняя цена сделок за 31.12.05» (если осреднялись сделки за один день), или «за 12.05» (если осреднялась выборка за месяц).
Первый вариант вряд ли реален, поскольку выборка сделок за один день слишком мала. Таким образом, следующее правило требует фиксировать (пояснять) используемый способ привязки средних данных к определенному моменту времени.
Наличие достаточно большой последовательности помесячных (понедельных) данных о средних значениях изучаемых показателей (динамического ряда) позволяет построить график изменения показателя во времени; первым шагом при этом является построение ломаной линии, проходящей через отмеченные точки на графике. Однако, останавливаться на этом шаге и делать выводы об изменении показателя за месяц, квартал, год по разности значений точек можно лишь при достаточно большом объеме выборок, когда для каждой пары точек всего ряда соблюдается следующее правило:
С2>С1+D,
где С2, С1 - большее и меньшее значения показателя.
В противном случае необходимо сделать второй шаг - сглаживание ряда. Правило сглаживания состоит в том, что следует провести (хотя бы от руки) плавную линию так, чтобы близкие точки отклонялись от нее примерно на равные расстояния. Желательно выполнить эту операцию более строго, проведя аппроксимацию полученной кривой одной из простейших функций (например, полиномом невысокого порядка) и определив ее коэффициенты специальными методами математической статистики, например, методом наименьших квадратов.
Дальнейшее правило состоит в том, что проценты, прироста или снижения показателей за определенный период вычисляются по точкам кривой, а не по фактическим значениям, и точность их при этом повышается.
Полученная согласно правилам аппроксимационная кривая представляет собой простейшую модель исследуемого процесса. Однако использовать ее для целей прогнозирования возможно лишь на коротком участке (один-два месяца), и лишь когда изменения тенденций не ожидается.
Более глубокий анализ и прогноз возможен, когда математическая модель процесса построена на основе выявленных закономерностей протекания исследуемого процесса. Такими закономерностями являются, например, общая закономерность s-образного роста цен на жилье при переходе от централизованной к рыночной экономике и корреляционная связь между темпами роста курса доллара к рублю и рост долларовых цен на жилье. В результате получена двухпараметрическая модель вида:
Ц(Т)=А/(1+ехр(В+СТ)) + кх(Т) + еrr,
где Ц — цена
Т — порядковый номер месяца;
А, В, С, к — постоянные коэффициенты (параметры модели);
х — прирост месячных темпов девальвации.
Построенная на их основе математическая модель процесса изменения цен на жилье в Москве, Барнауле, Рязани успешно использовалась для прогноза цен на год вперед.
Финансовая доступность жилья на рынке для населения - показывает, сколько. лет среднестатистическая семья или домохозяйство; того или иного города России должна откладывать весь свой суммарный годовой денежный доход (в другом варианте - всю заработную плату всех работающих членов семьи за год), чтобы купить на первичном или вторичном рынках жилья стандартную двухкомнатную квартиру.
В качестве стандартной, в соответствии с методикой Всемирного Банка и Хабитата ООН, для России выбрана двухкомнатная квартира. Такие квартиры составляют до 45 % от общего числа жилищных единиц практически каждого российского города.
Стандартная квартира характеризуется следующими признаками:
— расположена в районах города, прилегающих к его центру (но не в самом центре и не на окраине) - так называемое «второе кольцо».
— находится в многоэтажном панельном доме стандартной планировки (девяти - или двенадцатиэтажный дом), имеет кроме 2 комнат, кухню, санузел, холодное и горячее водоснабжение газовую или электроплиту.
— общая площадь - 48 кв.м.
Средняя цена стандартной квартиры на первичном и вторичном рынках жилья в городах определяется по данным риэлтерских фирм либо может быть рассчитана с помощью средних цен.1.кв. м общей площади проданных квартир, умноженных на общую площадь стандартной квартиры.
Уровень доходов берется в расчете на домохозяйство. Вообще в российской статистике показатели уровня жизни традиционно исчисляются на душу населения. Однако в последние годы все чаще объектом наблюдения оказывается семья или домохозяйство (в понятии «домохозяйство» объединяются семьи из двух и более человек и ведущие самостоятельное хозяйство одиночки).
Доступность жилья для домохозяйств сильно дифференцирована по регионам и по городам России. На первичном рынке она изменяется от 1,27 лет в Воркуте (где очень низкие цены на жилье при относительно невысоких доходах) до 28,24 лет в Анапе (где высокие цены на жилье сочетаются с низким уровнем официально зафиксированных доходов). Неожиданно, на первый взгляд, доступно для населения самое дорогое среди всех городов жилье в Москве (11,06 лет). Это объясняется самыми высокими среди других регионов денежными доходами (не зарплатой!) москвичей.
На вторичном рынке жилья практически та же картина — наиболее доступно жилье в северных и промышленных городах (Воркута, Ухта, Череповец, Вологда, Новый Уренгой, Златоуст), а наименее - на Северном Кавказе (Ростов-на-Дону, Анапа), в Поволжье (Самара, Ульяновск), и в городах юга Сибири (Тюмень, Омск, Новосибирск, Красноярск, Иркутск, Барнаул).
Анализ динамики доступности жилья показывает, что на протяжении 1994г. она, в целом, понизилась. Количество среднегодовых доходов, необходимых для покупки двухкомнатной квартиры на первичном рынке, увеличилось (в среднем по сопоставимому списку городов) с 8,8 в 1993г. до 12,1 в1994г.; на вторичном - с 8,4 - до 10,2 (данный результат получен, правда, без учета разного объема сделок по городам). Это при том, что рынки жилья в городах получили за этот год достаточно существенное развитие практически все взаимодействия на рынке жилья стали более масштабными, а соответствующие зависимости - статистически более надежными.
Такие важные для анализа рынка недвижимости величины, как цена группы объектов, время экспозиции и др., называют случайными величинами. Методами изучения случайных величин занимается теория вероятностей и математическая статистика.
Случайная величина (СВ) - это такая величина, которая может принимать различные значения под воздействием случайных (неконтролируемых, нерегулируемых) факторов.
Случайная величина может изменяться также под воздействием неслучайных факторов. Например, цена объекта недвижимости изменяется в Зависимости от его размера или удаления от центра города. Однако, в ряде случаев закономерность таких изменений неизвестна, или конкретная задача не требует ее учета. Тогда и эти факторы относят к разряду случайных.
Генеральная совокупность значений СВ - это совокупность всех значений, которые она может принять под воздействием случайных факторов. Например, стоимость всех квартир жилищного фонда города в определенный момент времени, или все цены сделок в городе за определенный период времени.
Генеральная совокупность может разделяться на группы (подсовокупности) по определенному признаку (неслучайному фактору). Например, жилой фонд и сделки - по районам (зонам) города, типам домов, числу комнат. Доля подсовокупностей каждого типа характеризует структуру генеральной совокупности.
Структура генеральной совокупности - это доля (процентный состав) в ней подсовокупностей, выделенных по одному или нескольким признакам. Генеральная совокупность может также разделиться на выборки.
Выборка - это несколько Значений СВ, выбранных из генеральной
совокупности по случайному признаку.
Например, все проданные за определенный период квартиры в городе являются выборкой из жилфонда; квартиры, проданные той или иной фирмой, являются выборкой из жилфонда и также из всех квартир, проданных в городе.
Выборка по своей структуре может отличаться от генеральной совокупности. В этом случае говорят, что она нерепрезентативна относительно генеральной совокупности.
Репрезентативность (представительность) выборки - это ее достаточно близкое соответствие генеральной совокупности по основным характеристикам (прежде всего структуре).
Случайная величина (как ее генеральная совокупность, так и выборка) описывается различными способами. Первый да них это построение функции распределения, например, в виде гистограммы. Гистограмма - это представление СВ в виде столбчатого графика, отражающего долю (количество) попаданий СВ в различные диапазоны ее значений.
Другой способ описания СВ - это определение ее параметров, характеризующих среднее значение и разброс СВ вокруг среднего.
Значения средних и рассеяния, определенные для выборки и для генеральной совокупности, могут отличаться. Это отличие трактуется как ошибка в определении параметров генеральной совокупности по параметрам выборки.
Ошибка складывается из двух частей.
Первая — это систематическая ошибка, зависящая от степени репрезентативности выборки.
Вторая - это случайная ошибка, зависящая от объема выборки, Для различения параметров генеральной совокупности и выборки им иногда присваивают различные имена.
В качестве среднего значения СВ могут использоваться различные величины, например, медиана, мода, среднее арифметическое выборки (математическое ожидание генеральной совокупности).
Медианное значение СВ - это одно из ее значений в выборке, относительно которого половина значений превышает медианное, а другая половина не превышает. Разброс (рассеяние) СВ может оцениваться различными величинами, например, размахом (диапазоном разброса), дисперсией или среднеквадратическим отклонением, доверительным интервалом. Размах СВ - это разность между максимальным и минимальным ее значением.
Дисперсия (среднеквадратическое отклонение - СКО) СВ - это расчетная величина, определяемая по специальной формуле и характеризующая степень отклонения каждого из значений СВ от среднего. Среднеквадратическое отклонение генеральной совокупности обозначается греческой буквой «сигма», выборки — латинской «s».
Доверительный интервал — это размах СВ, определенный не по всем ее значениям, а по заданной доле значений, примыкающих к среднему. Доля значений, по которой определяется доверительный интервал, называется доверительной вероятностью. Выбор того или иного показателя определяется решаемой задачей. На практике может потребоваться любая из них.
Простейшей задачей, которую можно решать с использованием данных о ценах на единичные квартиры Ц1, Ц2 и т.д., накопленных за определенный промежуток времени, является определение средней цены Цср. по формуле среднего арифметического:
Цср.=(Ц1+Ц2+...+Цn)/n (1)
где n - число накопленных значений цен (объем выборки).
Для перехода к расчету средней цены
Сср.=(Ц1+Ц2+...+Цn)/(П+П2+...+Пn) (2)
Иногда удобнее применять равноценную формулу
Сср.=(С1+С2+...+Сn) (3)
где С1, С2 и т.д. — цена
С1=Ц1/П1ит. д.;
П1 и т.д. - общая площадь квартиры.
Пользуясь данными таблиц по ценам на квартиры за февраль, март и апрель 2006 года рассчитаем по формуле 2 среднюю стоимость одного квадратного метра для однокомнатных двухкомнатных и трехкомнатных квартир в рассматриваемых районах города.
Таблица — «Определение средней стоимости одного кв.м. квартир»
Период времени |
Район |
Кол-во комнат |
∑Цi |
∑Пi |
|
Февраль |
«Сода» |
1 |
9715 |
961,7 |
|
2 |
9620 |
986,6 |
|||
3 |
8670 |
886,2 |
|||
пр. Октября
|
1 |
10540 |
1086,2 |
||
2 |
14250 |
1429 |
|||
3 |
13730 |
1365,3 |
|||
Март |
«Сода» |
1 |
15840 |
1544,5 |
|
2 |
10960 |
1084,3 |
|||
3 |
12040 |
1277,8 |
17,76 19,48 15,29 15,49 18,58 15,46 17,07 18,36 16,19 16,92 |
||
пр. Октября
|
1 |
15640 |
1586,8 |
||
2 |
15240 |
1577,3 |
|||
3 |
14250 |
1474,3 |
|||
Апрель |
«Сода» |
1 |
14150 |
1431 |
|
2 |
13550 |
1376,2 |
|||
3 |
13500 |
1390,8 |
|||
пр. Октября
|
1 |
17860 |
1744,2 |
||
2 |
18000 |
1893,9 |
|||
3 |
17140 |
1781 |
Аналогично рассчитываются среднемесячные значения времени экспозиции и другие средние величины.
Выделение подвыборок цен для отдельных категорий квартир и зон города позволяет сузить разброс цен в выборке и создает предпосылки для изучения влияния параметров квартир одной категории на их цену.
Наличие нескольких выборок объемом пj, выделенных по
признаку типа жилья (хрущевки, стандартные квартиры, улучшенной планировки и
т.д.), либо размера (однокомнатные, двухкомнатные и т.д.), либо района
расположения (центр, вблизи центра, окраины), либо по сочетанию признаков позволяет
получить среднее значение цены
Сср.=(Сср.1×n1+Сср.2×n2+...+Сср.j×nj+...+Сср.m×nm)/n, (4)
где m - число выборок (выделенных категорий жилья).
Применение формулы не только облегчает расчеты при определении средней цены продажи или покупки квартир в городе, но и позволяет расширить круг решаемых задач.
Набор значений объемов выборок (n1, ..., nj, ..., nm)
характеризует структуру оцениваемой генеральной совокупности. Если известна
структура таких совокупностей, как жилищный фонд города; или приватизированный
жилой фонд, или вновь строящийся жилой фонд, то при наличии данных по средней
цене сделок в каждой категории квартир можно рассчитать среднюю цену
Другой пример проанализирован экспертами Агентства ТИТАН (Тверь) в отчете за 1995 год. Обнаружив парадоксальный факт превышения средней цены сделок над средней ценой предложения (при равенстве либо обратном соотношении индивидуальных цен); они правильно его объяснили различием в структуре совокупностей предлагаемых к продаже и проданных квартир.
Оценка дисперсии и среднеквадратического отклонения выборки производится по формулам (исключение выскакивающих значений)
s2 =(Сi-Сср) /(n-1), s=√ s2 (5)
После определения дисперсии необходимо исключить из выборки крайние (справа и слева) «выскакивающие» значения, и заново рассчитать параметры выборки. При этом используется«правило трех сигм»: исключаются значения, лежащие за пределами доверительного интервала в плюс/минус три среднеквадратических отклонения. Это соответствует доверительной вероятности 0,98 (т.е. исключаются из рассмотрения примерно 2% крайних значений). Применяются и более жесткие критерии, например, две сигмы (доверительная вероятность 0,95).
При отсутствии на фирме специалистов, владеющих методами математической статистики или соответствующими компьютерными программами, руководитель фирмы может грубо оценить величину разброса по формуле:
s=(Сmax-Сmin)/6, (6)
где Сmax, Сmin - максимальное и минимальное значения цен в выборке (за исключением "выскакивающих" значений).
Среднее значение случайной величины по данным репрезентативной выборки значений всегда рассчитывается с погрешностью, величина которой зависит от двух. факторов собственного разброса значений в выборке и ее объема. Если разброс измерен величиной среднеквадратического отклонения s, то приближенная оценка погрешности в определении средневыборочного при доверительной вероятности 0,95 равна:
(7)
Из формулы следует, что погрешность в определении среднего обратно пропорциональна корню квадратному из объема выборки и пропорциональна ее собственному разбросу. Наличие данных о погрешности в определении средних цен позволяет при сравнении двух выборок (например, по двум различным районам, или категориям квартир, или за два различных месяца) использовать следующее правило: выборки считаются различающимися незначимо, если разность их средних меньше суммы половины погрешностей. Например, при разнице средних в феврале и марте на 3,5% и погрешности в их определении +\-4% нельзя говорить о росте цен в феврале.
На практике используются два способа привязки данных к моменту времени: «на заданный момент времени» и «за определенный период времени» Общее правило состоит в том, что применение того или иного способа должно строго увязываться с характером данных. Так, данные о структуре жилфонда требуют первого способа, а данные о средней цене сделки - второго. Существуют и данные, которые могут описываться обоими способами, но при этом меняется их трактовка. Так, выражение «средняя цена предложения на 1.01.06» означает, что при расчете этой величины использовались все предложения, содержащиеся в листинге фирмы на эту дату, а выражение «средняя цена предложения за декабрь 05» - только предложения, поступившие за декабрь.
Исходя из изложенного, часто встречающееся в публикациях выражение «средняя цена квартир в городе N на 1.01.06» не имеет смысла, т.к. в нем нарушено правило об уточнении понятия цены (следует писать «средняя цена предложения квартир»); если же имелись в виду цены сделок, то следует писать «средняя цена сделок за 31.12.05» (если осреднялись сделки за один день), или «за 12.05» (если осреднялась выборка за месяц).
Первый вариант вряд ли реален, поскольку выборка сделок за один день слишком мала. Таким образом, следующее правило требует фиксировать (пояснять) используемый способ привязки средних данных к определенному моменту времени.
Наличие достаточно большой последовательности помесячных (понедельных) данных о средних значениях изучаемых показателей (динамического ряда) позволяет построить график изменения показателя во времени; первым шагом при этом является построение ломаной линии, проходящей через отмеченные точки на графике. Однако, останавливаться на этом шаге и делать выводы об изменении показателя за месяц, квартал, год по разности значений точек можно лишь при достаточно большом объеме выборок, когда для каждой пары точек всего ряда соблюдается следующее правило:
С2>С1+D,
где С2, С1 - большее и меньшее значения показателя.
В противном случае необходимо сделать второй шаг - сглаживание ряда. Правило сглаживания состоит в том, что следует провести (хотя бы от руки) плавную линию так, чтобы близкие точки отклонялись от нее примерно на равные расстояния. Желательно выполнить эту операцию более строго, проведя аппроксимацию полученной кривой одной из простейших функций (например, полиномом невысокого порядка) и определив ее коэффициенты специальными методами математической статистики, например, методом наименьших квадратов.
Дальнейшее правило состоит в том, что проценты, прироста или снижения показателей за определенный период вычисляются по точкам кривой, а не по фактическим значениям, и точность их при этом повышается.
Полученная согласно правилам аппроксимационная кривая представляет собой простейшую модель исследуемого процесса. Однако использовать ее для целей прогнозирования возможно лишь на коротком участке (один-два месяца), и лишь когда изменения тенденций не ожидается.
Более глубокий анализ и прогноз возможен, когда математическая модель процесса построена на основе выявленных закономерностей протекания исследуемого процесса. Такими закономерностями являются, например, общая закономерность s-образного роста цен на жилье при переходе от централизованной к рыночной экономике и корреляционная связь между темпами роста курса доллара к рублю и рост долларовых цен на жилье. В результате получена двухпараметрическая модель вида:
Ц(Т)=А/(1+ехр(В+СТ)) + кх(Т) + еrr,
где Ц — цена
Т — порядковый номер месяца;
А, В, С, к — постоянные коэффициенты (параметры модели);
х — прирост месячных темпов девальвации.
Построенная на их основе математическая модель процесса изменения цен на жилье в Москве, Барнауле, Рязани успешно использовалась для прогноза цен на год вперед.
Финансовая доступность жилья на рынке для населения - показывает, сколько. лет среднестатистическая семья или домохозяйство; того или иного города России должна откладывать весь свой суммарный годовой денежный доход (в другом варианте - всю заработную плату всех работающих членов семьи за год), чтобы купить на первичном или вторичном рынках жилья стандартную двухкомнатную квартиру.
В качестве стандартной, в соответствии с методикой Всемирного Банка и Хабитата ООН, для России выбрана двухкомнатная квартира. Такие квартиры составляют до 45 % от общего числа жилищных единиц практически каждого российского города.
Стандартная квартира характеризуется следующими признаками:
— расположена в районах города, прилегающих к его центру (но не в самом центре и не на окраине) - так называемое «второе кольцо».
— находится в многоэтажном панельном доме стандартной планировки (девяти - или двенадцатиэтажный дом), имеет кроме 2 комнат, кухню, санузел, холодное и горячее водоснабжение газовую или электроплиту.
— общая площадь - 48 кв.м.
Средняя цена стандартной квартиры на первичном и вторичном рынках жилья в городах определяется по данным риэлтерских фирм либо может быть рассчитана с помощью средних цен.1.кв. м общей площади проданных квартир, умноженных на общую площадь стандартной квартиры.
Уровень доходов берется в расчете на домохозяйство. Вообще в российской статистике показатели уровня жизни традиционно исчисляются на душу населения. Однако в последние годы все чаще объектом наблюдения оказывается семья или домохозяйство (в понятии «домохозяйство» объединяются семьи из двух и более человек и ведущие самостоятельное хозяйство одиночки).
Доступность жилья для домохозяйств сильно дифференцирована по регионам и по городам России. На первичном рынке она изменяется от 1,27 лет в Воркуте (где очень низкие цены на жилье при относительно невысоких доходах) до 28,24 лет в Анапе (где высокие цены на жилье сочетаются с низким уровнем официально зафиксированных доходов). Неожиданно, на первый взгляд, доступно для населения самое дорогое среди всех городов жилье в Москве (11,06 лет). Это объясняется самыми высокими среди других регионов денежными доходами (не зарплатой!) москвичей.
На вторичном рынке жилья практически та же картина — наиболее доступно жилье в северных и промышленных городах (Воркута, Ухта, Череповец, Вологда, Новый Уренгой, Златоуст), а наименее - на Северном Кавказе (Ростов-на-Дону, Анапа), в Поволжье (Самара, Ульяновск), и в городах юга Сибири (Тюмень, Омск, Новосибирск, Красноярск, Иркутск, Барнаул).
Анализ динамики доступности жилья показывает, что на протяжении 1994г. она, в целом, понизилась. Количество среднегодовых доходов, необходимых для покупки двухкомнатной квартиры на первичном рынке, увеличилось (в среднем по сопоставимому списку городов) с 8,8 в 1993г. до 12,1 в1994г.; на вторичном - с 8,4 - до 10,2 (данный результат получен, правда, без учета разного объема сделок по городам). Это при том, что рынки жилья в городах получили за этот год достаточно существенное развитие практически все взаимодействия на рынке жилья стали более масштабными, а соответствующие зависимости - статистически более надежными.