Pwcorr, star ( уровень значимости)
То Stata «отметит» символом * выборочный коэффициент корреляции на указанном уровне.
Очень часто при исследованиях совершают очень грубую идеологическую ошибку, распространяя выводы о наличие корреляционной зависимости выводами о наличии причинно-следственной связи. Это категорически неверно! Статистические и эконометрические методы и инструменты НЕ ПОЗВОЛЯЮТ делать выводы о наличии или отсутствии причинно-следственных связей, в частности, в финансах, экономике, менеджменте. Рассмотрим выдержку из статьи «Осторожно: статистика» Алексея Бессуднова.
«Рассмотрим это на примере исследования, посвященного анализу связи между употреблением алкоголя и сердечнососудистыми заболеваниями, опубликованного в феврале 2011 г. в British Medical Journal [1]. Авторы этой статьи статистически проанализировали результаты проведенных ранее исследований и показали, что люди, умеренно употребляющие алкоголь, менее подвержены риску сердечно-сосудистых заболеваний, чем те, кто не пьет вообще.Почему эти результаты нельзя однозначно интерпретировать в терминах причинно-следственной связи и утверждать, что умеренное потребление алкоголя положительно влияет на здоровье? (Надо отметить, что авторы оригинальной статьи в BMJ этого и не делают, в отличие от авторов, последовавших за публикациeй в прессе.)
1. Во-первых, из-за возможности обратной причинно-следственной зависимости: больные люди часто отказываются от употребления алкоголя, и, таким образом, причину и следствие здесь следует поменять местами.
2. Во-вторых, из-за возможного наличия «пропущенных переменных»: нельзя исключать, что исследователи не смогли проконтролировать какие-то характеристики, которые одновременно влияют и на употребление алкоголя, и на склонность к сердечнососудистым заболеваниям (например, генетическую предрасположенность).
Эти две проблемы в той или иной форме характерны для всех исследований, использующих неэкспериментальные данные».
. egen owner1_2009_mu=mean(owner1_2009)
. egen owner1_2009_sd=sd(owner1_2009)
. ksmirnov owner1_2009=normal((owner1_2009-owner1_2009_mu)/owner1_2009_sd)
One-sample Kolmogorov-Smirnov test against theoretical distribution
normal((owner1_2009-owner1_2009_mu)/owner1_2009_sd)
Smaller group D P-value Corrected
----------------------------------------------
owner1_2009: 0.0876 0.280
Cumulative: -0.1073 0.148
Combined K-S: 0.1073 0.295 0.250
Note: ties exist in dataset;
there are 79 unique values out of 83 observations.
. egen owner2_2009_mu=mean(owner2_2009)
.
. egen owner2_2009_sd=sd(owner2_2009)
. ksmirnov owner2_2009=normal((owner2_2009-owner2_2009_mu)/owner2_2009_sd)
One-sample Kolmogorov-Smirnov test against theoretical distribution
normal((owner2_2009-owner2_2009_mu)/owner2_2009_sd)
Smaller group D P-value Corrected
----------------------------------------------
owner2_2009: 0.0561 0.624
Cumulative: -0.1114 0.155
Combined K-S: 0.1114 0.309 0.261
Note: ties exist in dataset;
there are 69 unique values out of 75 observations.
. egen owner3_2009_mu=mean(owner3_2009)
.
. egen owner3_2009_sd=sd(owner3_2009)
. ksmirnov owner3_2009=normal((owner3_2009-owner3_2009_mu)/owner3_2009_sd)
One-sample Kolmogorov-Smirnov test against theoretical distribution
normal((owner3_2009-owner3_2009_mu)/owner3_2009_sd)
Smaller group D P-value Corrected
----------------------------------------------
owner3_2009: 0.0920 0.394
Cumulative: -0.0836 0.464
Combined K-S: 0.0920 0.740 0.685
SKTEST VARNAME
sktest owner1_2009
Skewness/Kurtosis tests for Normality
------- joint ------
Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2
-------------+---------------------------------------------------------------
owner1_2009 | 83 0.3643 0.2781 2.06 0.3567
. sktest owner2_2009
Skewness/Kurtosis tests for Normality
------- joint ------
Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2
-------------+---------------------------------------------------------------
owner2_2009 | 75 0.3463 0.9161 0.92 0.6308
. sktest owner3_2009
Skewness/Kurtosis tests for Normality
------- joint ------
Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2
-------------+---------------------------------------------------------------
owner3_2009 | 55 0.3496 0.2856 2.11 0.3477
summarize owner1_2009, detail
owner1_2009
-------------------------------------------------------------
Percentiles Smallest
1% 7.32 7.32
5% 20.07 19
10% 22.29 19.17 Obs 83
25% 29.9 20.07 Sum of Wgt. 83
50% 50.73 Mean 50.98661
Largest Std. Dev. 21.88288
75% 65.61 93.49
90% 81.51 96.15 Variance 478.8603
95% 91.2989 98.68 Skewness .2290596
99% 100 100 Kurtosis 2.456755
ttest owner1_2009 == 52
One-sample t test
------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
owner1~9 | 83 50.98661 2.401958 21.88288 46.20835 55.76487
------------------------------------------------------------------------------
mean = mean(owner1_2009) t = -0.4219
Ho: mean = 52 degrees of freedom = 82
Ha: mean < 52 Ha: mean != 52 Ha: mean > 52
Pr(T < t) = 0.3371 Pr(|T| > |t|) = 0.6742 Pr(T > t) = 0.6629