Статистический анализ данных когортного исследования.


Статистический анализ данных когортного исследования основан на способах выявления различий показателей абсолютного риска в группах сравнения (опытной и контрольной группе). Результат абсолютного сравнения (разницы показателей) дает величину, которую называют по-разному, что осложняют чтение публикаций:

· атрибутивный (добавочный, избыточный) риском (attributable risk-AR);

· разница рисков (risk difference-RD);

· в последнее время в публикациях используют термин снижение абсолютного риска (САР)экспериментальных исследованиях (испытаниях).

Все эти названия обозначают одно и то же - на сколько заболеваемость в группе экспонированных лиц больше, чем в группе неэкспонированных.

Напомним, что используемый иногда термин абсолютный риск в качестве синонима атрибутивного риска не является корректным.

Результат относительного сравнения (отношения показателей) также называется по-разному:

· относительный риск (ОР) - (relative risk - RR):

· реже отношение рисков (показателей)- (risk ratio).

Независимо от названия полученная величина показывает во сколько раз зболеваемость в опытной группе отличается от заболеваемости в контрольной группе.

Относительный риск не несет информации, ни о величинах сравниваемых показателей заболеваемости, (величинах абсолютного риска), ни, соответственно, о величине атрибутивного риска. Даже при высоких значениях относительного риска, если заболевание редкое, значения сравниваемых абсолютных рисков может быть совсем небольшим, Относительный риск используется для ориентировочной и наглядной оценки силы связи между воздействием и заболеванием.

Для более полной оценки различий показателей используют дополнительную величину, называемую по разному: этиологическая доля (etiological fraction – EF), атрибутивная фракция (доля, пропорция)-(attributable proportion), реже приписываемая пропорция. Все термины отражают удельный вес (долю) тех случаев болезни, которые могли бы быть предотвращены при отсутствии влияния фактора риска. Другими словами, это доля тех случаев в группе риска (но не во всем населении), которые связывают (приписывают) с непосредственным влиянием фактора риска. Формулу расчета смотри далее в описании расчетов по данным таблицы «два на два»

Величину EF в экспериментальных исследованиях в русскоязычной литературе нередко называют снижением относительного риска (СОР).

 

Использование таблицы «два на два»

Таблица 3 .Принципиальная форма таблицы «два на два» для когортных аналитических исследований.

Такая таблица заполняется толькоабсолютными величинами, что позволяет рассчитать следующие показатели:

1. а) абсолютный риск для основной (RF+) группы:

б) абсолютный риск для контрольной (RF-)группы: (в этих и других формулах: 10n – размерность показателя)

2. атрибутивный (добавочный) риск (AR), снижение абсолютного риска (САР):

, или AR (САР) = RF+ - RF-

3. относительный риск (RR):

, или

Значение относительного риска (RR): используется для ориентировочной оценки причинно-следственной связи между фактором риска и возникновением болезни. При этом:

· значение RR равное 1 рассматривается как отсутствие связи между фактором и болезнью;

· если величина RR больше 1 считается, что чем больше RR, тем выше риск заболеть тех лиц, которые подвергались воздействию фактора, т.е. изучаемый фактор является фактором риска;

· если величина RR меньше 1, значит, риск заболеть экспонированных лиц ниже, чем у тех на кого изучаемый фактор не воздействовал и, следовательно, данный фактор, вероятно, оказывает благоприятное воздействие на здоровье.

4. этиологическую долю (EF) или снижение относительного риска (СОР) можно рассчитать по любой из представленных формул:

1)

2)

3) где:

· абсолютный риск в %,

· группа F+ - группа населения, подверженная влиянию фактора риска - основная группа;

· группа F- - группа населения неподверженная влиянию фактора риска - контрольная группа;

· EF (СОР) чаще всего выражается в процентах .

5. c2 (хи-квадрат), (критерий Пирсона, критерий согласия, соответствия), необходимый для статистической оценки гипотезы причинно-следственной связи.

Критерий c2 (хи-квадрат), так же как и другие статистические методы оценки различия переменных позволяет принять, или отвергнуть нулевую гипотезу, которая в данном случае утверждает, что выявленные различия в частоте заболеваний в сравниваемых группах определяются исключительно случайной ошибкой. Величина критерия c2 позволяет:

· оценить достоверность различий заболеваемости в опытной и контрольной группе;

· высказать гипотезу о наличие связи между заболеваемостью и изучаемым фактором.

Формула расчета c2: ,

Эта формула применяется, если N больше 40. Однако при этом если одно из значений (a, b, c или d ) в таблице «два на два» будет меньше 5, но больше 0, следует использовать другую формулу (с поправкой Йетса):

В других случаях вместо критерия c2 рекомендуется использовать точный критерий Фишера

Уровень ошибки и, соответственно, уровень достоверности различий заболеваемости в сравниваемых группах, а, следовательно, и уровень достоверности суждения о наличии связи между фактором и заболеваемостью зависит от значения c2 и определяется по таблице c2-распределения (она есть в любом статистическом справочнике). Для таблицы «два на два»:

c2 = 3,841 соответствует уровню ошибки – р=0,05

c2 = 6,635 соответствует уровню ошибки - р=0,01

Таким образом, значение c2 , позволяющее отвергнуть нулевую гипотезу, должно быть (для таблицы «два на два») не менее 3,841.

6 добавочный популяционный риск (ARP).

Этот показатель очень важен для административных органов здравоохранения (см. главу 6). Его можно рассчитать, если дополнительно (к данным таблицы) известна для всей популяции доля лиц, подверженных воздействию фактора риска.

Формула расчета: ARP=AR´ P где:

AR – добавочный (атрибутивный) риск

Р – распространенность фактора риска в популяции, выраженная в долях единицы (а не в процентах).

Пример.

Таблица 4. Число новых случаев ишемической болезни сердца (ИБС) в Ленинграде у женщин 40 – 49 лет, в зависимости от величины систолического артериального давления (САД). Источник. Эпидемиология неинфекционных заболеваний под редакцией
А.М. Вихерта, А.В. Чаклина. Москва «Медицина», 1990, (с незначительными изменениями).

1.· Абсолютный риск в основной группе равен:

т.е. 17,8 случая на 100 женщин основной группы;

· Абсолютный риск в контрольной группе:

, т.е. 9,2 случая на 100 женщин контрольной группы.

2. Атрибутивный риск (снижение абсолютного риска - САР) составил: AR (САР)=17,8 – 9,2 = 8,6%.

Это значение соответствует добавочной частоте ИБС обусловленной систолическим артериальным давлением равным или большим 160 мм.рт.ст .

3. Относительный риск:

Таким образом. риск возникновения ИБС в основной группе (выборке женщин 40-49 лет, имеющих систолическое артериальное давление равное или большее 160 мм.рт.ст.) почти в 2 раза выше, чем аналогичный риск в контрольной группе (выборке женщин 40-49 лет, имеющих систолическое артериальное давление не более 140 мм.рт.ст.). Полученные данные позволяют предположить, что САД равное или большее 160 мм.рт.ст. является фактором риска возникновения ИБС в выборке ленинградских женщин 40-49 лет.

4. Этиологическая доля (снижение относительного риска - СОР) .

Именно такова доля случаев ИБС в основной группе (от всех случаев ИБС в этой группе), которые могли быть предотвращены, в результате гипотензивной терапии.

5. c2 (хи-квадрат)=4.8.

Поскольку полученное значение c2 больше критического табличного (4,8>3,841), следовательно, нулевая гипотеза об отсутствии причинно-следственной зависимости по данным этого исследования отвергается, различия признаются неслучайными. Следовательно, с достоверностью 95% и, соответственно, с ошибкой (р) <0,05, можно полагать что систолическое артериальное давление равное или большее 160 мм.рт.ст является фактором риска возникновения ИБС в выборке ленинградских женщин 40-49 лет.

6. Добавочный риск для популяции:

Известно, что распространенность повышенного САД среди женщин 40-49 в Ленинграде в период проведения когортного исследования 1975 – 1983 годах составляла 14.2% (0,142), отсюда:

ARP =8.6´ 0.142= 1.2 %.

Таким образом, можно предположить, что избыточная частота вполне предотвратимой ИБС у всех ленинградских женщин в возрасте 40-59 лет в 1975 – 1983 годах составляла 1,2 случая на 100 человек.

В проспективных когортных исследованиях, чаще всего постепенно уменьшается число лиц, первоначально принявших участие в исследовании. Выбывание из состава сравниваемых групп происходит по разным причинам – заболевание, смерть, отказ по личным мотивам и др. В связи с этим время риска каждого лица, участвующего в исследовании оказывается неодинаковым, что может сместить результаты исследования. В таких случаях, чтобы уменьшить риск ошибочных выводов при обработке результатов используют показатель инцидентности (заболеваемости) человек-время. (Person‑time incidence rate – PtR ) (см. главу 6),

Таблица 5. Макет таблицы «два на два» для статистической обработки результатов проспективных когортных исследований, с использованием показателя «человек время».

где:

a – число заболевших в основной группе;

c число заболевших в контрольной группе;

b – число человеко-лет наблюдения (ЧЧЛ) в основной группе

d – число человеко-лет наблюдения (ЧЧЛ) в контрольной группе

По данным таблицы рассчитываются:

1. абсолютный риск в показателях человек время для основной (PtRF+) и контрольной (PtRF--) группы:

; ;

2. атрибутивный (добавочный) риск. или снижение абсолютного риска (САР) :

, или AR (САР)= PtRF+ - PtRF-

3 относительный риск:

, или

4. достоверность различий абсолютного риска в сравниваемых группах (PtRF+ и PtRF-).

Его значение определяется с помощью критерия t, или сравнением доверительных границ, или другим соответствующим методом.

Стандартная ошибка (m) показателя человек время рассчитывается по формуле:

где:

m – стандартная ошибка показателя человек-время (PtR)

PtR – значение показателя человек время

ЧЧЛ – число человеко – лет наблюдения в данной группе

Пример. Результаты проспективного когортного исследования по выявлению причинной связи между курением и смертностью британских врачей мужчин от ишемической болезни сердца. (Doll, Hill, 1966)

Таблица 6. Число случаев смертей от ишемической болезни сердца и число человеко-лет в сравниваемых группах. Источник: А.Альбом, С Норелл. «Введение в современную эпидемиологию» 1996.

1. Абсолютный риск смерти от ИБС в группе лиц курящих сигареты ,

Абсолютный риск смерти от ИБС в контрольной группе

2. Атрибутивный риск смерти от ИБС, связанный с курением сигарет, составляет: AR=7,2 – 4,9= 2,3 % на 1000 человек в год. Эта величина соответствует добавочной частоте смертей от ИБС связанная с курением сигарет.

3. Относительный риск смерти от ИБС, связанный с курением сигарет

равен: Таким образом можно предположить, что курение сигарет является фактором риска смерти от ИБС мужчин .

4. Этиологическая доля (снижение относительного риска -СОР): .

Такова доля смертей от ИБС в группе курильщиков сигарет (от общей суммы ИБС в этой группе), которые могли быть предотвращены, если бы лица, входящие в эту группу не курили.

5. Статистическая оценка гипотезы связи курения сигарет и смерти британских мужчин врачей от ИБС.

В данном случае рассчитаем критерий t и, ориентируясь на его величину, определим уровень достоверности различий абсолютного риска для лиц, курящих и некурящих сигареты.

.

Такое значение критерия t означает, что уровень ошибки в определении разницы частоты смертей от ИБС в группах курящих и не курящих сигареты крайне незначителен р<0,001. Это дает основание отвергнуть нулевую гипотезу и по данным исследования, статистически подтвердить причинную связь курения сигарет с частотой смерти от ИБС,.

6. Распространенность курения в 50-60-ые годы среди британских врачей мужчин составляла примерно 65%. Отсюда дополнительный популяционный риск для этой категории населения составил:
ARP= 2,3´0,65= 1,5 случая смерти от ИБС на 1000 врачей в год.