Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл Страница 60
Думай «почему?». Причина и следствие как ключ к мышлению - Джудиа Перл читать онлайн бесплатно
Рис 44. Парадокс Симпсона: физическая активность представляется полезной (направление вниз) в каждой возрастной группе, но вредной (направление вверх) в популяции в целом.
Чтобы решить, полезна или вредна физическая активность, мы, как всегда должны обратиться к истории, которая стоит за данными. Данные показывают, что люди старшего возраста в нашей популяции больше занимаются физическими упражнениями. Поскольку ситуация, когда Возраст служит причиной Физической активности представляется более вероятной, чем обратная, и поскольку Возраст способен оказывать каузальное воздействие на Холестерин, мы приходим к выводу, что Возраст может быть осложнителем для Физической активности и Холестерина. Значит, нужно сделать корректировку по Возрасту. Другими словами, следует посмотреть на данные, распределенные по возрастам, и мы увидим, что физические упражнения приносят пользу, независимо от возраста.
Родственник парадокса Симпсона десятилетиями мелькал в литературе по статистике, и его легко интерпретировать визуальными средствами. Фредерик Лорд изначально сформулировал этот парадокс в 1967 году. И снова он вымышленный, но вымышленные примеры (вроде мысленных парадоксов Эйнштейна) всегда обеспечивают хороший способ нащупать границы нашего понимания.
Лорд наблюдает за университетом, администрация которого хочет понять, как питание, предлагаемое студентам в столовых, влияет на их вес — в частности, оказывает ли оно разный эффект на юношей и девушек. С этой целью студенты сначала взвешиваются в сентябре, а потом в следующем июне. На рис. 45 результаты представлены на графике, где эллипсы снова отражают диаграммы рассеяния данных. Потом университет приглашает двух статистиков, они рассматривают полученные данные и приходят к противоположным выводам.
Первый статистик смотрит на распределение веса у девушек в целом, и отмечает, что их средний вес в июне остался таким же, как в сентябре. (Это показывает симметрия диаграммы рассеяния вдоль линии WF = WI, то есть, конечный вес = исходный вес). Естественно, отдельные девушки могут набирать или терять вес, но в целом прибавка равна нулю. То же справедливо и для юношей. Из этого статистик делает вывод, что рацион не влияет на два пола по-разному.
Рис 45. Парадокс Лорда. (Эллипсы представляют диаграммы рассеяния). В целом, ни девушки, ни юноши не прибавляют в весе в течение года, но в каждой страте с одинаковым исходным весом юноши имеют тенденцию поправляться больше девушек.
Второй статистик, со своей стороны, утверждает, что, поскольку на конечный вес студентов сильно влияет исходный вес, необходимо стратифицировать их по исходному весу. Если сделать вертикальный срез, пройдя через оба эллипса, что позволит посмотреть только на юношей и девушек с определенным исходным весом (например, W0 на рис. 45), вы заметите, что вертикальная линия пересекает эллипс «Юноши», выше, чем эллипс «Девушки», хотя есть некоторое наложение. Это значит, что у юношей, которые начали с веса W0, конечный вес (WF) в среднем будет выше, чем у девушек которые начали с веса W0. Соответственно, пишет Лорд, «второй статистик приходит к выводу, как это обычно бывает в таких случаях, что юноши демонстрируют существенно большую прибавку, чем девушки, если соответствующим образом учесть разницу в исходном весе между полами».
Что же делать университетскому диетологу? Лорд пишет: «Выводы обоих статистиков с виду верны». То есть, не нужно заниматься подсчетами, чтобы увидеть: два веских аргумента ведут к двум разным выводам. Достаточно посмотреть на рисунок: на рис. 45 мы видим, что юноши в каждой страте (в любом вертикальном сечении) поправляются больше, чем девушки. В то же время, очевидно, что ни юноши, ни девушки в итоге не прибавили ничего. Как это возможно? Разве общая прибавка веса — не средний показатель для прибавки в каждой группе?
Теперь, когда мы прекрасно разбираемся в тонкостях парадокса Симпсона и принципа «верного дела», мы знаем, что не так с этим аргументом. Принцип «верного дела» работает только в случаях, когда относительная доля любой подгруппы (группы с одинаковым весом) остается неизменной. Да, в случае Лорда «воздействие» (пол) сильно влияет на процент студентов в каждой группе с одним весом.
То есть, мы не можем полагаться на принцип «верного дела», и это возвращает нас к началу. Кто же прав? Существует ли разница между средней прибавкой в весе между девушками и юношами, если соответствующим образом учесть разницу в исходном весе между полами? Вывод Лорда весьма пессимистичен: «Обычные исследование такого типа пытается ответить на вопрос, на который просто невозможно дать точный ответ на основе имеющихся данных». Пессимизм Лорда вышел за пределы статистики и привел к изобилию довольно пессимистичных работ по эпидемиологии и биостатистике о том, как сравнивать группы с разной исходной статистикой.
Сейчас я покажу вам, почему пессимизм Лорда не обоснован. На вопрос диетолога можно ответить точно, и, как обычно, надо начать с диаграммы причинности, как на рис. 46. На этой диаграмме мы видим, что Пол (S) становится причиной исходного веса (WI) и конечного веса (WF). Кроме того, WI влияет на WF независимо от гендера, потому что студент любого гендера, который весит больше в начале года, чаще весит больше и в конце года, что показано на диаграммах рассеяния на рис. 45. Все эти допущения о причинности основаны на здравом смысле; я не думаю, что Лорд не согласился бы с ними.
Интересующая Лорда переменная — прибавка в весе, которая показана на этой диаграмме как Y. Заметьте, что Y относится к WI и WF чисто математически, детерминированным образом: Y = WF — WI. Это значит, что корреляции между Y и WI (или Y и WF) равна –1 (или 1), и я показал эту информауию на диаграмме с коэффициентами –1 и +1.
Рис 46. Диаграмма причинности для парадокса Лорда.
Первый статистик просто сравнивает разницу в прибавке веса между юношами и девушками. Между S и Y не нужно блокировать «черные ходы», а значит, наблюдаемые обобщенные данные дают ответ: эффекта нет, и таков вывод первого статистика.
В то же время, вопрос, на который пытается ответить второй статистик (то есть, «верно сформулированный запрос», описанный во Вступлении) трудно даже сформулировать. Он хочет убедиться, что «разница в исходном весе между полами соответствующим образом учтена» — такие формулировки обычно используют, если хотят сделать поправку по осложнителю. Но WI не выступает осложнителем для S и Y. На самом деле это переменная-медиатор, если считать Пол «воздействием». Таким образом, запрос, на который отвечают, вводя ограничение по WI, нельзя интерпретировать
Жалоба
Напишите нам, и мы в срочном порядке примем меры.