Энциклопедия заблуждений

собрание невероятных фактов, удивительных открытий и опасных поверий

Исследование с привлечением контрольной группы

Контролируемые исследования используют контрольную группу для сравнения с экспериментальной группой для установления причинно-следственной связи. Контрольная и опытная группы должны быть одинаковыми по всем параметрам, за исключением применения воздействия в экспериментальной группе. Если примененное воздействие на самом деле причина какого-либо события, то логика подсказывает, что это событие должно проявляться более значительно в экспериментальной, чем в контрольной группе. Например, если ‘C’ причина ‘E’, когда мы вводим «С» в экспериментальной группе, но не в контрольной группе, мы должны обнаружить, что событие ‘E’ проявляется в экспериментальной группе значительно сильнее, чем в контрольной группе. Значимость измеряется отношением к вероятности: если событие произошло не случайно, то его появление имеет статистическую значимость.

Двойной слепой тест это проверка контрольной группы, где ни оценщик, ни субъект не знает, каковы условия эксперимента. Рандомизированное испытание это опыт, который случайно выбирает участников контрольной и экспериментальной групп.

Целью управляемого, двойного слепого, рандомизированного испытания является снижение ошибки, самообмана и предвзятости. Разъясним необходимость этих гарантий на примере.

DKL LifeGuard Model 2, из DielectroKinetic Laboratories, якобы могут обнаружить живого человека, получая сигнал от сердца на расстоянии до 20 метров через любой материал, в соответствии с его производителями. Sandia Labs протестировала устройство с помощью двойного слепого, рандомизированного испытания. Sandia является национальной лабораторией безопасности работающей для Министерства энергетики США по Sandia Corporation, Lockheed Martin Ко. Гипотезу, которую они проверяли, можно сформулировать следующим образом: человеческое сердцебиение вызывает направленный сигнал, активирующий устройство, тем самым позволяя пользователю LifeGuard найти скрытого человека (цель) на расстоянии до 20 метров, независимо от того, какие объекты могут быть в радиусе от LifeGuard до цели.

Процедура тестирования была довольно простой: пять больших ящиков упаковали в пластик и расставили с 30-футовыми интервалами и оператор, используя LifeGuard 2, пытался обнаружить, в каком из пяти ящиков скрывался человек. Какой ящик был пустым, а в каком ящике прятался человек, для каждого испытания определяли случайно. Это позволило избежать использования шаблона, который мог бы облегчить обнаружение. Их испытания показали, что устройство выполняет свои задачи не лучше простого угадывания. Единственный раз испытатели преуспели в обнаружении цели, когда они знали, где находился человек. LifeGuard успешно угадал десять из десяти раз, когда оператор знал, где цель. Это может показаться смешным для тестирования устройства — сообщать оператору, где объект, но оно устанавливает базовое соотношение и подтверждает, что устройство работает. Только тогда, когда оператор соглашается, что его устройство работает, переходят ко второй стадии, двойному слепому тестированию. Ибо оператор не сможет придумать специальную гипотезу, чтобы объяснить свою неудачу в двойном слепом тесте, если он заранее признал, что устройство работает нормально.

Если устройство может выполнять то, что утверждается, оператор должен не получить сигналы из пустых ящиков и получить сигналы от каждого из ящиков с человеком внутри. В основном испытании LifeGuard, когда ни оператор, ни сборщик результатов не знали, какой из пяти возможных ящиков скрывает человека, устройство работало плохо (6 результатов из 25) и потребовало в четыре раза больше времени, чем когда оператор знал местоположение цели. Если человеческое сердца причина активации устройства, можно было бы ожидать значительно лучшую производительность, чем 6 из 25.

Различные результаты — 10 правильных из 10 в первом опыте в сравнении с 6 правильными из 25 во втором ярко иллюстрируют необходимость двойного слепого контролируемого эксперимента: он необходима для устранения самообмана и субъективной валидизации. Оценщик «ослепляется» для предотвращения излишнего контакта с объектом, сознательного или бессознательного. Если бы оценщик знал, какие ящики были пусты, а какие нет, он мог бы подсказать результат, глядя только на ящики с людьми. Чтобы исключить возможность обмана или предвзятости, оценщика держат в неведении относительно опыта.

Отсутствие испытаний в контролируемых условиях объясняет, почему многие экстрасенсы, астрологи, графологи и тому подобные верят в свои способности. Для проверки лозоискательства не достаточно иметь лозоискателя и его друзей, которые скажут вам, что это работает, указав все колодцы, которые были вырыты по совету лозоискателя. Следует выполнить рандомизированный двойной слепой тест, что и сделал Рэй Хайман с опытным лозоискателем в программе PBS program Frontiers of Science (19 ноября, 1997). Лозоискатель утверждал, что он мог найти зарытые металлические предметы, а также воду. Он согласился на тест, который заключался в случайном выборе чисел, которые соответствовали ведрам, закопанным в поле. Номера определяли, в каком ведре находился металлический предмет. Один человек размещал объекты, другой ходил с лозоискателем, когда тот пытался найти объекты. Можно точно вычислить шансы случайного нахождения предмета в поле. Например, если есть 100 ведер и 10 из них содержат металлические предметы, а затем получили 10% правильных ответов, значит результат можно было бы предсказать случайно. То есть, при большом числе попыток, около 10% правильных ответов можно ожидать от кого угодно без стержня биолокации. С другой стороны, если кто-то последовательно получил 80% или 90% правильных ответов, мы можем быть уверены, что лозоискатель нас не обманул.

Лозоискатель ходил с прутом, но сказал, что не может получить какой-нибудь сильный сигнал. Когда он выбрал ведро, он охарактеризовал свой выбор так, что он не думает, что прав. Он был прав только в том, что ошибся! Он не нашел ни одного металлического предмета, несмотря на несколько попыток. Его выступление является типичным dowsers испытанием в контролируемых условиях. Его ответ был типичным: он был искренне удивлен. Как и большинство из нас, лозоискатель не знает о многих факторах, которые могут помешать нам сделать надлежащую оценку событиям: самообман, принятие желаемого за действительное, внушение, бессознательные предвзятости, селективное мышление, субъективная валидизация и т.п.

Во многих контролируемых исследованиях эффекта плацебо контрольную группу держат в неведении относительно того, какой препарат они принимают. И контрольной и опытной группе будут даны идентичные таблетки для тестирования эффективности нового препарата.Только одна таблетка будет содержать вещество, которое проходит тестирование; другие таблетки будут плацебо. В двойном слепом исследовании сборщик результатов не будет знать, какая группа получила плацебо, пока его работа не будет завершена. Это сделано во избежание субъективного влияния оценщика на результаты наблюдений и измерений.

Первое использование контрольных групп в медицине связано с доктором Джеймсом Линдом (1716-1794) , открывшим связь между цитрусовыми и цингой, заболеванием, убившем больше моряков, все военные действия 18 века. Линд сравнил шесть методов лечения матросов с цингой. У тех моряков, которым давали лимоны и апельсины, симптомы почти исчезли в течении недели. Другим морякам было гораздо хуже, хотя состояние их несколько улучшилось. Более подробно об истории контролируемых рандомизированных исследований (или рандомизированных клинических исследований) см. Trick or Treatment: The Undeniable Facts about Alternative Medicine by Edzard Ernst and Simon Singh.

Конечно, Линд не знал, что витамин С необходимое питательное вещество из цитрусовых, защищавшее от цинги. На самом деле, он считал, что причиной цинги была “не полностью переваренная пища, которая приводила к наращиванию токсинов в организме (Bryson 2010)”. Контролируемый эксперимент Линда показал, что было что-то жизненно важное в апельсинах и лимонах, защищавшее от цинги. К сожалению, точка зрения, что цингу вызывает непереваренная пища, оставалась распространенным мнением среди медицинских экспертов до 19-ого века.

Долгая дорога от эксперимента Линда к полному пониманию роли аскорбиновой кислоты в питании включает работы многих ученых на протяжении многих лет. Невозможно было представить себе, что еда сама содержит необходимые питательные вещества, отсутствие которых вызывает специфические заболевания, когда человек верил, что все болезни происходят из-за внутренних дурных соков или токсинов, которые должны быть выведены из организма. Если бы Линд жил в более позднюю эпоху (но сохранил свою веру в теорию внутренних токсинов), где было бы возможно определить уровень токсинов у больных цингой, он, возможно, решил бы, что его вера подтверждается найденными у больных токсинами.

Еще в начале 20 века ведущие медицинские учебники считали причинами цинги “антисанитарную обстановку, переутомление, депрессии и воздействие холода и сырости” (Bryson 2010). Медицинский учебник отражает так называемую теорию миазмов, которая также была очень популярна в 19 веке.

В 1917 году Е. В. Макколам, который придумал термин «витамин», заявил, что цинга вызывается запорами. Макколам, который был одним из ведущих диетологов своего времени, по-видимому, придерживался теории наращивания токсинов, которая вызвала много смертей на протяжении нескольких веков в виде кровопускания. Тем не менее, Макколам сделал прогресс. Кто не предпочтет слабительное вместо кровопускания?

Смотрите также:


Перейти на главную