Home > Как написать научную статью > Как избежать «недоразумений» при проведении статистического анализа данных и представлении результатов

Как избежать «недоразумений» при проведении статистического анализа данных и представлении результатов

Получать обновления Научного блога:

Совет первый и самый главный: при применении статистики всегда следуйте совету Винни Пуха: «Нужно делать то, что нужно, а что не нужно — делать не нужно». Все остальное вытекает из этого мудрого правила.

Совет второй: читайте хорошие учебники по анализу данных:

Афифи А., Эйзен С. Статистический анализ: подход с использованием ЭВМ. Пер. англ. — М.:Мир, 1982.— 488 с.

Гланц С. Медико-биологическая статистика. Пер. англ. — М., Практика, 1998. —459 с. Животовский Л.А. Попупяционная биометрия. — М: Наука, 1991. — 271 с.

Sokal R. R., Rohlf F. G. Biometry: the principles and practice of statistics in biological research. 3-ed. — N.Y.: Freman & Co., 1995. — 850 p.

StatSoft, Inc. (2001). Электронный учебник по статистике. Москва, StatSoft. WEB: http:// www.statsoft.ru/home/textbook/default.htm

Совет третий: помните о проблеме мнимых повторностей:

Козлов М. В. Мнимые повторности (Pseudoreplication) в экологических исследованиях: про­блема, не замеченная российскими учеными // Журн. общ. биологии. — 2003. — Т. 64, № 4, С. 292-307.

Совет четвертый: прочитайте внимательно текст этого раздела и, может быть, это позволит Вам избежать «недоразумений», а иногда и нелепостей при представлении результатов статистического анализа в Ваших публикациях. Не стесняйтесь обращаться за консультациями к специалистам.

Корректно проведенный и описанный статистический анализ дан­ных эксперимента или наблюдений влияет на достоверность выводов и является обязательным элементом научной публикации. Поэтому авторам работ, содержащих обобщение результатов экспериментов и на­блюдений, необходимо обратить особое внимание на правильное ис­пользование статистических методов и описание результатов анализа такого рода данных.

Наиболее типичные ошибки при представлении результатов следующие:

—  не приведены размеры выборок;

—  не приведены единицы измерения переменных;

—  не приведены проверяемые гипотезы;

—  не указан используемый статистический критерий;

—  не указано число степеней свободы критерия;

—  отсутствует проверка предположений статистической модели;

—  некорректно использован /- критерий для случая множественных срав­нений;

—  не дана расшифровка приводимых параметров;

—  отсутствует легенда или расшифровка обозначений в подписи к ри­сунку;

—  нет округления приводимых величин;

—  приведены лишь точечные оценки центральной тенденции, без оцен­ки доверительного интервала и характеристики рассеивания.

При проверке гипотез (используйте двухсторонние критерии!) обя­зательно укажите уровень значимости (вероятность отклонения спра­ведливой нулевой гипотезы), выбранный в качестве критического — с которым сравнивали <ф-уровень» использованных статистических кри­териев. Например: «При проверке статистических гипотез использован 5% уровень значимости». Недопустимы выражения типа «…достовер­ность различий с контролем р<0.05». Некорректны фразы: «при статис­тической обработке полученных данных был использован /-критерий Стьюдента» (критерии применяются для проверки гипотез!) или «ста­тистический анализ проводился по Лакину (Плохинскому и т.п.)» или «математическая обработка проводилась в программах MS EXCEL и Statistica». В книгах и статистических пакетах приводится обычно очень много вариантов разных методов. Если анализ данных производился с использованием конкретного пакета программ, то укажите название этого пакета, версию и разработчика. Например: «Анализ данных выполнен в ПСП STATISTICA 5.5. (StatSoft, Inc. 2001)».

Указывайте, какую статистическую модель (метод, критерий) ис­пользовали для статистического вывода. Для параметрических стати­стических критериев, хотя и относительно устойчивых к отклонению от исходных предположений, существуют ограничения по применению (например, предположения для t и F статистик — нормальность рас­пределения, независимость ошибок и равенство дисперсий). Поэтому укажите, с помощью каких критериев Вы проверяли эти предположе­ния и каковы результаты теста. Например: «для проверки предположе­ния однородности дисперсий использован критерий Бартлета: с J2(3)=3.75, р=0Л5».
Опишите процедуру проверки характера распре­деления (например, критерии %2,
^-критерий Колмогорова-Смирнова с критическими уровнями Лиллиефорса) и ее результаты. Если исполь­зовали преобразования переменных для стабилизации дисперсии и нормализации распределения, укажите их. Например: «…использова­ли угловое преобразование долей», или логарифмирование, или Бокс-Кокс преобразование (Я=0.14) и др.

В разделе «Материалы…» (до подраздела статистического анализа) опишите массив данных: число наблюдений и переменных, в каких едини­цах измерены переменные. Помните, что для зависимых переменных, из­меренных в ранговых (порядковых) шкалах, использование параметричес­ких методов не является корректной процедурой.

В тексте или таблицах раздела «Результаты…» следует приводить фактическую величину достигнутого ^-уровня. Не забудьте (!) указать число степеней свободы (dj) используемого статистического критерия (степени свободы — это параметры теоретических распределений; при­ведение статистики критериев без указания параметров бессмысленно). Например, при использовании /-критерия: /(36)=3.25 (или /36=3.25), /><0.005, где цифра в скобках или нижний индекс — число степеней сво­боды
(df=36). He применяйте /-критерий для множественных сравнений без корректировки полученных /^-значений, а используйте модель дис­персионного анализа и методы множественных сравнений или вводите поправку (Бонферрони или Данна-Шидака и др.). F-статистика имеет два (!) параметра — степени свободы числителя и знаменателя (напри­мер, F(2;28)=15.6,/><0.0001).

Не забывайте расшифровать используемые сокращения и символичес­кие обозначения. Например, М— выборочное среднее, т (s.e.) — ошибка среднего, s.d. — выборочное стандартное отклонение и т.д. Если используется выражение М±т, укажите значение каждого символа, а также обяза­тельно (!) укажите объем выборки — п.

Для иллюстраций вместо столбиковых диаграмм лучше использо­вать диаграммы размаха, которые дают информацию не только о точеч­ной оценке центральной тенденции, но и обеспечивают характеристику изменчивости признака или точности оценки параметра или его дове­рительный интервал. Не забудьте убрать линии сетки с приводимых гра­фиков (часто они затрудняют восприятие) и привести легенду или рас­шифровку обозначений, использованных на диаграмме. Используйте область диаграммы рационально.

Результаты вычислений как описательных статистик, так и критериев, должны быть разумно округлены. Средние значения не следует приводить точнее, чем на один десятичный знак по сравнению с данными измерения, s.e. ns.d. — еще на один знак точнее.

Помните, что статистический вывод имеет вероятностный характер и могут быть допущены ошибки I и II рода. Не пишите «…статистически достоверно различаются», используйте корректный термин «статистичес­ки значимо». Избегайте голословных (не статистических) выводов, не под­крепленных проверкой соответствующих гипотез, например: «выявлено значительное…» и далее никаких критериев; или «из рисунка легко видно, что…», или «оценка доли … показала наличие обратной корреляции с…» и далее никаких оценок коэффициента корреляции.

Подробный анализ типичных ошибок применения статистического анализа и описания результатов в биомедицинских исследованиях досту­пен в Интернете по адресу http://www.biometrica.tomsk.ru/kk/index.htm .

Примечание:

По материалам методического пособия – «Советы молодому ученому:методическое пособие для студентов, аспирантов, младших научных сотрудников и, может быть, не только для них». Издание 2-е. переработанное и дополненное. Екатеринбург: ИЭРиЖ УрО РАН, 2005.

Добавить в:
VKontakte.ru FaceBook Mail.ru Livejournal Liveinternet Twitter ="Google Ya.ru FriendFeed Memori.ru BobrDobr.ru MoeMesto.ru Mister Wong del.icio.us

Оценить:

Нашли необходимую информацию? Подпишитесь на обновления Научного блога. Поддержите проект.

Статьи по теме