Опыт использования инструментов для анализа данных клинических исследований

В 2022 году в журнале «Реальная клиническая практика: данные и доказательства» вышла статья нашей коллеги Наталии Дмитриевой, которая возглавляет отдел аналитики. Статья посвящена аналитическим инструментам, которые мы, команда Aston Health, используем для обработки и визуализации данных наблюдательных программ, регистров пациентов и в других проектах.
01.04.2022

В 2022 году в журнале «Реальная клиническая практика: данные и доказательства» вышла статья нашей коллеги Наталии Дмитриевой, которая возглавляет отдел аналитики. Статья посвящена аналитическим инструментам, которые мы, команда Aston Health, используем для обработки и визуализации данных наблюдательных программ, регистров пациентов и в других проектах. В статье описаны подходы к работе по обработке и визуализации данных, которые применялись в наших проектах.

Мы задали Наталии несколько вопросов, чтобы прояснить, какие преимущества даёт использование современных инструментов при обработке данных в исследованиях.


Наталия, расскажите, пожалуйста, что нам мешает использовать при систематизации информации, например, Excel?

Здравствуйте. Для любого исследовательского проекта характерно наличие больших объемов данных, на все параметры и на каждое поле нужно накладывать много ограничений. В большинстве исследований задействовано большое количество участников, и информация об объекте исследования (в нашем случае это пациент) собирается из разных источников. Например, в одной из наблюдательных программ планируется включить в исследование более 10 000 пациентов, с дополнительным наблюдением таких пациентов в течение года, проведением пациента через 3 точки контроля с фиксацией дополнительной информации по оперативным вмешательствам, нежелательным явлениям, результатам анализов и терапии этих пациентов. Данные об анамнезе, диагнозе, жалобах собирает и вносит в систему врач, данные лабораторных исследований приходят из лаборатории и т.д. Очевидно, если не использовать удобный инструмент, где для каждого участника исследования предусмотрены свои формы для ввода, содержащие все нужные поля для заполнения и пр., тогда мы не сможем сделать данные чистыми и не сможем провести их статистический анализ.

Ключевым моментом, почему невозможно использовать условный Excel, является защита персональных медицинских (специальных) данных. Система для сбора информации должна соответствовать требованиям к безопасности информации, иметь разграничения доступа к данным и пр. Проще и правильнее организовать сбор данных в профессиональных системах, предназначенных и сертифицированных для хранения и обработки персональных данных.

Хочу отметить, что, прежде чем cобирать и обрабатывать данные, искать в них закономерности и делать на их основе какие-либо выводы, необходимо разработать и утвердить дизайн исследования. Основываясь на стандартах организации исследований мы, с участием заказчика и с куратором проекта, формируем ряд гипотез, которые будут проверяться в ходе проекта, и набор данных, достаточных для подтверждения или опровержения этих гипотез. Именно в ходе этой подготовительной работы можно определить состав вопросов пациенту и перечень анализов, которые мы будем собирать в исследовании. И уже на основании дизайна исследования мы принимаем решение о том, какую систему использовать для сбора данных.

 

То есть для проведения исследования, как минимум, нужна некая система для ввода данных?

Конечно. Необходимо для каждой роли (для врача, для диагноста, для менеджера, научного работника) определить набор форм для ввода данных, перечень полей ввода в каждой форме, набор правил, отсекающих некорректный ввод данных, чтобы было легче их обрабатывать. И это только верхушка айсберга. Помимо этого, нужно настроить правила доступа к данным для разных ролей, напоминания, удобные интерфейсы для поиска пациента и данных по нему и многое другое. Для этого мы используем разработки Aston Health: CRM Quinta® и собственные web-решения, соответствующие описанным выше требованиям. Дополнительно мы проводим обучение всех участников проекта, и осуществляем постоянное сопровождение. Это позволяет нам быть уверенными, что вводимые данные о пациентах будут защищенными, валидными и содержать наименьшие количество ошибок.


Это важно… итак, дизайн исследования создан, все вовлеченные участники обучены и взаимодействуют с пациентами и вводят данные в систему. Наверняка, нужно анализировать какие-то отчеты в процессе проведения исследования?

Пока сбор данных в исследовании еще не завершен, мы мониторим промежуточные результаты. Крайне важно, чтобы информация вводилась в систему корректно. Мы контролируем, какие врачи и лаборатории нуждаются в дополнительных консультациях и оперативно проводим их. С точки зрения информации и данных важно, чтобы они были внесены корректно и в нужные поля всеми участниками. Тогда мы сможем их правильно обработать и интерпретировать. Конечно, куратор проекта и заказчик наблюдают за течением исследования.

В частности, задачи по поиску некорректно заполненных анкет и предоставления обобщенной отчетности возможно решить с помощью с помощью системы MS Power BI, которая позволяет нам в онлайн режиме визуализировать разные срезы информации, находить ошибки. И, конечно, предоставить любую необходимую детализацию для каждого участника. Описание некоторых примеров таких отчётов есть в статье


Расскажите о подведении итогов исследования. Для того, чтобы участники проекта смогли сделать вывод и описать ход и результаты наблюдательного исследования, им понадобятся обработанные биостатистиками данные? Врач, пусть даже, с учёной степенью, может не справиться с систематизацией информации?

Для предоставления качественных данных по результатам исследования нужен специалист со знаниями в области биостатистики. Как правило, это специалисты с техническим образованием, но могут быть и врачи, владеющие программным обеспечением для обработки статистических данных. Главное, это понимание основ биостатистики: алгоритмов принятия статистических гипотез, ограничений при использовании тех или иных статистических методов, понимание точности оценки того или иного критерия. Также, при обработке данных необходимо руководствоваться методическими рекомендациями по оценке качества статистического анализа для медицинских исследований.

С этого момента начинается самая большая и интересная часть работы с данными. Мы заранее подбираем модель, на основании которой будем интерпретировать результаты. Сейчас научное сообщество уделяет много внимания прогностическим моделям на основе алгоритмов машинного обучения и нейронных сетей, позволяющим прогнозировать состояние конкретного пациента в конкретный момент времени в будущем с учётом его текущего состояния.  Ряд таких методов был описан в статье

Также мы считаем важным, чтобы участники проекта получали доступ в т.ч. к сырым данным, и могли видеть не только итоговые графики, но и данные любого уровня детализации. В этом нам очень помогает Power BI, который позволяет кликать на каждом объекте и получать детальную информацию вплоть до каждого анализа, каждого посещения пациентом врача и пр.

 

Подробнее о нашем опыте проведения наблюдательных исследований можно ознакомиться на странице «Клинические регистры пациентов и наблюдательные программы».

 

С полным текстом статьи Вы можете познакомиться по ссылке.

 
Анастасия Жигалкина

Анастасия Жигалкина

ведущий менеджер по маркетинговым коммуникациям