Процесс изучения исследуемых показателей во времени описывается временными (динамическими рядами). Дискретные и непрерывные временные ряды встречаются в медицинской информатике, как в решении задач эпидемиологии, клинической медицины (функциональной диагностики), так и при изучении морфометрических данных, т.е. и прогноза их изменения. Представляю решение задачи, которая решена с использованием обученных MLP-сетей (многослойный персептрон).
Научная новизна
Впервые проведен анализ и прогнозирование уровней заболеваемости пневмониями с использованием MLP-сетей среди личного состава по призыву Самарского гарнизона.
Использование искусственных нейронных сетей для прогноза уровня инфекционной заболеваемости, в России, практически не встречается, а между тем, это многогранное поле их применения. Колебания уровня заболеваемости на протяжении анализируемого года, подобно колебаниям в многолетней динамике, возникают как результат сочетанного действия постоянно активных, периодически активизирующихся и нерегулярных причин. Возникновение нерегулярных случайных причин в годовой динамике связывают с вариациями уровня инфекционной заболеваемости в многолетней динамике или возникновением действия непредвиденного фактора риска. Периоды их активности распределяются на протяжении года беспорядочно. Результатом их действия является формирование «групповой заболеваемости», что служит причиной для создания условий возникновения эпидемических вспышек.
С целью выявления закономерностей, возникновения колебаний уровня заболеваемости была исследована заболеваемость пневмониями в организованных коллективах Самарского гарнизона.
Задачи исследования:
- Провести сбор исходной информации на основании МКСБ - 10 реестра.
- Провести анализ многолетней заболеваемости пневмониями классическим методом в период с 1994 по 2008 годы.
- Разработать методику анализа заболеваемости пневмониями с использованием MLP-сети (многослойного персептрона).
- Провести анализ развития эпидемического процесса и прогнозирования уровня заболеваемости пневмониями.
Результаты исследования
Сбор информации о заболеваемости пневмониями осуществлялся на основании МСКБ - 10 реестра с использованием разработанной автоматизированной программы ретроспективного и оперативного эпидемиологического анализа в гарнизоне (патент № от 7 июня 2007 г.). Заболеваемость пневмониями изучалась среди военнослужащих по призыву частей Самарского гарнизона в период с 1994 по 2008 годы.
При изучении причин заболеваемости по особенностям многолетней ее динамики исходят из существующих научных представлений о закономерностях проявления эпидемического процесса во времени. Согласно этим представлениям характер изменений уровня инфекционной заболеваемости в многолетней динамике определяется сочетанным действием множества разнообразных причин. По закономерности проявления своей активности во времени их разделяют на три группы.
Первую группу составляют причины, действующие постоянно на протяжении многих лет. Они определяют основное направление изменений интенсивности эпидемического процесса (рост, стабилизация, снижение) или многолетнюю эпидемическую тенденцию.
Вторая группа причин действует периодически, с тем или иным ритмом, достигая максимума и минимума активности через определенное число лет. Отличительным признаком данной формы проявления процесса является относительно упорядоченная волнообразность колебаний уровня регистрируемой заболеваемости.
Третья группа причин не имеет определенной упорядоченности действия во времени.
В качестве анализа многолетней заболеваемости пневмониями использован классический метод определения линейной регрессии.
Прямолинейная тенденция указывает на равномерное изменение интенсивности эпидемического процесса на протяжении анализируемого периода, связанное, как правило, с пропорциональным изменением роли в распространении инфекции определенной группы ведущих причин заболеваемости.
Если причины, формирующие тенденцию заболеваемости, действуют на протяжении анализируемого периода неравномерно, и эффект их действия постепенно уменьшается (нарастает), то тенденция приобретает криволинейную форму.
В результате исследования установлено (рис. 1), что уровни заболеваемости пневмониями, за первые три года наблюдений имеют резко выраженную тенденцию к уменьшению. В последующие периоды происходит резкое изменение уровней заболеваемости, которое отмечается в 2000 и 2004 годах.
Линейная регрессия показывает об умеренном снижении уровня заболеваемости с ежегодным темпом - 0,790/00 и в то же время высоким уровнем среднемноголетних наблюдений - 101,50/00 (при r2 = 0,005).
Рис. 1. Анализ заболеваемости пневмониями классическим методом наименьших квадратов
Прогноз уровня заболеваемости пневмониями среди личного состава частей Самарского гарнизона на 2009 год составляет при использовании классического метода прогнозирования - 89,90/00.
Нейросетевой прогноз в большей степени не совпадает в период повышения уровня заболеваемости пневмониями. Однако, при нормализации течения эпидемического процесса данной инфекции прогноз уровня отвечает фактическим наблюдениям.
С целью, выявления влияния резких подъемов за первые три года, на прогнозирование уровня заболеваемости пневмониями, выполнено укрупнение динамического ряда. Укрупнение динамического ряда выполнялось с использованием числа наблюдений равному трем, с применением методики «скользящей средней величины». Прогноз уровня заболеваемости выполнялся с помощью MLP-сети. MLP-сеть обучали методом обратного распространения ошибки. MLP-сеть имела в скрытом слое - 3 нейрона (ошибка обучения - 0,21) (рис. 2).
Рис. 2. Общий вид MLP-сети для прогноза уровней заболеваемости пневмониями
В качестве входных значений использовалось 10 последующих значений уровней заболеваемости пневмониями. Во-первых, это отвечает степенному обучению компьютера при использовании MLP-сети в соответствии с методикой укрупнения временного ряда. Во-вторых, такой укрупненный динамический ряд будет совпадать с максимальным значением инкубационного периода при пневмониях в формировании эпидемического процесса.
Рис. 3. Распределение укрупненного динамического ряда уровней заболеваемости пневмониями MLP-сетью
На рис. 3 показано распределение уровней заболеваемости пневмониями, которое выполняет MLP-сеть после первого этапа обучения.
MLP-сеть пройдя промежуточный этап, представляет окончательный вид первоначального распределения уровней заболеваемости пневмониями, прогноз с учетом временного ряда и распространения стандартизированной ошибки (рис. 4).
Использование MLP-сети в прогнозе уровня заболеваемости позволяет оценить прогнозируемые данные. Так представленные данные оказываются близкими при возникновении повышения уровня заболеваемости пневмониями к «необходимо существующим».
Рис. 4. Распределение уровня заболеваемости пневмониями, прогноза и стандартных ошибок с использованием MLP-сети
Например, полученные 39, 82, 157-е значения исследуемого динамического ряда, в представленном прогнозе соответствует теоретическим представлениям о течении эпидемического процесса. Подобные колебания уровней заболеваемости характерны для интенсивной фазы развития эпидемического процесса аэрозольных антропонозов.
Рис. 5. Автокорреляционный анализ распределения стандартной ошибки при прогнозировании уровней заболеваемости пневмониями MLP-сетью
Автокорреляционный анализ, представленный на рис. 5, показывает, что превышение стандартных ошибок предельного уровня отмечается только вначале обучения компьютера MLP-сетью. Это связано с оптимизацией работы компьютера. Далее стандартные ошибки очень не высокие. Повышение значений стандартных ошибок отмечается только при условии активизации эпидемического процесса, при повышении уровня заболеваемости пневмониями.
Составленный прогноз заболеваемости пневмониями на основании MLP-сетью, изображен на рисунке 4, в виде пунктирной линии красного цвета. Фактический уровень ежемесячной заболеваемости за 2009 год представлен на рис. 6.
Рис. 6. Ежемесячное распределение уровней заболеваемости пневмониями в 2009 году
Ежемесячное распределение уровней заболеваемости пневмониями практически совпадает с прогнозом, составленным MLP-сетью. Степень достоверности составляет r2 = 0,74 (при Р= 0,03).
Таким образом, анализ уровня заболеваемости и результат прогноза MLP-сетью, позволяет представить истинную картину течения эпидемического процесса анализируемой инфекции.
Выводы:
- Искусственные нейронные сети выгодно отличаются от статистических методов, в первую очередь тем, что они достаточно гибки и позволяют произвольно учитывать произвольное количество внешних, даже не известных факторов, что особенно важно в изучении эпидемического процесса. Такие сторонние факторы различно влияют на изменение прогнозируемого уровня заболеваемости.
- Для корректного прогнозирования с учетом различных факторов необходима декомпозиция временного ряда.
- Комплекс обученных искусственных нейронных сетей должен использоваться в блочной системе суперкомитета, позволяющего наряду с ними использовать и статистические алгоритмы (например, регрессионные модели).
- При отслеживании такой системой качества работы в каждой группе на новых данных, определяется их точность и вес каждой нейросети, что должно учитываться, в будущем, при построении прогнозов для самых различных условий.
СПИСОК ЛИТЕРАТУРЫ
- Громашевский Л.В. Общая эпидемиология. - М.: Медгиз, 1949 - стр.320
- Беляков В.Д. Проблема саморегуляции паразитарных систем и механизм развития эпидемического процесса// Журн. Микробиол. - 1985 - №5 - стр. 53-58
- Покровский В.И. Социально - экономический анализ инфекционной патологии: прошлое, настоящее и будущее//Социально - экономическая значимость инфекционных болезней: Сб. науч. Тр. - М., 2002 - стр. 3-8
- Информатика в эпидемиологии. Сб. Отв.ред. В.И.Васильева. М., НИИЭМ им. Н.Ф. Гамалеи, 1990.
- Фролов Ю.В. Интеллектуальные системы и управленческие решения. М., МГПУ, 2000, 294 С.
- Поступайло В.Б. Совершенствование эпидемиологического анализа инфекционной заболеваемости (Руководство для врачей) // Под редакцией профессора Н.Ф. Никитюк //, Самара, 2008г. - 125 с.