Исследователи Массачусетского технологического института (MIT) обнаружили, что бессимптомные носители COVID-19 могут отличаться от здоровых тем, как они кашляют. Эти различия невозможно отличить человеческим ухом. Но оказывается, что их может подобрать искусственный интеллект.
В статье, опубликованной в IEEE Journal of Engineering in Medicine and Biology , рассказывают о модели искусственного интеллекта, которая отличает бессимптомных носителей вируса от здоровых людей с помощью записей собственного произвольного кашля, которые люди добровольно записывали на свой смартфон и отправляли разработчикам.

Исследователи обучили свою программу десяткам тысяч образцов кашля. Когда образцы кашля, полученные от группы испытателей, были загружены в программу, точность определения COVID-19-положительных носителей (с симптомами) составила 98,5%. А точность диагностики бессимптомных пациентов составила все 100%.
Команда работает над интеграцией сервиса в удобное мобильное приложение, которое, если оно будет одобрено медицинскими экспертами и организациями, потенциально может стать бесплатным, удобным, неинвазивным инструментом предварительного скрининга для выявления COVID-19 у пациентов без симптомов. Пользователь может ежедневно пользоваться приложением, отправлять звук своего кашля в телефон и мгновенно получать информацию о том, может ли он быть заражен, и нужно ли ему сделать тестирование на коронавирус.

Звуковые биомаркеры

Еще до начала пандемии исследовательские группы уже тренировали алгоритмы записи кашля на мобильные телефоны для точной диагностики таких состояний, как пневмония и астма. Аналогичным образом команда MIT разрабатывала модели искусственного интеллекта для анализа записей произвольного кашля, чтобы узнать, можно ли таким образом обнаружить признаки болезни Альцгеймера. Эта болезнь связана не только с ухудшением памяти, но и с нервно-мышечной деградацией, такой как ослабление голосовых связок.

Сначала ученые создали общий алгоритм машинного обучения или нейронную сеть, известную как ResNet50. С помощью этой нейросети можно распознавать звуки и определять в них силу голосовых связок. Исследования показали, что качество звука «mmmm» («мммм») может указывать на то, насколько сильны или слабы голосовые связки человека. Нейросеть обучали на аудиокнигах с более чем 1000 часами речи, чтобы научить отличать слово “them” («их») из других слов, таких как “The” (английский артикль) и “then” («тогда»).

Команда обучила вторую нейронную сеть различать эмоциональные состояния в речи, потому что пациенты с болезнью Альцгеймера и другими неврологическими расстройствами проявляют разочарование или уплощенный аффект чаще, чем они выражают счастье или спокойствие. Исследователи разработали модель классификатора эмоциональной речи, обучив ее с помощью актеров, интонирующих эмоциональные состояния, такие как нейтральный, спокойный, счастливый и грустный.

Затем исследователи загрузили базу данных различных примеров кашля в третью нейронную сеть, чтобы различать изменения в работе легких и дыхания.

Наконец, команда объединила все три модели и наложила алгоритм для обнаружения мышечной деградации. Алгоритм имитирует звуковую маску или слой шума, выделяя сильный кашель от более слабого.

С новой структурой искусственного интеллекта команда проанализировала аудиозаписи, в том числе пациентов с болезнью Альцгеймера, и обнаружила, что система может идентифицировать болезнь лучше, чем существующие модели диагностики. Результаты показали, что сила голосовых связок и настроения, показатели легких и дыхания, а также мышечная деградация были эффективными биомаркерами для диагностики заболевания.

Когда началась пандемия коронавируса, команда MIT задалась вопросом, может ли их система искусственного интеллекта для лечения болезни Альцгеймера также работать для диагностики COVID-19, поскольку появлялось все больше доказательств того, что инфицированные пациенты испытывали похожие неврологические симптомы, такие как временное нервно-мышечное нарушение.

Обработка больших данных

В апреле команда намеревалась собрать как можно больше записей кашля, в том числе у пациентов с COVID-19. Они создали веб-сайт, на котором люди могут записывать свой кашель на мобильный телефон или другое устройство с доступом в Интернет. Помимо этого, участники заполняют анкету, где описывают текущие симптомы, независимо от того, болеют ли они COVID-19, и был ли им поставлен диагноз с помощью официального теста. Участники также указывают свой пол, место жительства и родной язык.

На сегодняшний день исследователи собрали более 70 000 записей, каждая из которых содержит несколько примеров кашля. В общей сложности — это около 200 000 аудиосэмплов произвольного кашля, что, по мнению команды разработчиков, является крупнейшим набором данных исследования кашля в истории. Около 2500 записей были представлены людьми, у которых было подтверждено наличие COVID-19, в том числе бессимптомными.

Команда использовала 2500 записей коронавирусного кашля, а также еще 2500 записей, которые они случайным образом выбрали из коллекции, чтобы сбалансировать набор данных. 4000 таких образцов были взяты для обучения модели ИИ. Оставшиеся 1000 записей были затем введены в модель, чтобы увидеть, сможет ли она точно отличить кашель от пациентов с COVID-19 по сравнению со здоровыми людьми.

Бессимптомная диагностика

Модель данного искусственного интеллекта не предназначена для диагностики людей с симптомами COVID-19, поскольку они схожи или могут быть связаны с другими заболеваниями, такими как грипп или астма. Преимущество системы заключается в ее способности отличать бессимптомный кашель от здорового кашля.
Команда разрабатывает бесплатное приложение для предварительной диагностики на основе модели искусственного интеллекта. Они также сотрудничают с несколькими больницами по всему миру, чтобы расширять базу данных образцов кашля для последующего обучения модели и повышения ее точности.
Разработчики полагают, что пандемии могли бы уйти в прошлое, если бы инструменты предварительной диагностики всегда были под рукой.

В конечном итоге они прогнозируют, что аудио-модели искусственного интеллекта, подобные разработанной ими, могут быть внедрены в интеллектуальные устройства повсеместного пользования, чтобы люди могли удобно получать первоначальную оценку риска своего заболевания, возможно, на ежедневной основе.
Данное исследование было частично поддержано японской фармацевтической компанией Takeda Pharmaceutical Company Limited.

Первоисточники