Новая нейросеть Google определит болезни по кашлю

Ученые использовали больше 300 млн звуков для обучения ИИ-модели. Теперь она может выявлять коронавирус и туберкулез.
Кашель
Источник: Unsplash

Исследователи из компании Google создали новую нейросеть, которая позволяет определять болезни по кашлю человека. ИИ-модель называется Health Acoustic Representations (HeAR), что в переводе значит «Звуковая картина здоровья».

Систему разработали специалисты из Google Research вместе с учеными из Центра исследований инфекционных заболеваний в Замбии. Создание HeAR началось в связи с пандемией коронавируса COVID-19. Исследователи выяснили, что определить заболевание можно по кашлю.

Ученые создали большую базу человеческих звуков из видео на YouTube. Это больше 300 млн коротких фрагментов и почти 174 тыс. часов аудио. В базу вошли дыхание, одышка, кашель, а затем каждую запись преобразовали в спектрограммы. Все звуки получили специальную пометку, например «бронхит» или другое заболевание. Затем некоторые части спектрограмм заблокировали, чтобы ИИ-модель смогла предсказывать недостающие фрагменты.

Натренированная нейросеть смогла определять COVID-19, туберкулез и другие болезни. Результаты ученые объяснили по шкале, где 0,5 — работа модели на уровне случайного предсказания, а 1 — точный результат. У HeAR получилось набрать 0,710 для обнаружения коронавируса и 0,739 — для туберкулеза. По словам Али Имрана, инженера из Университета Оклахомы в Талсе, значимость исследованию придает объем данных.

График сравнения производительности способов определения звуков
Источник: Arxiv

Ученые планируют вывести свою разработку на массовый рынок в США. Для этого необходимо провести клинические испытания и получить одобрение Управления по контролю за продуктами и лекарствами. Сейчас в Штатах нет продуктов по диагностике с помощью звука, которые получили разрешение от властей.

Исследователи используют новые нейросети в самых разных направлениях. Например, в Бельгии сделали ИИ-модель, которая поможет улучшить вкус пива.