Специалисты из компании Google разработали инновационное средство машинного обучения, способное помогать в выявлении различных заболеваний путем анализа звуков кашля и дыхания. Это технологическое решение на основе искусственного интеллекта (ИИ), обученного на огромном объеме аудиозаписей с человеческими звуками, может быть в будущем использовано медицинскими специалистами для диагностики различных заболеваний, включая COVID-19 и туберкулез, а также для оценки функциональности легких пациента. Это сообщается в издании Nature.
Использование звука в качестве биомаркера для диагностики заболеваний не является новым явлением. Методика привлекла особое внимание во время пандемии COVID-19, когда исследователи обнаружили, что по звуку кашля можно предположить наличие респираторного заболевания.
Отличительной особенностью разработанной Google системы, получившей название «Health Acoustic Representations» (HeAR), является масштабный объем обучающих данных и гибкость настройки для решения различных задач. Ученые, представившие предварительные результаты своей работы в начале марта, отмечают, что рано говорить о возможности коммерциализации HeAR. На данный момент планируется предоставить доступ к модели заинтересованным исследователям для их научных изысканий.
«Мы стремимся к стимулированию инноваций в этой новой области деятельности как часть нашей миссии в Google Research», - отмечает менеджер продукта из Нью-Йорка, Суджей Какармат.
В большинстве случаев используемых в этой сфере технологий ИИ модели обучаются на аудиозаписях, таких как кашель, сопоставляемых с информацией о здоровье человека, который издал эти звуки. Благодаря продвинутым алгоритмам и обширному обучающему набору данных HeAR обладает потенциалом для значительного прогресса в области медицинской диагностики на основе звуковых данных.
На практике система HeAR может значительно сократить время диагностики и улучшить точность результатов, делая процесс медицинского обследования более эффективным и доступным. Однако, для широкого внедрения подобных технологий необходимо прохождение серьезных клинических испытаний и получение соответствующих разрешений от регулирующих органов.
По словам Суджея Какармата, Google Research продолжит совершенствовать разработанную технологию и активно взаимодействовать со специалистами и медицинским сообществом для развития области здравоохранения с применением современных вычислительных методов. В будущем такие инновационные решения в области медицинской диагностики могут стать неотъемлемой частью повседневной практики врачей, повышая эффективность лечения и улучшая качество оказываемой медицинской помощи.
Для того чтобы улучшить точность и эффективность диагностики респираторных заболеваний, исследователи Google разработали инновационный инструмент HeAR. Этот инструмент способен анализировать звуковые данные, связанные с гортанными звуками, чтобы определить наличие различных заболеваний, включая COVID-19, туберкулез и последствия длительного курения.
В отличие от традиционного контролируемого обучения в медицинской сфере, исследователи Google использовали самостоятельное обучение на большом объеме неаннотированных данных. Этот подход позволил извлечь и обработать более 300 миллионов звуковых фрагментов, включая кашель, дыхание и другие звуки, из видео на YouTube.
Каждый звуковой фрагмент был преобразован в визуальное представление с помощью спектрограммы, что помогло модели адаптироваться к различным акустическим особенностям. Исследователи затем применили технику блокирования сегментов спектрограмм для обучения модели предсказывать отсутствующие части звуковых данных.
Такой подход напоминает обучение больших языковых моделей, используемых в чат-ботах, где модель обучается предсказывать следующее слово в предложении. Базовая модель, созданная исследователями Google, может быть адаптирована для различных задач в области медицины, включая диагностику респираторных заболеваний.
HeAR представляет собой инновационный подход к диагностике заболеваний на основе анализа звуковых данных, что может значительно улучшить процесс выявления и лечения пациентов. Этот метод дает надежное и точное средство для определения заболеваний и их комплексного анализа, обеспечивая врачам дополнительные инструменты для принятия обоснованных медицинских решений.
Результаты исследования показывают, что использование самообучаемой модели на базе анализа звуковых данных может значительно улучшить качество диагностики, ускорить процесс определения заболеваний и повысить эффективность лечения пациентов.
Инструмент HeAR от Google представляет собой новаторское решение, которое внедряет передовые технологии машинного обучения и анализа данных в сферу медицины, открывая новые возможности для развития диагностических методик и лечебных подходов.
Ученые обучили модель на широком спектре человеческих звуков, чтобы настроить ее, им пришлось предоставить лишь ограниченные данные, помеченные заболеваниями и характеристиками.
Результаты показали, что модель HeAR достигла точности 0.645 и 0.710 при обнаружении COVID-19 в зависимости от используемого набора данных, превзойдя существующие модели, обученные на звуке или аудио. Для туберкулеза ее точность составила 0.739.
Разнообразие тренировочных данных с разным качеством звука позволило создать обобщаемые результаты, по словам исследователя Какармата.
Инженер из Оклахомского университета в Талсе, Али Имран, отмечает, что масштаб использованных Google данных добавляет значимости этому исследованию.
"Это укрепляет наше доверие в этот инструмент", - подчеркнул он.
Область акустического здоровья, или «аудиомика», рассматривается как перспективная. По мнению Бенсуссана, "акустическая наука существует уже десятилетия. Но теперь мы имеем возможности для сбора и анализа больших объемов данных одновременно благодаря искусственному интеллекту и машинному обучению".