
В рамках важного шага по интеграции искусственного интеллекта в традиционную медицину компания Google объявила о стратегическом партнерстве с Included Health для проведения общенационального рандомизированного контролируемого исследования (РКИ) по оценке разговорного ИИ в реальных условиях виртуальной медицинской помощи. Это сотрудничество знаменует собой значительный отход от теоретических моделей и симуляционных тестов, внедряя передовые модели ИИ непосредственно в регулируемые клинические рабочие процессы на всей территории США.
Пока индустрия здравоохранения борется с выгоранием врачей и проблемами доступности, эта инициатива представляет собой одну из первых попыток получить строгие доказательства того, как большие языковые модели (LLM), специально настроенные для медицинских рассуждений, работают при взаимодействии с реальными пациентами в стандартных клинических условиях.
В последние несколько лет в дискуссиях о медицинском ИИ преобладали бенчмарки и контролируемые симуляции. Собственные исследования Google, особенно в отношении системы AMIE (Articulate Medical Intelligence Explorer), показали, что ИИ может соответствовать или даже превосходить врачей первичного звена в точности диагностики и манере общения во время текстовых консультаций с актерами, исполняющими роль пациентов. Однако перенос этих «лабораторных результатов» в сложную и непредсказуемую реальность фактического оказания медицинской помощи требует валидации иного уровня.
Это новое исследование устраняет данный пробел, выходя за рамки ретроспективного анализа данных и симуляционных сред. Сотрудничая с Included Health, ведущим американским поставщиком медицинских услуг с огромным охватом в сфере виртуальной помощи, Google переводит свои исследования в формат проспективного, добровольного, общенационального рандомизированного исследования.
Основная цель — оценить полезность, безопасность и влияние разговорного ИИ при управлении взаимодействием с пациентами. В отличие от предыдущих итераций, сосредоточенных на осуществимости, это исследование направлено на получение высококачественных доказательств путем сравнения рабочих процессов с поддержкой ИИ со стандартной клинической практикой. Такой строгий подход отражает клинические испытания, используемые для новых фармацевтических препаратов, устанавливая новый стандарт валидации цифровых технологий здравоохранения перед их широким внедрением.
Системы ИИ, оцениваемые в этом исследовании, не являются обычными чат-ботами; они представляют собой результат многолетних целевых исследований различных аспектов медицинского интеллекта. Google выстроила свою разработку вокруг трех основных столпов, которые, вероятно, сойдутся в этом практическом применении:
Синтезируя эти возможности, исследование ставит целью оценить систему ИИ, которая может не только диагностировать, но и направлять, а также комплексно управлять процессом заботы о здоровье пациента.
Партнерство с Included Health позволяет проводить оценку в масштабах, которые ранее были недостижимы. Исследование следует «поэтапному подходу» — методологии, ориентированной прежде всего на безопасность, что необходимо для получения одобрения Институционального наблюдательного совета (IRB).
Перед этим общенациональным запуском Google провела одноцентровое исследование осуществимости совместно с медицинским центром Beth Israel Deaconess. Этот конкретный этап был разработан для стресс-тестирования протоколов безопасности и измерения таких показателей, как количество вмешательств со стороны кураторов по безопасности. Получив убедительные подтверждения безопасности на начальном этапе, исследование теперь расширяется до распределенной общенациональной когорты.
В следующей таблице показана эволюция исследований Google в области медицинского ИИ, что подчеркивает значимость этого нового этапа:
Сравнение этапов медицинских ИИ-исследований Google
| Этап | Условия | Участники | Основная цель |
|---|---|---|---|
| Фундаментальные исследования | Симуляционные среды | Актеры-пациенты и синтетические сценарии | Демонстрация «искусства возможного» и точности диагностики |
| Исследование осуществимости | Одноцентровое (Beth Israel) | Ограниченная когорта пациентов | Проверка протоколов безопасности и случаев вмешательства куратора |
| Общенациональное РКИ | Реальная виртуальная помощь | Реальные пациенты, давшие согласие (национальный уровень) | Оценка полезности, результатов и сравнительной эффективности |
Критически важным компонентом этого исследования является участие человека в процессе (human-in-the-loop). Речь идет не о замене, а о дополнении. Цель состоит в том, чтобы определить, может ли ИИ взять на себя основную нагрузку по сбору информации, клиническому обоснованию и предварительному диалогу, тем самым «возвращая врачам время на общение с пациентами там, где это действительно важно».
В условиях виртуальной помощи, где врачи часто совмещают административное бремя с взаимодействием с пациентами, ИИ, способный точно подготовить историю болезни, предложить дифференциальные диагнозы или составить проекты планов лечения, может радикально повысить эффективность. Платформа Included Health предоставляет идеальную испытательную базу для этого, так как она уже обслуживает миллионы участников, получающих помощь удаленно.
Если исследование докажет, что ИИ может безопасно и эффективно управлять этим взаимодействием, это может открыть будущее, в котором высококвалифицированная медицинская экспертиза будет доступна по запросу, независимо от географического положения пациента. ИИ выступает в качестве множителя силы для ограниченного числа врачей.
Результаты этого исследования, вероятно, зададут тон для получения разрешений регулирующих органов и внедрения генеративного ИИ в здравоохранение на ближайшее десятилетие. Придерживаясь строгих стандартов рандомизированного контролируемого исследования, Google и Included Health сигнализируют о том, что подход «сойдет и так» неприемлем в медицине.
В случае успеха собранные данные подтвердят безопасность и полезность разговорного ИИ, что потенциально приведет к получению разрешений от регулирующих органов, позволяющих возмещать расходы на использование этих инструментов и интегрировать их в стандартные страховые планы. Это представляет собой переход от ИИ как инновационной игрушки к ИИ как клинически валидированному медицинскому устройству.
По мере продолжения исследования индустрия будет внимательно следить за данными, касающимися удовлетворенности пациентов, уровня ошибок и клинических результатов. Это партнерство — не просто тестирование технологии; это создание нового чертежа того, как должна оказываться медицинская помощь в цифровую эпоху.