Канал в телеграммКанал в Дзен

Deepgram Nova-3 Medical: речевая модель с ИИ сокращает количество ошибок в медицинской транскрипции

Deepgram Nova-3 Medical: речевая модель с искусственным интеллектом сокращает количество ошибок в медицинской транскрипции
Дата публикации 1 неделю назад
Время на прочтение 3 мин
Компания Deepgram представила Nova-3 Medical, модель преобразования речи в текст с помощью искусственного интеллекта (STT), предназначенную для транскрипции в сложных условиях здравоохранения.

Разработанный для беспрепятственной интеграции с существующими клиническими рабочими процессами, Nova-3 Medical стремится удовлетворить растущую потребность в точной и эффективной транскрипции в государственном ландшафте NHS и частном здравоохранении Великобритании.

Поскольку электронные медицинские карты (EHR), телемедицина и цифровые платформы здравоохранения становятся все более распространенными, спрос на надежную транскрипцию на основе ИИ никогда не был выше. Однако традиционные модели речи к тексту часто борются со сложным и специализированным словарным запасом, используемым в клинических условиях, что приводит к ошибкам и «галлюцинациям», которые могут поставить под угрозу уход за пациентами.

Компания Deepgram Nova-3 Medical разработана для преодоления этих проблем. Модель использует передовое машинное обучение и специализированную медицинскую лексику для точного захвата медицинских терминов, аббревиатур и клинического жаргона - даже в сложных звуковых условиях. Это особенно важно в условиях, когда медицинские работники могут отойти от записывающих устройств.

«Nova‐3 Medical представляет собой значительный скачок вперед в нашей приверженности преобразованию клинической документации с помощью ИИ», - сказал Скотт Стивенсон, генеральный директор Deepgram. «Учитывая нюансы клинического языка и предлагая беспрецедентную настройку, мы даем возможность разработчикам создавать продукты, которые улучшают уход за пациентами и операционную эффективность».

Одной из ключевых особенностей модели является ее способность доставлять структурированные транскрипции, которые легко интегрируются с клиническими рабочими процессами и системами EHR, обеспечивая точное и легкодоступное жизненно важные данные пациентов. Модель также предлагает гибкую настройку самообслуживания, включая Keyterm Prompting на срок до 100 ключевых терминов, что позволяет разработчикам адаптировать решение к уникальным потребностям различных медицинских специальностей.

Универсальные опции развертывания, включая локальные и виртуальные конфигурации частного облака (VPC), обеспечивают безопасность корпоративного уровня и соответствие HIPAA, что имеет решающее значение для соблюдения правил защиты данных в Великобритании.

«Речь в текст для корпоративных случаев использования не является тривиальной, и существует фундаментальное различие между платформами голосового ИИ, предназначенными для корпоративных кейсов, и развлекательными случаями использования», - сказал Кевин Фредрик, управляющий партнер OneReach.ai. «Модель Nova-3 от Deepemgram и Nova-3-Medical — это ведущие голосовые предложения ИИ, включая TTS, с точки зрения точности, задержки, эффективности и масштабируемости, необходимых для корпоративных случаев использования».

Benchmarking Nova-3 Medical: точность, скорость и эффективность

Deepgram провела бенчмаркинг, чтобы продемонстрировать производительность Nova-3 Medical. Модель утверждает, что обеспечивает ведущую в отрасли точность транскрипции, оптимизируя как общее распознавание слов, так и критическую точность медицинского термина.

  1. Уровень ошибок в словах (WER): при медианной WER 3,45%, Nova-3 Medical превосходит конкурентов, достигнув снижения ошибок на 63,6% по сравнению со следующим лучшим конкурентом. Эта повышенная точность сводит к минимуму ручные корректировки и оптимизирует рабочие процессы.
  2. Коэффициент ошибок ключевых слов (KER): Важно отметить, что Nova-3 Medical достигает KER 6,79%, что означает снижение ошибок на 40,35% по сравнению со следующим лучшим конкурентом. Это гарантирует, что критические медицинские термины, такие как названия лекарств и условия, точно расшифровываются, что снижает риск недопонимания и проблем безопасности пациентов.

Помимо точности, Nova-3 Medical выделяется в приложениях в реальном времени. Модель транскрибирует речь на 5-40x быстрее, чем многие альтернативные поставщики распознавания речи, что делает ее идеальной для телемедицины и цифровых платформ здравоохранения. Его масштабируемая архитектура обеспечивает высокую производительность, даже когда объемы транскрипции увеличиваются.

Кроме того, Nova-3 Medical разработана, чтобы быть экономически эффективной. Начиная с $ 0,0077 за минуту потокового аудио, что, по утверждению Deepgram, более чем в два раза доступнее, чем ведущие облачные провайдеры, что позволяет медицинским технологическим компаниям реинвестировать в инновации и ускорять разработку продуктов.

Deepgram Nova-3 Medical стремится дать возможность разработчикам создавать преобразующие приложения для медицинской транскрипции, что приводит к исключительным результатам в области здравоохранения.

Поделиться:
ВконтактеТелеграм