banner
Centro de Noticias
Articulado y competente en su experiencia.

Gestos quirúrgicos como método para cuantificar el rendimiento quirúrgico y predecir los resultados del paciente

May 06, 2023

npj Digital Medicine volumen 5, Número de artículo: 187 (2022) Citar este artículo

2035 Accesos

3 citas

27 Altmetric

Detalles de métricas

Qué tan bien se realiza una cirugía afecta los resultados de un paciente; sin embargo, la cuantificación objetiva del rendimiento sigue siendo un desafío sin resolver. La deconstrucción de un procedimiento en "gestos" discretos entre instrumentos y tejidos es una forma emergente de entender la cirugía. Para establecer este paradigma en un procedimiento donde el rendimiento es el factor más importante para los resultados del paciente, identificamos 34 323 gestos individuales realizados en 80 prostatectomías radicales asistidas por robot con preservación nerviosa de dos centros médicos internacionales. Los gestos se clasifican en nueve gestos de disección distintos (p. ej., corte en caliente) y cuatro gestos de apoyo (p. ej., retracción). Nuestro resultado principal es identificar los factores que afectan la recuperación de la función eréctil (FE) de un paciente al cabo de 1 año después de la prostatectomía radical. Encontramos que menos uso de corte en caliente y más uso de pelar/empujar están estadísticamente asociados con una mejor probabilidad de recuperación de EF de 1 año. Nuestros resultados también muestran interacciones entre la experiencia del cirujano y los tipos de gestos: una selección de gestos similar dio como resultado diferentes tasas de recuperación de FE dependiendo de la experiencia del cirujano. Para validar aún más este marco, dos equipos construyen de forma independiente distintos modelos de aprendizaje automático utilizando secuencias de gestos frente a características clínicas tradicionales para predecir la FE de 1 año. En ambos modelos, las secuencias de gestos pueden predecir mejor la FE de 1 año (Equipo 1: AUC 0,77, IC del 95 % 0,73–0,81; Equipo 2: AUC 0,68, IC del 95 % 0,66–0,70) que las características clínicas tradicionales (Equipo 1: AUC 0,69, IC 95 % 0,65–0,73; Equipo 2: AUC 0,65, IC 95 % 0,62–0,68). Nuestros resultados sugieren que los gestos proporcionan un método granular para indicar objetivamente el rendimiento y los resultados quirúrgicos. La aplicación de esta metodología a otras cirugías puede conducir a descubrimientos sobre métodos para mejorar la cirugía.

En la última década, la creciente evidencia ha demostrado que el desempeño quirúrgico impacta significativamente en los resultados quirúrgicos1,2. Por ejemplo, una menor habilidad quirúrgica en el bypass gástrico laparoscópico se asocia con mayores tasas de complicaciones, mayores tasas de mortalidad, operaciones más prolongadas y mayores tasas de reoperación y readmisión1. Para mejorar los resultados quirúrgicos, primero se debe cuantificar el rendimiento quirúrgico3. Sin embargo, sigue siendo un desafío lograrlo objetivamente.

Los gestos quirúrgicos, definidos como la interacción significativa más pequeña de un instrumento quirúrgico con tejido humano4,5, son un enfoque novedoso para deconstruir la cirugía. Tienen el potencial de cuantificar objetivamente la cirugía mientras brindan retroalimentación procesable para los aprendices. Anteriormente, desarrollamos un sistema de clasificación de gestos quirúrgicos de disección que constaba de nueve gestos de disección distintos (p. ej., corte en frío) y cuatro gestos de apoyo (p. ej., retracción) (Fig. 1a)5. Encontramos que diferentes selecciones de gestos quirúrgicos durante el paso de disección hiliar de la nefrectomía parcial asistida por robot pueden distinguir la experiencia de los cirujanos5. Sin embargo, aún no está claro si los diferentes gestos quirúrgicos están asociados con los resultados de los pacientes después de la cirugía.

una clasificación de gestos, incluidos 9 gestos de disección y 4 gestos de apoyo. b Secuencias de gestos para preservar los nervios codificadas por colores (que muestran solo los primeros 100 gestos). Los colores representaban los gestos correspondientes en a. c Proceso de construcción del modelo de predicción de recuperación de FE a un año. Dos equipos construyeron y probaron de forma independiente sus modelos de predicción para confirmar la reproducibilidad de los resultados.

La prostatectomía radical asistida por robot (RARP, por sus siglas en inglés), el tratamiento más común para el cáncer de próstata, es un caso de prueba ideal para evaluar si los gestos quirúrgicos se relacionan con los resultados de un paciente porque tiene un resultado funcional concreto y fácil de medir que está altamente asociado con el desempeño quirúrgico6. La disfunción eréctil después de la PRAR tiene un profundo impacto en la calidad de vida de un hombre y más del 60 % de los hombres experimentan esta complicación a largo plazo debido a la lesión de los nervios que corren a lo largo de la próstata7. Durante la preservación de nervios (NS), los cirujanos separan suavemente estos nervios de la próstata. Los cambios mínimos en la técnica de disección de un cirujano pueden tener un gran impacto en la recuperación de la potencia del paciente8. Amplia evidencia sugiere que el desempeño de un cirujano es importante: mientras que los pacientes de los cirujanos de primer nivel tienen casi un 50 % de posibilidades de recuperar la potencia, los pacientes de los cirujanos de nivel inferior tienen menos del 20 % de posibilidades9.

Dada la asociación entre la calidad de la preservación de los nervios y el riesgo de disfunción eréctil posoperatoria, nuestro objetivo principal es examinar si los gestos utilizados durante el paso NS de RARP pueden predecir las tasas de disfunción eréctil después de la cirugía. El objetivo secundario es estudiar la selección de gestos quirúrgicos por parte de cirujanos de diferentes niveles de experiencia para profundizar nuestra comprensión de las diferentes técnicas de disección de preservación de nervios. Nuestra hipótesis es que los gestos quirúrgicos se pueden utilizar como una herramienta eficaz para cuantificar las habilidades técnicas y, potencialmente, indicar los resultados quirúrgicos.

En este estudio bicéntrico internacional, encontramos que menos uso de corte en caliente y más uso de pelar/empujar durante NS están asociados con una mejor probabilidad de recuperación de EF de 1 año. Además, utilizando secuencias de gestos de disección durante NS, se pueden construir modelos ML para predecir con precisión la recuperación de EF. Además, encontramos cirujanos con diferentes niveles de experiencia que utilizan diferentes gestos quirúrgicos durante la SN. Estos resultados sugieren que desglosar la cirugía al nivel de los gestos quirúrgicos puede servir como un método novedoso para medir el rendimiento quirúrgico, que puede tener aplicaciones más amplias en diferentes especialidades quirúrgicas para predecir los resultados quirúrgicos y brindar retroalimentación procesable.

Seiscientos diecinueve casos consecutivos de PRAR fueron candidatos para este estudio y, finalmente, 80 casos de 21 cirujanos de 2 centros quirúrgicos internacionales cumplieron con nuestros criterios de inclusión/exclusión (Fig. 2). Se excluyó a la mayoría de los pacientes porque no tenían una función eréctil basal que conservar durante la cirugía. La mediana de casos quirúrgicos robóticos previos de estos 21 cirujanos practicantes fue de 450 (rango 100-5800) casos. Hubo una brecha en la experiencia quirúrgica robótica entre un grupo de 6 superexpertos (mediana de 3000 casos, rango de 2000 a 5800) y un grupo de 15 expertos (mediana de 275 casos, rango de 100 a 750) (Tabla complementaria 1).

Inscripción de 80 casos RARP.

En general, la tasa de recuperación de FE postoperatoria de 1 año fue 34/80 (43%). Los pacientes que recuperaron la FE eran significativamente más jóvenes (p = 0,02, prueba Chi-cuadrado) y tenían un mejor estado físico según la Sociedad Americana de Anestesiología (ASA) (p = 0,03, prueba Chi-cuadrado) (tabla 1). Los pacientes que recuperaron la FE tuvieron una mayor proporción de preservación total del nervio (76,5 % frente a 69,6 %), aunque esto no fue estadísticamente significativo (p = 0,49, prueba de Chi-cuadrado).

Se identificó una mediana de 438 gestos discretos (IQR 254-559) por caso NS. Los gestos de disección activa constituyeron el 65,7% del total de gestos y los gestos de apoyo el 34,3% restante (tabla 2).

Para evaluar si un tipo de gesto se relacionó significativamente con la recuperación de EF de 1 año, se comparó la proporción de cada tipo de gesto dentro de un caso entre pacientes con EF recuperados y no recuperados. Los pacientes que recuperaron la FE tuvieron menos corte en caliente (mediana 1,4 % frente a 1,9 %, p = 0,016, modelo mixto lineal generalizado [GLMM]) pero más peel/push (mediana 33,4 % frente a 29,7 %, p < 0,001, GLMM) (fig. 3a). Para confirmar los resultados, hicimos análisis de subgrupos en el grupo experto (Fig. 3b) y superexperto (Fig. 3c), respectivamente. En ambos grupos, los pacientes que recuperaron EF tuvieron más peel/push (p ≤ 0.001, GLMM). El uso de corte en caliente solo fue significativo en el grupo de expertos, donde los pacientes que recuperaron EF tuvieron más corte en caliente (p = 0,001, GLMM). Además, los pacientes que recuperaron la FE al año tuvieron menos corte en frío, más extensión, más gancho, menos retracción y menos coagulación en el grupo de expertos (todos p < 0,05, GLMM). En el grupo de superexpertos, el paciente que recuperó la FE de 1 año tuvo menos dispersión, menos gancho y más coagulación (todos p < 0,05, GLMM).

a Toda la cohorte; b grupo de expertos; c grupo de superexpertos.

Luego, dos equipos utilizaron secuencias de gestos y características clínicas para construir de forma independiente modelos de predicción de aprendizaje automático (ML) para la recuperación de EF de 1 año, para garantizar la reproducibilidad de los resultados. Al incluir solo secuencias de gestos quirúrgicos, ambos modelos lograron una capacidad moderadamente alta para predecir la recuperación de la FE en 1 año (AUC: Equipo 1: 0,77, IC del 95 % 0,73–0,81; Equipo 2: 0,68, IC del 95 % 0,66–0,70), que superó las características clínicas solas (AUC, Equipo 1: 0,69, IC del 95 % 0,65–0,73; Equipo 2: 0,65, IC del 95 % 0,62–0,68). Cuando los modelos incluyeron tanto gestos quirúrgicos como características clínicas (AUC, Equipo 1: 0,75, IC del 95 %: 0,72–0,77; Equipo 2: 0,67, IC del 95 %: 0,65–0,70), los modelos se desempeñaron de manera similar a los que incluyeron solo gestos quirúrgicos (Fig. . 4).

Gráficos de violín que muestran el rendimiento de los modelos de predicción de recuperación de EF de 1 año.

Para comprender cómo estos modelos hacen predicciones, elegimos el modelo del Equipo 1 debido a su mejor rendimiento y clasificamos las características clínicas importantes para la predicción de la FE a 1 año (Fig. 5a), que eran la puntuación de Gleason, la edad, el IMC, el PSA y el volumen de la próstata. . También emitimos secuencias de gestos importantes asociadas positiva o negativamente con la recuperación de EF de 1 año (Fig. 5b).

a Características clínicas importantes; b ejemplos de importantes secuencias de gestos quirúrgicos.

Para descartar la posibilidad de que los modelos ML simplemente aprendieron la predicción de la recuperación de EF de 1 año por la cantidad de gestos utilizados durante NS en lugar de aprender realmente de las secuencias de gestos en sí, clasificamos 80 casos según la cantidad de gestos y clasificamos los casos en cuatro cuartiles. Encontramos una tasa de recuperación de FE de 1 año similar en todos los cuartiles (p = 0,66, prueba de chi-cuadrado, tabla complementaria 2).

Los superexpertos utilizaron menos gestos que los expertos (mediana 317 frente a 530, p = 0,014, prueba U de Mann-Whitney) durante el paso NS. Esta tendencia estuvo presente tanto para los gestos de disección activa (es decir, pelar/empujar) como para los gestos de apoyo (es decir, mover la cámara, retraer) (Tabla 3).

Al comparar las proporciones de gestos utilizadas en la NS, encontramos que los superexpertos utilizaron más fiambres (mediana 18,0 % frente a 13,0 %, p = 0,001, GLMM), más coagulación (mediana 3,5 % frente a 2,0 %, p = 0,005, GLMM) , pero menos desprendimiento/empuje (mediana 27,0 % frente a 34,0 %, p = 0,024, GLMM) y menos ajustes de retracción (mediana 10,5 % frente a 16,0 %, p = 0,001, GLMM).

En particular, la tasa de recuperación de la FE informada fue similar entre los pacientes operados por superexpertos (23/53, 43,4 %) en comparación con los pacientes operados por expertos (11/27, 40,7 %, p = 0,82, prueba de chi-cuadrado). Las características clínicas de estos dos grupos de pacientes también fueron similares (Tabla complementaria 3).

En este estudio bicéntrico internacional, demostramos que (a) un menor uso de corte en caliente y un mayor uso de pelar/empujar se asociaron con una mejor probabilidad de recuperación de la FE en 1 año; (b) las secuencias de gestos quirúrgicos pueden predecir con éxito la recuperación de EF de 1 año después de RARP; y (c) las selecciones de gestos quirúrgicos se asociaron con los niveles de experiencia del cirujano. Además, dos equipos confirmaron de forma independiente la relación entre las secuencias de gestos quirúrgicos y los resultados quirúrgicos. Este método de doble esfuerzo rara vez se ha realizado en la literatura clínica, aunque ha sido ampliamente defendido por la comunidad de investigación de ML, con el fin de aumentar la solidez y confirmar la reproducibilidad de los hallazgos de ML10,11. Estos hallazgos sugieren que los gestos quirúrgicos pueden servir como un método novedoso para cuantificar el rendimiento quirúrgico y predecir los resultados funcionales después de la PRAR.

En este estudio demostramos una asociación entre los gestos quirúrgicos y los resultados quirúrgicos. Nuestros resultados indican que menos hot cut en NS está asociado con una mejor recuperación de la potencia, especialmente en el grupo de expertos (en lugar de los superexpertos). Esto es consistente con estudios previos que informaron que el uso intensivo de energía en el SN tiene un efecto perjudicial en los haces neurovasculares cercanos, lo que afecta la recuperación de la FE8,12. Más peel/push se asoció con una mejor recuperación de la potencia, lo que se confirmó tanto en el grupo de expertos como en el de superexpertos. Creemos que pelar/empujar es el gesto adecuado para encontrar el plano de disección correcto durante la NS, lo que a su vez puede generar mejores resultados. Cabe destacar que los resultados también mostraron interacciones entre la experiencia del cirujano y los tipos de gestos: los mismos tipos de gestos utilizados por cirujanos con diferentes niveles de experiencia pueden tener un impacto diferente en la recuperación de la FE. Por ejemplo, en el grupo de expertos, más dispersión, más gancho y menos coagulación se asociaron con una mayor probabilidad de recuperación de la FE, mientras que en el grupo de superexpertos, menos dispersión, menos gancho y más coagulación se asociaron con una mayor probabilidad de recuperación. de recuperación de FE. Estos hallazgos indican que no solo los tipos de gestos son importantes para los resultados, sino también la ejecución y el contexto de los gestos. En un estudio reciente, encontramos que las tasas de eficacia y error del mismo tipo de gestos eran diferentes entre principiantes, intermedios y expertos en el entorno de laboratorio seco13. Nuestro próximo paso explorará cómo estas diferencias afectan los resultados quirúrgicos en cirugías en vivo.

El mismo concepto debería ser aplicable a otros procedimientos quirúrgicos: al deconstruir la cirugía en gestos, el impacto de diferentes gestos en los resultados quirúrgicos se puede estudiar de manera cuantificable y objetiva. Convencionalmente, evaluar y cuantificar la cirugía ha sido un desafío. Una solución común es utilizar herramientas de evaluación objetiva como GEARS o DART para evaluar las habilidades quirúrgicas14,15,16. Desafortunadamente, estas herramientas sufren de subjetividad y no capturan datos quirúrgicos en su nivel más granular17. Un método alternativo para cuantificar el rendimiento quirúrgico es mediante el uso de métricas de rendimiento automatizadas (APM), como los datos cinemáticos de los instrumentos18. Los APM han podido distinguir la experiencia y predecir los resultados de los pacientes19,20. Pero una desventaja de las APM, que son en gran parte medidas de la eficiencia del cirujano, es que son difíciles de traducir en comentarios procesables18,19,21. Los gestos quirúrgicos tienen el potencial de cuantificar objetivamente la cirugía mientras brindan retroalimentación procesable para los aprendices. Estas métricas evalúan el desempeño del cirujano de manera diferente y contienen información relacionada pero diferente. Los gestos deconstruyen de manera integral la acción quirúrgica en el contexto de la interacción instrumento-tejido a partir de videos quirúrgicos; la cinemática proporciona información resumida sobre el movimiento del instrumento en función de sus coordenadas, lo que puede reflejar más la eficiencia del instrumento. Estos diferentes métodos de evaluación deben complementarse entre sí para obtener una imagen más completa del rendimiento quirúrgico.

La incorporación de gestos quirúrgicos en modelos ML predijo de manera efectiva la recuperación posoperatoria de EF de 1 año. Para confirmar la reproducibilidad de nuestros hallazgos, dos equipos de ML construyeron y evaluaron de forma independiente dos modelos de predicción. Ambos equipos confirmaron que había señales informativas dentro de la secuencia de gestos quirúrgicos que podían predecir la recuperación de EF con AUC moderadas-fuertes. Los diferentes tipos de gestos quirúrgicos utilizados en NS (p. ej., la proporción de corte en caliente) pueden explicar en parte cómo los modelos hicieron las predicciones. Además, los modelos ML también pueden utilizar la información temporal (secuencial) de los gestos quirúrgicos (es decir, el orden de los gestos quirúrgicos) que es difícil de capturar con los métodos estadísticos tradicionales. Es de destacar que el Equipo 1, que usó un modelo basado en transformador, que explotó información temporal (secuencia) de rango completo (la secuencia completa), logró AUC más altas que el Equipo 2, que usó una regresión logística, que explotó información temporal de rango corto (dividiendo toda la secuencia en segmentos no superpuestos de 20 gestos). Esto puede indicar que no solo el tipo de gestos, sino también la combinación y el orden de los gestos juegan un papel en la determinación de los resultados del paciente.

Nuestro estudio anterior encontró que los superexpertos tardaron menos tiempo en completar NS y tenían una mejor destreza bimanual en comparación con los expertos durante NS22. Aquí, utilizando el sistema de clasificación de gestos de disección, confirmamos que los superexpertos eran más rápidos y eficientes (es decir, utilizaban menos gestos). Al comparar la proporción de gestos de disección utilizada por superexpertos y expertos, encontramos que los superexpertos eligieron diferentes gestos en comparación con los expertos. Esto implica el uso potencial de gestos quirúrgicos para distinguir la experiencia.

En cuanto a las características clínicas, encontramos que los pacientes recuperados de FE eran más jóvenes y tenían mejores condiciones generales, lo que concuerda con publicaciones previas23,24. El uso exclusivo de las características clínicas para predecir la recuperación de la FE en 1 año logró AUC modestas. Publicaciones anteriores sugirieron que el estado de potencia basal de los pacientes es un factor crítico para la recuperación de la FE después de la PRAR23,24. Vale la pena señalar que todos los casos incluidos en este estudio tenían una FE preoperatoria intacta y puntuaciones muy altas en el inventario de salud sexual para hombres (SHIM) (mediana de 24, en una escala de 25), lo que puede haber mitigado el impacto de los factores del paciente en la recuperación de la FE predicción.

Los hallazgos de este estudio tienen importantes implicaciones clínicas. En ausencia de un sistema predictivo basado en ML, los cirujanos solo pueden recibir comentarios sobre los resultados del paciente, como la función eréctil, meses o años después de la operación. Esta desalineación temporal (entre la cirugía y el resultado) hace que sea difícil evaluar cómo sus acciones actuales afectarán al paciente en el futuro. Con el modelo de ML entrenado presentado en nuestro artículo, existe la posibilidad de proporcionar comentarios inmediatamente después de la cirugía, lo que puede permitir a los cirujanos incorporar rápidamente mejoras en sus cirugías posteriores. Además, nuestro grupo ha construido recientemente un algoritmo ML para automatizar la tarea de reconocimiento y clasificación de gestos25. Al combinarlo con el modelo ML en el estudio actual, existe la posibilidad de automatizar completamente todo el proceso, desde la anotación de video quirúrgico hasta la predicción del resultado del paciente, prediciendo directamente los resultados del paciente en tiempo real. Nuestro trabajo futuro se dedicará a la interpretabilidad del modelo, a fin de identificar secuencias de gestos de disección específicas importantes para los resultados del paciente, de modo que se pueda proporcionar una retroalimentación más procesable para los cirujanos en formación.

El presente estudio tiene algunas limitaciones. Primero, el tamaño de la muestra fue relativamente pequeño, lo que puede ampliarse en el futuro. No obstante, incluimos datos de dos instituciones para abordar la generalización. En segundo lugar, no consideramos el contexto de los gestos quirúrgicos ejercidos durante la SN. Los estudios futuros pueden atribuir los gestos a una anatomía específica (p. ej., pedículos, fascia lateral, etc.) y estudiar si los efectos son similares. En tercer lugar, este estudio solo usó un tipo de procedimiento quirúrgico (es decir, NS) y los hallazgos aún deben validarse en múltiples procedimientos en todas las especialidades. Finalmente, la complejidad del caso no se ajustó en el estudio actual debido a la falta de una medición objetiva de la complejidad del caso. Sigue siendo un factor de confusión para las asociaciones entre los gestos quirúrgicos y los resultados quirúrgicos.

En resumen, encontramos que los gestos de disección ejecutados durante NS fueron predictivos de recuperación de EF después de RARP. Menos uso de corte en caliente y más uso de pelar/empujar se asocian con mejores posibilidades de recuperación de EF. Los modelos ML están construidos para predecir con precisión la recuperación de EF. Además, correlacionamos los gestos quirúrgicos con la experiencia del cirujano. Estos hallazgos implican que la deconstrucción de la cirugía a la granularidad de los gestos quirúrgicos puede servir como un método novedoso para cuantificar el rendimiento quirúrgico, que potencialmente puede tener una aplicación más amplia en varias especialidades quirúrgicas para predecir los resultados quirúrgicos y proporcionar comentarios procesables.

Bajo la aprobación de las juntas de revisión institucional de la Universidad del Sur de California y St. Antonius-Hospital, los hombres que se sometieron a RARP primario de julio de 2016 a noviembre de 2018 de estas dos instituciones internacionales se recolectaron prospectivamente e incluyeron en este estudio si estaba presente lo siguiente: (un ) una FE inicial intacta; (b) secuencias completas de video quirúrgico de NS; y (c) seguimiento postoperatorio ≥ 1 año. Se excluyeron los casos bilaterales sin preservación de nervios. Se obtuvieron consentimientos por escrito de todos los pacientes incluidos en este estudio. El resultado primario fue la recuperación de la FE al año después de la PRAR. Tanto la FE basal intacta como la recuperación de la FE al año se definieron como lograr erecciones lo suficientemente firmes para tener relaciones sexuales en >50 % de los intentos (puntuación de ≥4 en la segunda pregunta del SHIM) con o sin inhibidores de la fosfodiesterasa tipo 526.

Los NS de los casos incluidos fueron realizados por cirujanos avanzados y cirujanos de la facultad. Los cirujanos se separaron en dos niveles de experiencia quirúrgica según publicaciones anteriores: expertos que habían realizado 100–1999 casos robóticos y superexpertos que habían realizado ≥2000 casos robóticos22,27.

Los datos clínicos se obtuvieron mediante la revisión de expedientes, que constaban de factores tanto del paciente como del tratamiento, como la edad, la puntuación SHIM28 preoperatoria, el estado físico ASA29, la extensión del NS, etc. (Tabla 1). Los datos de seguimiento a los 12 meses se obtuvieron mediante revisión de historias clínicas o por teléfono por parte de un coordinador de investigación independiente que utilizó los resultados informados por los pacientes.

Se revisaron manualmente las secuencias de video de NS bilaterales. Un total de 7 anotadores (RM, IR, GD, AD, SC, MO, SR) recibieron capacitación estandarizada y luego etiquetaron de forma independiente secuencias de gestos de tres videos de capacitación (365 gestos en total). La tasa de acuerdo de clasificación de gestos entre siete anotadores se evaluó calculando la proporción de etiquetas de gestos acordadas entre los 7 anotadores en el número total de gestos. Se logró una alta tasa de acuerdo entre evaluadores (328/365, 89,9 %), y luego se dividieron y anotaron 80 videos formales de NS entre los anotadores.

Cada movimiento quirúrgico discreto en el video fue etiquetado como un cierto gesto de acuerdo con nuestro sistema de clasificación, que incluye nueve gestos de disección activos y 4 gestos de apoyo (es decir, gestos destinados a facilitar los gestos de disección, por ejemplo, retracción) (Fig. 1)5. Cuando más de un instrumento se movía simultáneamente, el movimiento del instrumento de la mano dominante del cirujano de la consola se anotaba como el gesto principal.

Se utilizaron las pruebas U de Mann-Whitney y chi-cuadrado para comparar los datos demográficos continuos y categóricos de los pacientes, respectivamente. Se utilizó un modelo de efectos mixtos de varios niveles para evaluar la relación entre el estado de recuperación de EF de 1 año (variable independiente) y la proporción de cada tipo de gesto dentro de un caso (variable dependiente), teniendo en cuenta la agrupación de datos dado que múltiples casos fueron realizados por el mismo cirujano. La relación entre la experiencia del cirujano (variable independiente) y la proporción de cada tipo de gesto dentro de un caso (variable dependiente) también fue evaluada por el modelo multinivel de efectos mixtos para identificar las diferencias en la técnica de disección. El análisis estadístico se realizó utilizando IBM® SPSS v24, con p < 0,05 (bilateral) considerado como estadísticamente significativo.

Las secuencias de gestos (es decir, todos los gestos usados ​​en NS en el orden del tiempo) y las características clínicas (es decir, todas las variables que se muestran en la Tabla 1) se usaron para construir modelos de predicción para la recuperación de FE de 1 año. Para confirmar la reproducibilidad de los resultados, dos equipos de ML construyeron modelos de predicción de forma independiente utilizando algoritmos de ML y probaron el rendimiento del modelo.

El equipo 1 de ML (JX, LT, LY) entrenó un modelo de predicción multimodal, que consta de dos subredes utilizadas para manejar secuencias de gestos completas (una red basada en transformadores, es decir, IMV-LSTM30) y características clínicas (un transformador FT, es decir, red tabular para las características clínicas31). Las redes se eligieron debido a sus mecanismos de atención, que son módulos que aprenden a calcular la suma ponderada de todos los vectores de representación de gestos codificados, lo que permite que el modelo capture de manera flexible las dependencias a largo plazo y centre su atención en las partes más relevantes de toda la disección. secuencia. En la primera fase de entrenamiento, ambas subredes fueron entrenadas hasta convergencia con descenso de gradiente estocástico. En la segunda fase, las representaciones extraídas de cada red se concatenaron y se alimentaron en una capa completamente conectada para producir una única predicción de recuperación de EF. Luego, el modelo se evaluó mediante un método Monte-Carlo con un total de 100 iteraciones. En cada iteración, seleccionamos aleatoriamente 70 casos como datos de entrenamiento y los 10 casos restantes como el conjunto de espera para probar de forma independiente el rendimiento del modelo. Informamos el área bajo la curva ROC (AUC) y el intervalo de confianza (IC) del 95 % del conjunto de pruebas en las 100 iteraciones. Para ilustrar secuencias importantes para la predicción de EF, el Equipo 1 extrajo puntajes de atención para cada gesto dentro de una secuencia y se usaron técnicas de oclusión para extraer la direccionalidad como indicador de secuencias de gestos que se correlacionaron positiva o negativamente con la recuperación de EF.

El equipo ML 2 (DK, AA) construyó un modelo de predicción de regresión logística para la recuperación de EF de 1 año. Este modelo fue elegido por su simplicidad y para evitar memorizar los datos (es decir, sobreajuste). Al considerar únicamente las características clínicas, el modelo de regresión logística asignó directamente dichas características al resultado de recuperación de la FE a 1 año. Al considerar solo la secuencia de gestos, el Equipo 2 empleó un enfoque poco supervisado. Esto implicó dividir toda la secuencia de gestos en segmentos del mismo tamaño que no se superponen que comprenden 20 gestos (el número de gestos por segmento se determinó empíricamente en un conjunto retenido). Durante la fase de entrenamiento del modelo, cada segmento se mapeó en el resultado de recuperación de EF de 1 año específico del caso correspondiente. Por ejemplo, si un caso tiene 440 gestos, esto daría como resultado 440/20 = 22 subsecuencias de gestos. Cada subsecuencia puede considerarse equivalentemente como una muestra distinta en una base de datos. Con estas subsecuencias pertenecientes al mismo caso quirúrgico y un caso quirúrgico asociado con un solo objetivo (es decir, recuperación de EF), utilizamos el objetivo del caso para todas esas subsecuencias. Esto daría como resultado 22 pares de entrada-salida que consisten en subsecuencias de gestos de entrada y valores de recuperación de EF de salida. Repetimos esta estrategia para todos los casos quirúrgicos con el fin de generar la base de datos completa sobre la cual se entrenaría la regresión logística. Tal configuración se conoce como "aprendizaje supervisado débilmente" y, a menudo, se adopta para expandir el tamaño del conjunto de datos en el que se entrena un modelo. Tenga en cuenta que para las secuencias de gestos cuya longitud no era divisible por 20, el final de la secuencia de gestos se eliminó y, por lo tanto, no se presentó al modelo. Esto se debe a que un modelo de regresión logística espera entradas de una dimensión consistente. El modelo fue entrenado en la base de datos antes mencionada de subsecuencias de gestos y valores de recuperación de EF. Dada una subsecuencia de gestos (que comprende 20 gestos), el modelo devolvió una única predicción que refleja si el paciente recuperará o no la FE al cabo de 1 año. Estos 20 gestos no capturan toda la acción realizada por el cirujano durante el paso NS. Para capturar toda esa acción durante la inferencia, como es común con el aprendizaje supervisado débilmente, agregamos todas las predicciones del modelo para las subsecuencias que pertenecen al mismo caso quirúrgico. Implementamos una regla mayoritaria donde la predicción más probable en todas las muestras específicas de casos se consideró como la predicción final para ese caso quirúrgico en particular. Por ejemplo, si 15/22 muestras están asociadas con una predicción de recuperación de EF, entonces el modelo predice que este caso recuperará EF en 1 año. Al considerar tanto la secuencia de gestos de disección como las características clínicas, este equipo continuó empleando el enfoque de supervisión débil mencionado anteriormente. El equipo 2 implementó la misma configuración de evaluación que el equipo 1 e informó AUC con un IC del 95 % en las 100 iteraciones.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de investigación de Nature vinculado a este artículo.

Los conjuntos de datos generados y/o analizados durante el estudio actual están disponibles del autor correspondiente a pedido razonable.

El código de este artículo se puede encontrar en: https://github.com/crseusc/NS-Gestures-and-EF-outcomes.

Birkmeyer, JD et al. Habilidad quirúrgica y tasas de complicaciones después de la cirugía bariátrica. N. ingl. J.Med. 369, 1434–1442 (2013).

Artículo CAS Google Académico

Fecso, AB, Szasz, P., Kerezov, G. & Grantcharov, TP El efecto del rendimiento técnico en los resultados de los pacientes en cirugía: una revisión sistemática. Ana. Cirugía 265, 492–501 (2017).

Artículo Google Académico

Hung, AJ, Liu, Y. & Anandkumar, A. Aprendizaje profundo para automatizar la evaluación de habilidades técnicas en cirugía robótica. Cirugía JAMA. 156, 1059 (2021).

Artículo Google Académico

Meireles, OR et al. Recomendaciones de consenso de SAGES sobre un marco de anotación para video quirúrgico. Cirugía Endosc. 35, 4918–4929 (2021).

Artículo Google Académico

Ma, R. et al. Una nueva clasificación de gestos de disección para caracterizar la técnica de disección robótica para la disección hiliar renal. J. Urol. 205, 271–275 (2021).

Artículo Google Académico

Siegel, RL, Miller, KD, Fuchs, HE y Jemal, A. Estadísticas del cáncer, 2022. CA Cancer J. Clin. 72, 7–33 (2022).

Artículo Google Académico

Grupo de trabajo de servicios preventivos de EE. UU. et al. Detección del cáncer de próstata: Declaración de recomendación del Grupo de trabajo de servicios preventivos de EE. UU. JAMA 319, 1901–1913 (2018).

Artículo Google Académico

Basourakos, SP et al. Maniobras de prostatectomía radical asistida por robot para atenuar la disfunción eréctil: descripción técnica y compilación de videos. J. Endourol. https://doi.org/10.1089/end.2021.0081 (2021).

Vickers, A. et al. Control del cáncer y resultados funcionales después de la prostatectomía radical como marcadores de calidad quirúrgica: análisis de la heterogeneidad entre cirujanos en un solo centro oncológico. EUR. Urol. 59, 317–322 (2011).

Artículo Google Académico

Chen, AB et al. Aplicaciones de inteligencia artificial en urología: estándares de informes para lograr fluidez para los urólogos. Urol. clin. 49, 65–117 (2022).

Artículo Google Académico

Lambin, P. et al. Radiómica: el puente entre la imagen médica y la medicina personalizada. Nat. Reverendo Clin. oncol. 14, 749–762 (2017).

Artículo Google Académico

Ahlering, TE, Skarecky, D. y Borin, J. Impacto de la cauterización frente a la conservación sin cauterización de los haces neurovasculares en el retorno temprano de la potencia. J. Endourol. 20, 586–589 (2006).

Artículo Google Académico

Inouye, DA et al. Evaluación de la eficacia de los gestos de disección en cirugía robótica. J. Robótica. Cirugía https://doi.org/10.1007/s11701-022-01458-x (2022).

Vanstrum, EB et al. Desarrollo y validación de una herramienta de puntuación objetiva para evaluar la disección quirúrgica: evaluación de disección para técnica robótica (DART). Urol. Practica 8, 596–604 (2021).

Artículo Google Académico

Aghazadeh, MA et al. Validación externa de Global Evaluative Assessment of Robotic Skills (GEARS). Cirugía Endosc. 29, 3261–3266 (2015).

Artículo Google Académico

Goh, AC, Goldfarb, DW, Sander, JC, Miles, BJ & Dunkin, BJ Evaluación evaluativa global de habilidades robóticas: validación de una herramienta de evaluación clínica para medir habilidades quirúrgicas robóticas. J. Urol. 187, 247–252 (2012).

Artículo Google Académico

Ma, R., Reddy, S., Vanstrum, EB & Hung, AJ Innovaciones en la formación quirúrgica urológica. actual Urol. Rep. 22, 26 (2021).

Artículo Google Académico

Hung, AJ et al. Desarrollo y validación de métricas de rendimiento objetivas para la prostatectomía radical asistida por robot: un estudio piloto. J. Urol. 199, 296–304 (2018).

Artículo Google Académico

Hung, AJ, Chen, J. & Gill, IS Métricas de rendimiento automatizadas y algoritmos de aprendizaje automático para medir el rendimiento del cirujano y anticipar los resultados clínicos en cirugía robótica. Cirugía JAMA. 153, 770–771 (2018).

Artículo Google Académico

Hung, AJ et al. Utilizando aprendizaje automático y métricas de rendimiento automatizadas para evaluar el rendimiento de la prostatectomía radical asistida por robot y predecir los resultados. J. Endourol. 32, 438–444 (2018).

Artículo Google Académico

Ma, R. et al. La retroalimentación personalizada basada en métricas de rendimiento clínicamente relevantes acelera la adquisición de habilidades de sutura robótica: un ensayo controlado aleatorio piloto no ciego. J. Urol. 208, 414–424 (2022).

Hung, AJ et al. Expertos frente a superexpertos: diferencias en las métricas de rendimiento automatizadas y los resultados clínicos de la prostatectomía radical asistida por robot. Internacional BJU 123, 861–868 (2019).

Artículo Google Académico

Bhat KRS et al. Un nomograma pre y posoperatorio predictivo para la recuperación de la potencia posoperatoria después de una prostatectomía radical asistida por robot. J. Urol. 206, 942–951 (2021).

Mulhall, JP et al. Desarrollo de nomogramas para predecir la recuperación de la función eréctil después de una prostatectomía radical. J. Sexo. Medicina. 16, 1796–1802 (2019).

Artículo Google Académico

Kiyasseh, D. et al. Cuantificación de cirugías robóticas con aprendizaje profundo basado en visión. Preimpresión en https://arxiv.org/abs/2205.03028 (2022).

Nguyen, LN et al. Los riesgos y beneficios de la preservación del haz neurovascular cavernoso durante la prostatectomía radical: una revisión sistemática y un metanálisis. J. Urol. 198, 760–769 (2017).

Artículo Google Académico

Abboudi, H. et al. Curvas de aprendizaje para procedimientos urológicos: una revisión sistemática. Internacional BJU 114, 617–629 (2014).

Artículo Google Académico

Cappelleri, JC & Rosen, RC El Inventario de Salud Sexual para Hombres (SHIM): una revisión de 5 años de investigación y experiencia clínica. En t. J. Impot Res. 17, 307–319 (2005).

Artículo CAS Google Académico

Mayhew, D., Mendonca, V. & Murthy, BVS Una revisión del estado físico de ASA: perspectivas históricas y desarrollos modernos. Anestesia 74, 373–379 (2019).

Artículo CAS Google Académico

Vaswani, A. et al. La atención es todo lo que necesitas. En Avances en Sistemas de Procesamiento de Información Neural vol. 30 (Curran Associates, Inc., 2017).

Gorishniy, Y., Rubachev, I., Khrulkov, V. & Babenko, A. Revisión de modelos de aprendizaje profundo para datos tabulares. https://arxiv.org/abs/2106.11959 (2021).

Descargar referencias

Este estudio fue apoyado en parte por el Instituto Nacional del Cáncer bajo el Premio No. R01CA273031.

Centro de Educación y Simulación Robótica, Catherine & Joseph Aresty Department of Urology, USC Institute of Urology, University of Southern California, Los Ángeles, CA, EE. UU.

Runzhuo Ma, Timothy N. Chu, Elyssa Y. Wong, Ryan S. Lee, Ivan Rodriguez, Aditya Desai, Maxwell X. Otiato, Sidney I. Roberts, Jessica H. Nguyen, Jasper Laca y Andrew J. Hung

Departamento de Urología, Weill Cornell Medicine, Nueva York, NY, EE. UU.

Ashwin Ramaswamy, Gina DeMeo y Jim C. Hu

Departamento de Ciencias de la Computación, Escuela de Ingeniería Viterbi, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

Jiashu Xu, Loc Trinh y Yan Liu

Departamento de Computación y Ciencias Matemáticas, Instituto de Tecnología de California, Pasadena, CA, EE. UU.

Dani Kiyasseh y Animashree Anandkumar

Departamento de Urología y Oncología Urológica, St. Antonius-Hospital, Gronau, Alemania

Katarina Urbanova y Christian Wagner

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

AJH concibe el estudio. AJH y JCH obtuvieron el financiamiento. AJH, RM, JL, JHN y CW diseñaron y supervisaron la administración e implementación del estudio. RM, TNC, IR, GD, AD, MXO, KU, SIR y CW recopilaron los datos y anotaron los videos quirúrgicos. RM, JX, LT y DK realizaron el análisis y la visualización de datos. AA y YL proporcionaron orientación y supervisión para el análisis de datos. RM, AR y RSL escribieron el borrador del manuscrito.

Correspondencia a Andrew J. Hung.

CW no declara intereses no financieros en competencia, pero informa divulgaciones financieras con Intuitive Surgical, Inc. AA no declara intereses no financieros en competencia, pero es un empleado pagado de Nvidia. JCH no declara intereses no financieros en competencia, pero sí los siguientes intereses financieros en competencia: apoyo salarial del Fondo Frederick J. y Theresa Dow Wallace de Nueva York y del Premio Desafío de la Fundación contra el Cáncer de Próstata. También apoyo salarial de NIH R01 CA241758 y R01 CA259173, PCORI CER-2019C1-15682 y CER-2019C2-17372. AJH no declara intereses no financieros en competencia, pero informa divulgaciones financieras con Intuitive Surgical, Inc. Los autores restantes no declaran intereses en competencia.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Ma, R., Ramaswamy, A., Xu, J. et al. Gestos quirúrgicos como método para cuantificar el rendimiento quirúrgico y predecir los resultados del paciente. npj Dígito. Medicina. 5, 187 (2022). https://doi.org/10.1038/s41746-022-00738-y

Descargar cita

Recibido: 30 Agosto 2022

Aceptado: 29 de noviembre de 2022

Publicado: 22 diciembre 2022

DOI: https://doi.org/10.1038/s41746-022-00738-y

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

npj Medicina digital (2023)

Informes actuales de Urología (2023)