24 junio 2026

6 Min. de lectura

Midjourney presenta un escáner de cuerpo completo que funciona sin radiación ni campo magnético. La foto de la bañera de agua recorre todas las redes. La máquina real está en otro lugar: en un clúster de computación que calcula una imagen tridimensional a partir de ondas sonoras. La pregunta clave para los responsables de la nube no es cómo se siente el escaneo, sino dónde recae la carga computacional y a quién pertenecen los datos.

Lo más importante en resumen

  • El escáner es la carcasa, la reconstrucción es el sistema: Midjourney denomina al procedimiento Ultrasonic CT. Un clúster de computación transforma los datos brutos de ultrasonido en imágenes de corte transversal. Aquí radica la cuestión de la infraestructura, no en el hardware que se coloca en el cuerpo.
  • Las grandes cifras son el objetivo, no la realidad actual: Según Midjourney, un escaneo debería durar menos de 60 segundos. El prototipo, según los primeros informes, tarda unos 20 minutos, funciona con 40 chips de ultrasonido y aún no incluye una red neuronal en el procesamiento de imágenes.
  • Mil millones de escaneos al mes plantean un desafío de datos: Este objetivo declarado convierte la imagen médica en un problema de canalización, almacenamiento y cumplimiento normativo. Los datos sanitarios en estas cantidades obligan a cualquier plataforma a tomar decisiones sobre ubicación y soberanía.

Relacionado:Apple divide la inferencia de IA: dispositivo frente a nube  /  CADA: cuándo la soberanía en la nube se convierte en obligación de contratación

¿Qué es el Ultrasonic CT? El Ultrasonic CT, como lo denomina Midjourney, es un procedimiento de imagen en el que un anillo de emisores de ultrasonido rodea el cuerpo y registra las ondas sonoras reflejadas. Un clúster de computación ensambla estas señales brutas en imágenes de corte tridimensionales. A diferencia del CT clásico, la imagen se genera mediante software en lugar de radiación.

David Holz, fundador de Midjourney, presentó la nueva división a mediados de junio y la describió como el primer sistema de imagen corporal completa en 50 años. Para una empresa que hasta ahora generaba imágenes, el paso hacia el hardware físico supone un cambio radical. Sin embargo, para este público, el interés radica en otro aspecto: la imagen no proviene del transductor, sino que se calcula. Y ese cálculo es la verdadera apuesta.

1. La imagen se genera en el clúster de computación, no en el cuerpo

Una señal de ultrasonido por sí sola no produce una imagen de corte. Genera una enorme cantidad de datos de reflexión que deben procesarse conjuntamente. En el escáner de Midjourney, un clúster de computación dedicado reconstruye a partir de las ondas un modelo volumétrico de músculos, grasa, huesos y órganos. El hardware en el cuerpo recopila los datos. El verdadero trabajo se realiza en la capa de computación que hay detrás.

Resulta notable lo que aún no ocurre allí. Según los informes disponibles, el prototipo no incluye una red neuronal en la reconstrucción. La imagen se genera mediante métodos clásicos basados en física, no a través del modelo de IA por el que Midjourney es conocido. El nombre evoca expectativas de magia generativa, pero detrás hay procesamiento de señales con gran demanda computacional: física clásica a gran escala.

Esto desplaza inmediatamente la cuestión del cuello de botella. No son los sensores los que determinan el ritmo y los costes, sino la capacidad de computación por escaneo y la eficiencia con la que pueda escalarse esta canalización en el futuro.

2. Edge o cloud: ¿dónde debe realizarse la reconstrucción?

Aquí es donde la cuestión se vuelve interesante para cualquiera que planifique infraestructura. Un clúster de computación por ubicación es la opción más evidente. Los datos brutos permanecen locales, la imagen está disponible al instante y la latencia es baja. El precio a pagar es hardware en cada sucursal, mantenimiento in situ y capacidad sin utilizar durante los descansos.

La alternativa opuesta centraliza. Los datos brutos se envían a una canalización en la nube, donde la capacidad compartida realiza los cálculos, y el resultado regresa. Esto escala de manera más limpia y aprovecha mejor la costosa potencia de cálculo. Sin embargo, traslada el conjunto de datos más sensible que posee una persona a través de la red hasta un centro de datos.

Este es exactamente el conflicto de objetivos que el sector ya conoce de la inferencia de IA: dispositivo o nube, soberanía o escalabilidad. Midjourney debe tomar esta decisión para un procedimiento que, en cada ejecución, genera cantidades considerables de datos brutos. Con doce personas de prueba escaneadas, es una nota al pie. Con el objetivo declarado, se convierte en la cuestión arquitectónica central.

1 Mrd.
Midjourney menciona mil millones de escaneos al mes como objetivo para su plena capacidad. Cada escaneo es un conjunto de datos de salud tridimensional que debe almacenarse y protegerse de forma permanente.
Fuente: Midjourney (objetivo declarado, no valor alcanzado)

3. Mil millones de escaneos al mes son una apuesta de cumplimiento normativo

Analicémoslo con frialdad. Un modelo volumétrico de cuerpo completo es un conjunto de datos denso, no una instantánea. Multiplicado por la cantidad objetivo, genera un volumen de almacenamiento y transmisión que exige una arquitectura bien pensada. Esto es, en primer lugar, un problema de capacidad y, de inmediato, un problema legal.

Los datos de salud figuran entre las categorías más estrictamente reguladas. En el RGPD, se incluyen en las categorías especiales de datos personales. Donde se calcula y almacena, se afecta la soberanía de los datos, y no solo el rendimiento. Para el mercado alemán, esto se agrava con el debate en curso sobre soberanía digital y los requisitos de ubicación de datos sensibles.

Un proveedor estadounidense que aspire a mil millones de escaneos corporales al mes se enfrentará inevitablemente a la realidad europea. La arquitectura de la canalización determinará aquí si una oferta de este tipo puede ser viable en la región DACH.

4. Demostración frente a prototipo: qué es fiable y qué no

Ahora, las cifras que aparecen en los titulares. Según Midjourney, el escáner debería ser unas diez veces más económico y considerablemente más rápido que una resonancia magnética (RM). Se trata de afirmaciones de marketing sobre un prototipo, no de valores de producto medidos. La siguiente comparación separa el estándar establecido de la pretensión actual.

Criterio RM (establecido) Escáner Midjourney (pretensión / prototipo)
Duración del escaneo 30 a 90 minutos Objetivo menos de 60 seg., real aún unos 20 min.
Física Campo magnético fuerte Ultrasonidos, sin radiación, sin campo magnético
Cálculo de imagen Reconstrucción establecida Clúster de computación, aún sin red neuronal
Grado de madurez Estándar clínico ~12 personas escaneadas, equipo pequeño

Fuente: Datos de Midjourney y primeros informes, estado junio 2026. Valores de prototipo, no datos de producto certificados.

La brecha entre la demostración y el dispositivo no es un detalle, es la historia. Un tiempo de segundos en el escenario y una ejecución de 20 minutos en el laboratorio describen dos máquinas distintas. Ambas pueden ser ciertas. Solo la segunda es real hoy.

5. Financiación bootstrapped: apuesta arriesgada, pero no demostrada

Un aspecto merece contexto, sin exagerarlo. Midjourney se describe como autofinanciada y rentable, y con ello justifica permitirse un *moonshot* que un laboratorio financiado exclusivamente con capital externo difícilmente podría justificar. La tecnología central está licenciada por Midjourney a partir del especialista en ultrasonidos cotizado Butterfly Network, por lo que no proviene de su propia casa. Su comunicación obligatoria cuantifica los pagos esperados en hasta unos 68 millones de euros en cinco años.

La independencia permite apuestas a largo plazo. Pero no sustituye la validación. Para los responsables de cloud y plataformas, al final no cuenta la estructura de financiación. Lo decisivo es si la reconstrucción aguanta bajo carga real, dónde se ejecuta y cómo se protegen los datos. Estas tres preguntas siguen abiertas.

Quien siga el tema debería tomar con calma las imágenes del hardware. La sustancia está en la capa de computación.

Preguntas frecuentes

¿Qué significa técnicamente Ultrasonic CT en Midjourney?

Un anillo de emisores de ultrasonidos captura datos de reflexión del cuerpo, un clúster de computación calcula a partir de ellos imágenes de cortes tridimensionales. La imagen se genera mediante procesamiento de señales, no mediante radiación de rayos X o un campo magnético.

¿Es correcta la indicación de 60 segundos por escaneo?

Se trata de un objetivo declarado, no de un valor medido. Según los primeros informes, un escaneo en el prototipo actual dura más bien unos 20 minutos. La indicación en segundos proviene de la demostración en el escenario.

¿Por qué es un tema de cloud y no puramente médico?

La calidad de la imagen depende de la reconstrucción en un clúster de computación. Que esta se ejecute en el lugar o de forma centralizada en la nube decide sobre la velocidad, los costes y la soberanía de los datos. Se trata de una decisión clásica de infraestructura.

¿Qué cuestiones de protección de datos plantea mil millones de escaneos al mes?

Los escaneos de cuerpo completo son datos de salud y entran en las categorías especiales del RGPD. La ubicación del almacenamiento, las vías de transmisión y el acceso deben cumplir con los requisitos europeos, de lo contrario, una oferta en la región DACH difícilmente será viable.

¿Qué es sólido hoy en día de la tecnología?

Son sólidos el procedimiento mediante ultrasonidos, la licencia de Butterfly Network y el prototipo con alrededor de una docena de personas escaneadas. Las comparaciones de rendimiento y costes con la resonancia magnética son una aspiración, no datos de producto certificados.

Más del MBF Media Network

Fuente de la imagen de portada: Unsplash / Growtika

También disponible en

Una revista de Evernine Media GmbH