Thinking Machines Redefine la Interacción Humano-IA con Comunicación Full-Duplex
En un avance que podría redefinir fundamentalmente cómo interactuamos con la inteligencia artificial, Thinking Machines, una startup de IA cofundada por la ex-CTO de OpenAI, Mira Murati, ha presentado sus innovadores "interaction models" (modelos de interacción). El objetivo central es trascender el paradigma actual de interacción por turnos, donde el usuario habla y la IA escucha, para luego invertir los roles, y evolucionar hacia una comunicación "full-duplex" o simultánea, evocando la fluidez de una conversación telefónica natural. Este enfoque, descrito por Thinking Machines, busca que la IA pueda escuchar, ver y hablar en tiempo real, eliminando las pausas inherentes a los sistemas conversacionales predominantes.
Este desarrollo representa un salto significativo en la búsqueda de interacciones más intuitivas con la IA. Los modelos actuales exigen que los usuarios se "contorsionen" a la interfaz, esperando la finalización de una respuesta antes de formular la siguiente pregunta o añadir un comentario. La propuesta de Thinking Machines, según lo reportado por medios como TechCrunch y SiliconANGLE, rompe con esta limitación al procesar las entradas del usuario y generar respuestas de manera concurrente en "micro-turnos" de aproximadamente 200 milisegundos. Esta arquitectura permite que la IA reaccione a señales visuales o auditivas en tiempo real, incluso mientras está en medio de una alocución.
La efectividad de esta aproximación fue demostrada en la prueba FD-bench, diseñada específicamente para medir la calidad de la interacción simultánea. En esta comparativa, el modelo principal de Thinking Machines, TML-Interaction-Small, logró una impresionante latencia de menos de 0.4 segundos. Esta cifra supera significativamente a sus competidores en tiempo real, como Gemini-3.1-flash-live de Google (0.57 segundos) y GPT-realtime-2.0 (1.18 segundos), lo que subraya la eficiencia y velocidad de su nueva arquitectura. El interés en esta innovación se refleja también en el respaldo financiero, con Thinking Machines habiendo levantado una ronda semilla de 2 mil millones de dólares, valorando la compañía en aproximadamente 12 mil millones de dólares, un claro indicio de la confianza del mercado en su visión.
Contexto y Antecedentes de la IA Conversacional
Desde los primeros chatbots hasta los sofisticados modelos de lenguaje grande (LLMs) de hoy, la interacción entre humanos y sistemas de IA ha estado dominada por un modelo secuencial y por turnos. Esta limitación inherente se debe a cómo los modelos procesan la información: primero reciben la entrada completa del usuario, luego la procesan en su totalidad, y finalmente generan una respuesta completa. Este ciclo de "hablar-escuchar-procesar-responder" ha sido la norma, estableciendo una barrera artificial a la naturalidad de la comunicación.
La insatisfacción con esta interfaz es palpable. Como señala Thinking Machines, los usuarios a menudo se ven obligados a modificar su forma natural de conversar para adaptarse a las limitaciones de la IA, lo que puede resultar en interacciones robóticas o frustrantes. Este "cuello de botella en la banda ancha humano-IA" no solo ralentiza la comunicación, sino que también limita la profundidad y la espontaneidad de las interacciones. La visión de Mira Murati, fundadora de Thinking Machines y figura clave en el desarrollo de IA a nivel global, es clara: "la interactividad debería escalar junto con la inteligencia". Esta filosofía impulsa la búsqueda de sistemas que no solo sean más inteligentes en su razonamiento, sino también más fluidos y naturales en su comunicación.