Takeo Kanade (Hyōgo, Japón, 78 años) habla con fluidez de la visión artificial a la que se dedica desde hace más de 40 años. Esta disciplina científica permite ver un partido de fútbol desde el punto de vista de la pelota o un partido de tenis a través del ojo de halcón. Los algoritmos fundamentales que Kanade ha desarrollado con su colega Bruce Lucas, llamado método Lucas-Kanade, ayudan a las computadoras y los robots a comprender las imágenes en movimiento. Su trabajo también ha contribuido a mejorar la cirugía robótica, la conducción autónoma y el reconocimiento facial. “En el futuro, los robots serán mejores que los humanos, de una forma u otra”, admite. Gracias a sus desarrollos matemáticos, Kanade ha recibido el Premio Fronteras del Conocimiento de la Fundación BBVA, en la categoría de Tecnologías de la Información y las Comunicaciones.
El investigador se doctoró en Ingeniería Eléctrica en la Universidad de Kioto en 1974. Descubrió su pasión por la ingeniería cuando, a los 5 años, fue a pescar y fabricó su propio anzuelo. Es profesor de Informática y Robótica en la Universidad Carnegie Mellon de Pittsburgh (EE.UU.) y fundador del Centro Tecnológico para la Calidad de Vida, que dirigió entre 2006 y 2012.
Preguntar. ¿Crees que la visión robótica algún día igualará a la visión humana?
Respuesta. Sí, y en algún momento puede ser mejor que el de los humanos. De hecho, en algunos ámbitos ya son mejores, como en el caso del reconocimiento facial por ordenador. Durante mucho tiempo se pensó que era un área de gran ventaja, ya que somos buenos reconociendo a las personas que conocemos. Sin embargo, si conocemos a alguien nuevo en un entorno desconocido, a menudo lo perdemos de vista.
P. ¿Cuál de los dos tiene menos probabilidades de fracasar?
r. El ser humano. Los coches autónomos pueden ver hasta 200 metros en todas direcciones y reconocer con mucha precisión la ubicación de otros coches, peatones o bicicletas, pero lo entendemos mejor. Podemos tener algunas expectativas sobre lo que le está pasando al coche que tiene delante. También podrás reconocer si estás conduciendo cerca de un colegio y anticiparte a los niños que puedan cruzar la calle. Las computadoras están tratando de llegar a ese nivel de comprensión, pero por ahora no es tan bueno; y es fundamental para evitar accidentes.
P. ¿La conducción será 100% autónoma algún día?
r. Dentro de diez años o incluso menos. Sin embargo, hay que convencer a la gente. Es como el uso del coche, que si bien provoca accidentes y muertes, produce un beneficio tan grande que, como sociedad, lo aceptamos.
P. En el mundo de la visión artificial, ¿cuáles son los retos del futuro?
r. ¿Puedes estar en un mundo mapeado desde el mundo real? Ese es el siguiente nivel. Yo lo llamo realidad virtualizada. La realidad virtual ya no es virtual: es un mundo real que está virtualizado. También existe la posibilidad de interactuar con el entorno y con las personas en el mundo virtual. Que alguien pueda verse reflejado en un espejo dentro del mundo virtual. Otro desafío es la teletransportación, pero sin descomponer tu cuerpo y enviarlo a otro lugar, como en la película. Star Trek. Se hace con herramientas, como drones, que te dan una fuerza de reacción en tus piernas a través de tu cuerpo para que puedas teletransportarte, visual y acústicamente, y que puedas interactuar físicamente en tiempo real.
P. ¿Cómo se puede evitar el uso malintencionado de deepfakes (vídeos falsos)?
r. Me siento parcialmente responsable de ello. En 2010, hice un vídeo del presidente Obama hablando en japonés con imágenes generadas a partir de mi rostro. Pensé que era un vídeo de broma. No puedes luchar contra el deepfakeslo único que lo impide es nuestra integridad.
P. Pero si la tecnología puede volverse en nuestra contra…
r. Se utiliza con fines de engaño, pero la tecnología no puede saber cuál es su objetivo. Un tipo de tecnología puede crearse y utilizarse para fines distintos de aquellos para los que fue desarrollada. Tienes que ser más inteligente, más rápido que ella y estar informado. La marca de agua, por ejemplo, cuando la usas y se sabe, en ese mismo momento ya se ha creado una manera instantánea de borrarla.
P. ¿Cómo se puede utilizar la visión por computadora para mejorar la calidad de vida de las personas con discapacidad?
r. Se trata de desarrollar tecnología de calidad de vida, como hacemos en nuestro centro. Su esencia es incrementar la independencia de las personas con discapacidad o personas mayores. No se trata de que los robots lo hagan todo, sino todo lo contrario. Mi fórmula para el robot perfecto es igual a lo que quieres hacer menos lo que puedes hacer. Es decir, compensar la parte que el humano no puede hacer para que pueda hacerlo junto con el robot. Además, en casos de rehabilitación o educación, el robot perfecto debe hacer un poco menos para que la persona recupere motivación y capacidad.
P. ¿Cómo han contribuido sus trabajos a la precisión quirúrgica?
r. Los cirujanos robots pueden utilizar sensores más desarrollados que los cirujanos humanos. Los sensores humanos son muy limitados, no tenemos sensores acústicos ni sensores multimodales. Antes de una operación quirúrgica, los androides pueden, por ejemplo, detectar la ubicación de un tumor, su forma o tamaño, mediante rayos X o una resonancia magnética, y en el momento de la cirugía utilizan sensores de imagen.
P. ¿Qué ha aportado el origami a tu carrera?
r. La esencia de mi teoría, Una teoría del mundo del origami (Origami World Theory, en inglés) es que la percepción de la forma tridimensional de una imagen debe derivar de una explicación matemática y no del resultado del aprendizaje. Si, por ejemplo, dibujas un cuadro, hay cinco formas más posibles que se generan exactamente con la misma imagen, pero que son diferentes del cuadro. Cuando doy una charla, por ejemplo, bromeo con el público diciendo que la sala de conferencias y el edificio podrían tener formas diferentes y el público mira a su alrededor y se lo imagina.
puedes seguir EL PAÍS Tecnología en Facebook y X o regístrate aquí para recibir nuestra boletín semanal.
Suscríbete para seguir leyendo
Leer sin límites
_



