Imagen vía EFE
Este miércoles Google DeepMind ha presentado dos nuevos modelos de inteligencia artificial (IA) para revolucionar la robótica; Gemini Robotics y Gemini Robotics-ER. Ambos sistemas están basados en la IA Gemini 2.0 y permitirá a los robots ejecutar tareas complejas con mayor precisión y adaptabilidad.
Gemini Robotics es un modelo avanzado de visión-lenguaje-acción (VLA) que integra acciones físicas, permitiendo a los robots realizar tareas detalladas como doblar origami o manipular objetos pequeños con precisión. Este avance busca crear robots más versátiles, capaces de adaptarse a múltiples escenarios.
Por otro lado, Gemini Robotics-ER es un modelo de visión-lenguaje (VLM) con una comprensión espacial mejorada. Esto permite a los expertos en robótica programar acciones más precisas y mejorar la detección 3D, facilitando tareas como sujetar una taza por el asa o calcular una trayectoria segura para alcanzarla.
Ambos modelos están diseñados para funcionar con diversos tipos de robots y marcan un avance significativo en el desarrollo de robots de propósito general. DeepMind ya colabora con la empresa Apptronik en el desarrollo de una nueva generación de robots humanoides y trabaja con un grupo selecto de probadores para perfeccionar Gemini Robotics-ER.
Con este lanzamiento, Google DeepMind avanza en la creación de sistemas que combinan razonamiento multimodal (texto, imágenes, audio y video) con habilidades de manipulación en el mundo físico. Este es un paso clave hacia robots más inteligentes, interactivos y funcionales en la vida cotidiana.
EFE