Tecnologia
ByteDance presenta Astra: un marco revolucionario de modelo dual para robots autónomos
Los robots están saliendo de los laboratorios y entrando en hogares, hospitales y almacenes, pero la navegación en espacios interiores concurridos, repetitivos y cambiantes aún les presenta dificultades. Astra de ByteDance propone un marco de doble modelo que divide el “pensar” y el “reaccionar” en dos cerebros coordinados. El resultado es un sistema que lee imágenes y lenguaje, construye un mapa global semánticamente rico y planifica trayectorias seguras en tiempo real.
Aquí hay una clara visión general de lo que cambia para los equipos que despliegan robots móviles hoy.
¿Apurado? Esto es lo que importa:
| Puntos clave ⚡ |
|---|
| 🧭 División de doble modelo: Astra-Global maneja la localización propia/objetivo; Astra-Local planifica el movimiento seguro en tiempo real. |
| 🗺️ Mapa híbrido: un grafo topológico-semántico conecta lugares y puntos de referencia, permitiendo consultas robustas visual-lingüísticas. |
| 🚧 Planificación más segura: una pérdida ESDF enmascarada reduce colisiones frente a las líneas base de difusión e imitación. |
| 🔌 Ajuste al ecosistema: diseñado para funcionar con pilas de borde de NVIDIA, ROS2 y robots de líderes como Boston Dynamics y Fetch Robotics. |
Cómo la Arquitectura de Doble Modelo de Astra responde a “¿Dónde estoy? ¿A dónde voy? ¿Cómo llego?”
Las flotas modernas en instalaciones como “MetroCart Logistics” enfrentan tres preguntas recurrentes: localización propia, localización del objetivo y movimiento local. Las tuberías tradicionales encadenan pequeños módulos o reglas, que luchan en pasillos similares o cuando las instrucciones llegan como lenguaje natural. Astra de ByteDance replantea la pila como dos modelos cooperativos: Astra-Global (razonamiento de baja frecuencia y alto nivel) y Astra-Local (control de alta frecuencia y campo cercano).
Esta separación sigue un patrón Sistema 1/Sistema 2. El modelo global absorbe imágenes y lenguaje para posicionar el robot en un mapa e interpretar objetivos como “entregar a la estación de enfermería cerca de Radiología.” El modelo local luego planifica y vuelve a planificar trayectorias a ritmo de control, fusionando sensores para evitar carritos, personas o barreras temporales. Juntos, recortan la cola larga de comportamientos frágiles que aquejan a sistemas convencionales en oficinas, centros comerciales y hogares.
De módulos frágiles a dos cerebros coordinados
En lugar de ajustar media docena de pequeños modelos, Astra comprime capacidades en dos redes robustas. El componente global reduce la ambigüedad anclando objetivos a puntos de referencia semánticos, mientras que el componente local mantiene el movimiento seguro y suave incluso cuando el mapa está parcialmente equivocado. Cuando un pasillo está bloqueado, Astra-Local se adapta; cuando un destino solo se describe en texto, Astra-Global traduce palabras a coordenadas de mapa.
- 🧩 Claridad modular: el razonamiento global se mantiene estable; el control local se mantiene ágil.
- 🗣️ Anclaje del lenguaje: la asignación de tareas en lenguaje natural funciona sin puntos de referencia manuales.
- 🛡️ Reducción del riesgo: menos choques de reglas y menor sobreajuste a edificios únicos.
- ⚙️ Mantenibilidad: las actualizaciones llegan a dos modelos en lugar de muchos scripts frágiles.
Qué cambia en las operaciones diarias
En un hospital, una enfermera puede decir “recoge suministros de la sala de almacenamiento junto a UCI-3”, y el modelo global vincula esa frase a un nodo semántico mapeado. En un almacén, Astra-Local maneja esquivas improvisadas alrededor de palets mientras permanece en una ruta minimizada para colisiones. Sobre una flota, esto reduce las intervenciones humanas y ayuda a los planificadores a pronosticar la producción con mayor precisión.
| Tarea 🔍 | Manejada por 🧠 | Frecuencia ⏱️ | Ejemplo 🧪 | Resultado ✅ |
|---|---|---|---|---|
| Localización propia | Astra-Global | Baja | Identificar pasillo actual usando cuadros de cámara | Posición estable en diseños repetitivos 🧭 |
| Localización del objetivo | Astra-Global | Baja | “Ir al área de descanso” como texto | Objetivo fijado a nodo semántico 🎯 |
| Planificación local | Astra-Local | Alta | Generar trayectoria alrededor de un carrito | Tasa de colisión menor 🚧 |
| Estimación de odometría | Astra-Local | Alta | Fusionar IMU + ruedas + visión | Error de trayectoria ~2% 📉 |
Perspectiva: separar el razonamiento global de los reflejos locales elimina la tensión principal que hace que las tuberías heredadas sean frágiles ante cambios.
Dentro de Astra-Global: Localización multimodal con un mapa híbrido topológico-semántico
Astra-Global es un modelo multimodal que ingiere imágenes y lenguaje para determinar tanto la pose actual del robot como el destino. Su contexto es un grafo híbrido construido fuera de línea: nodos como cuadros clave (con poses 6-DoF), aristas que codifican conectividad y puntos de referencia que llevan atributos semánticos como “escritorio de recepción” o “banco de ascensores.” Este mapa le otorga al modelo tanto un esqueleto de dónde se puede mover como el significado de los lugares.
Cómo se construye y usa el grafo
La tubería de mapeo reduce la velocidad del video a cuadros clave, estima poses de cámara con SfM y construye un grafo G=(V,E,L). Los puntos de referencia se extraen por nodo mediante el modelo y se vinculan mediante covisibilidad, creando redundancia que ayuda en pasillos parecidos. En operación, el modelo ejecuta un procedimiento de grueso a fino: primero, se emparejan puntos de referencia candidatos y regiones; luego, una estimación fina elige un nodo preciso y provee pose.
- 🧱 Nodos (V): cuadros clave muestreados en el tiempo que almacenan poses 6-DoF.
- 🔗 Aristas (E): enlaces no dirigidos que soportan opciones de rutas globales.
- 🏷️ Puntos de referencia (L): anclas semánticas como “letrero UCI-3” o “puerta de muelle de carga.”
Para objetivos basados en lenguaje, Astra-Global analiza texto como “la bahía de carga más cercana por la salida oeste,” identifica puntos de referencia relevantes por función (bahía de carga, señal de salida) y luego resuelve el mejor par nodo-imagen con una pose.
Receta de entrenamiento: SFT + GRPO para fuerza de cero disparos
Construido sobre un backbone Qwen2.5-VL, Astra-Global se entrena primero con afinación supervisada (localización gruesa/fina, covisibilidad, tendencia de movimiento) y luego con Optimización de Política Relativa de Grupo usando recompensas basadas en reglas. Esa segunda etapa impone formato de respuesta, recuperación correcta de puntos de referencia y correspondencias nodo-mapa acertadas. El resultado es una fuerte generalización zero-shot, alcanzando ~99.9% de precisión en localización en hogares no vistos, según evaluaciones internas.
- 🎓 SFT: tareas diversas estabilizan salidas y enseñan formato.
- 🏆 GRPO: el modelado de recompensa asegura anclaje visual-lingüístico consistente.
- 🧭 Robustez: mantiene precisión bajo cambios de punto de vista y escenas casi duplicadas.
| Componente 🧩 | Rol 🧭 | Fuente de datos 📷 | Por qué importa ⭐ |
|---|---|---|---|
| Grafo híbrido (V,E,L) | Contexto para razonamiento | Videos clave + SfM + puntos de referencia | Combina “dónde” y “qué” 🗺️ |
| Emparejamiento grueso a fino | Descarte rápido de candidatos | Imagen de consulta + prompt | Eficiente y preciso 🎯 |
| Anclaje de lenguaje | Mapa de texto a nodos | Instrucciones naturales | Tareas amigables para humanos 🗣️ |
| SFT + GRPO | Refinamiento de política | Conjuntos de datos mixtos | Mejor zero-shot 📈 |
Para equipos que evalúan alternativas desde estilo OpenAI de seguimiento de instrucciones hasta VPR clásico, este grafo híbrido más ajuste de refuerzo es el diferenciador clave en interiores ambiguos.
Perspectiva: los puntos de referencia semánticos convierten pasillos que se parecen entre sí en direcciones únicas que un modelo capaz de lenguaje puede referenciar confiablemente.
Dentro de Astra-Local: Percepción 4D espacio-temporal, planificación más segura y odometría precisa
Donde Astra-Global decide “dónde,” Astra-Local decide “cómo.” Reemplaza pilas de percepción multinivel con un codificador espaciotemporal 4D que transforma imágenes omnidireccionales en características de vóxeles conscientes del futuro. Encima, una cabeza de planificación genera trayectorias con emparejamiento de flujo basado en Transformer, y una cabeza de odometría fusiona imágenes, IMU y lecturas de ruedas para minimizar deriva.
Codificador 4D: viendo ahora y anticipando lo siguiente
Astra-Local comienza con un codificador 3D: Vision Transformers procesan múltiples vistas de cámara, y Lift-Splat-Shoot convierte características 2D en espacio de vóxeles. Un renderizador neural diferenciable supervisa la geometría. Luego, una pila temporal (ResNet + DiT) predice características de vóxeles futuras, brindando al planificador contexto sobre obstáculos en movimiento y probable espacio libre.
- 📦 Entrada omnidireccional: menos puntos ciegos para peligros a corta distancia.
- ⏩ Predicción futura de vóxeles: planificación anticipatoria en lugar de movimiento puramente reactivo.
- 🧰 Geometría auto supervisada: reduce la dependencia en etiquetas densas.
Planificación: emparejamiento de flujo con pérdidas conscientes de colisiones
El planificador usa las características 4D, la velocidad del robot y pistas de tareas para generar una trayectoria suave y factible. Una pérdida ESDF enmascarada penaliza la proximidad a obstáculos usando un mapa de ocupación 3D y una máscara de verdad en tierra 2D, combinación que demostró reducir tasas de colisión en comparación con ACT y líneas base de política de difusión en pruebas fuera de distribución.
- 🛡️ ESDF enmascarado: penalizaciones de distancia más inteligentes reducen rozaduras cercanas.
- 🧮 Emparejamiento de flujo Transformer: muestreo eficiente de trayectorias bajo incertidumbre.
- 🚀 Resiliencia OOD: mejor transferencia a nuevos edificios y diseños.
Odometría: fusión multisensor que mantiene escala y rotación
La estimación de pose usa tokenizadores para cada flujo de sensor, incrustaciones de modalidad y un codificador Transformer que termina con un token CLS para pose relativa. Fusionar datos IMU mejora drásticamente la precisión rotacional, mientras que los datos de ruedas estabilizan la escala, llevando el error de trayectoria cerca de ~2% en secuencias interiores mixtas.
| Módulo ⚙️ | Entradas 🎥 | Salidas 🧭 | Objetivo 🎯 | Beneficio ✅ |
|---|---|---|---|---|
| Codificador 4D | Imágenes multi-cam | Vóxeles actuales + futuros | Predicción temporal | Anticipa movimiento ⏳ |
| Cabeza de planificación | Características 4D + velocidad | Trayectoria | ESDF enmascarado + emparejamiento de flujo | Menos colisiones 🚧 |
| Cabeza de odometría | Imágenes + IMU + ruedas | Pose relativa | Fusión Transformer | Deriva ~2% 📉 |
- 🧪 Caso ejemplar: un robot de la cafetería “Leaf & Latte” se mueve entre sillas en hora pico sin comportamiento de chocar y retroceder.
- 🧭 En almacenes estrechos, la precisión rotacional previene la acumulación de deriva en giros cerrados.
- 🧰 Mantenible: un codificador reemplaza varios módulos de percepción.
Perspectiva: la combinación del codificador 4D y la pérdida ESDF impulsa la planificación hacia un régimen predictivo, reduciendo riesgos donde caminan y trabajan las personas.

Evidencia de almacenes, oficinas y hogares: métricas, casos de falla y soluciones
Las evaluaciones abarcan almacenes, oficinas y hogares, espacios con texturas repetidas, reacomodos de mobiliario y frecuentes oclusiones. En localización, Astra-Global supera el reconocimiento visual tradicional al aprovechar puntos de referencia semánticos y relaciones espaciales; en planificación, Astra-Local reduce colisiones y mejora puntajes generales frente a políticas ACT y de difusión en diseños fuera de distribución.
Qué significan los números en el terreno
En un pasillo de prueba de MetroCart Logistics, los números y señales son pequeñas pero claves decisivas. Donde el VPR con características globales falla en pasillos similares, Astra-Global detecta puntos de referencia finos y mantiene error de pose dentro de ~1 m y 5°. En una prueba en casa, los prompts textuales como “dónde está el área de descanso” se resuelven en las imágenes correctas y poses 6-DoF, apoyando tareas naturales basadas en voz.
- 🧩 Captura de detalles: características a nivel de punto de referencia reducen falsos emparejamientos en pasillos repetitivos.
- 🔄 Robustez de punto de vista: estable ante grandes cambios angulares que rompen el VPR.
- 🧭 Precisión de pose: mejor ajuste a geometría nodo-punto de referencia, mejorando selección de ruta.
Para planificación, un pasillo hospitalario en “St. Aurora” es un campo móvil de camas y carritos. La pérdida ESDF enmascarada de Astra-Local produce menos pasos cerca de paredes y velocidades más suaves, reduciendo quejas de enfermería y cuasi accidentes. En una demostración residencial, esquivando juguetes y sillas, el sistema muestra menos callejones sin salida y menos oscilación en umbrales de puertas.
| Escenario 🏢 | Métrica 📏 | Astra ⚡ | Línea base 🧪 | Delta 📈 |
|---|---|---|---|---|
| Pasillo de almacén | Error de pose | ≤1 m / 5° | Deriva mayor | Mejor localización 🧭 |
| Diseño OOD de oficina | Tasa de colisiones | Menor | ACT / difusión | Menos contactos 🚧 |
| Habitaciones en casa | Lenguaje a objetivo | Fiable | No fiable | Inicio de tarea más rápido 🗣️ |
| Pasillo hospitalario | Estabilidad de velocidad | Más suave | Inestable | Mayor confort 🧑⚕️ |
- 🛠️ Falla observada: pasillos con pocas características pueden confundir localización de un solo cuadro—el razonamiento temporal está en la hoja de ruta.
- 🧭 Falla observada: mapas comprimidos demasiado pueden perder semántica clave—se planean métodos alternativos de compresión.
- 🔁 Plan de robustez: integrar exploración activa y cambio de respaldo más inteligente cuando la confianza disminuye.
Perspectiva: los resultados fuertes provienen de combinar contexto global semántico con control local predictivo—no de inflar ningún módulo individual.
Manual de despliegue para 2025: hardware, integraciones, seguridad y ajuste a la industria
Implementar Astra significa emparejar los modelos con hardware y prácticas de seguridad ya familiares para los equipos de robótica. En cómputo, los módulos edge clase NVIDIA Jetson son un ajuste natural para tuberías multi-cámara, mientras que GPUs discretas en bases móviles manejan cargas pico en instalaciones mayores. La integración fluye a través de ROS2, con Astra-Global expuesto como servicio de localización/objetivos y Astra-Local como planificador y nodo de odometría.
Ecosistema y panorama de proveedores
Los proveedores de plataformas se acomodarán de forma diferente. Boston Dynamics podría aprovechar Astra-Global para un anclaje de objetivos de nivel superior en plataformas tipo Spot, mientras que las flotas de Fetch Robotics adoptan Astra-Local para mejorar la seguridad en pasillos alrededor de palets. ABB Robotics y Honda Robotics pueden alinear manipuladores móviles con objetivos semánticamente anclados. Para robots de consumo y servicio, iRobot y Samsung Robotics ganan un nombrado y enrutamiento de habitaciones más confiable en espacios saturados.
- 🤝 ROS2 primero: interfaces de tópico y servicio mantienen una integración predecible.
- 🧠 Seguimiento de instrucciones: combinar Astra-Global con pilas LLM de OpenAI para tareas más ricas, con Astra-Local ejecutando de forma segura.
- 🧩 Sensores: multi-cámara + IMU + codificadores de ruedas son la combinación ideal para la fusión de Astra-Local.
Seguridad, privacidad y mantenibilidad
La seguridad se basa en controles por capas: paradas de emergencia certificadas, límites de velocidad cerca de personas y transferencias conscientes de confianza hacia controladores de respaldo simples. La privacidad se aborda mediante el procesamiento en dispositivo y almacenamiento cifrado de mapas. La mantenibilidad mejora porque las actualizaciones afectan dos modelos núcleo en lugar de muchos módulos estrechos, y la telemetría de la flota se enfoca en puntajes de confianza y márgenes de colisión.
| Industria 🏭 | Tipo de robot 🤖 | Tareas 📦 | Pila de hardware 🧱 | Integración 🔌 | Impacto 💥 |
|---|---|---|---|---|---|
| Almacenes | AMRs (p. ej., Fetch Robotics) | Movimientos de palets; patrulla de pasillos | NVIDIA Jetson + multi-cam | ROS2 + Astra-Local | Menos colisiones 🚧 |
| Hospitales | Bases de servicio | Recorridos para suministros; entregas | GPU edge + cámaras de profundidad | Objetivos Astra-Global | Tareas en lenguaje natural 🗣️ |
| Retail | Carritos de inventario | Reposición; guía | IMU + ruedas + RGB | Fusión LLM + Astra | Trayectorias más suaves 🛒 |
| Hogares | Robots de servicio (iRobot, Samsung Robotics) | Tareas específicas por habitación | SoC compacto + cámaras | Mapas en dispositivo | Menos deriva 🧭 |
| Construcción | Robots con patas (Boston Dynamics) | Inspección; entrega | GPU discreta | Objetivos semánticos | Mejor estabilidad 🔩 |
- 🪜 Comenzar pequeño: pilotar un solo piso con mapeo Astra-Global y planificación Astra-Local.
- 🧪 Validar seguridad: probar márgenes ESDF enmascarados con obstáculos escalonados y maniquíes espectadores.
- 📈 Escalar: comenzar con turnos nocturnos primero, luego horas de tráfico mixto una vez que la confianza se mantenga.
Elementos en la hoja de ruta — robustez OOD, cambio de respaldo más estrecho y agregación temporal para localización — hacen de Astra un candidato no solo para edificios específicos sino para flotas multisede y a nivel ciudad.
Perspectiva: el despliegue tiene éxito cuando la semántica, planificación y confianza en la política fluyen a través de ROS2 como cualquier otro nodo bien comportado.
Por qué Astra importa más allá de una empresa: estándares, competencia y el camino hacia la movilidad de propósito general
El lanzamiento de ByteDance cae en un ecosistema que persigue robots móviles de propósito general. El patrón de doble modelo formaliza un límite que muchos equipos ya observan: cognición global versus reflejo local. También provee un vocabulario común para puntos de referencia y revisiones de seguridad—puntos de referencia, asociaciones de nodos, márgenes ESDF—que los integradores pueden auditar. Esa claridad importa a medida que las regulaciones se endurecen en torno a la interacción humano-robot en espacios públicos.
Posicionamiento entre jugadores líderes
Empresas como Boston Dynamics han dominado la fiabilidad física; Astra provee anclaje semántico y objetivos nativos en lenguaje para complementar ese hardware. ABB Robotics y Honda Robotics pueden conectar manipuladores móviles a estaciones de trabajo nombradas sin códigos QR. Los jugadores de consumo como iRobot y Samsung Robotics pueden ganar un “nombrado de habitaciones” robusto sin balizas elaboradas. Con aceleración edge de NVIDIA y pilas opcionales de instrucciones estilo OpenAI, el pegamento está justo donde muchos equipos ya construyen.
- 🧠 Semántica global: elimina la necesidad de puntos de referencia artificiales densos.
- 🦾 Sinergia hardware: complementa bases con patas, ruedas e híbridas.
- 🧪 Pruebas reproducibles: márgenes ESDF y errores de pose se traducen entre sitios.
Qué definirá a los ganadores en 2025
Los ganadores enviarán flotas que puedan desplegarse en nuevos edificios con remapeo mínimo y sin reglas frágiles. Eso significa invertir en compresión de mapas que mantengan la semántica adecuada, en razonamiento temporal para sobrevivir en zonas con pocas características y en políticas que expongan confianza para que los humanos supervisen sin micromanagement. La búsqueda global gruesa a fina de Astra y la planificación local predictiva son pasos prácticos hacia esa meta.
| Capacidad 🧩 | Enfoque de Astra 🧠 | Por qué escala 📈 | Efecto operacional 🧰 |
|---|---|---|---|
| Localización propia/objetivo | Multimodal + grafo semántico | Maneja ambigüedad | Menos llamadas al operador 📞 |
| Planificación local | Emparejamiento de flujo + ESDF enmascarado | Resiliencia OOD | Menor riesgo de colisión 🚧 |
| Odometría | Fusión Transformer | Agnóstico al sensor | Menor deriva 🧭 |
| Tareas de lenguaje | Anclaje visual-lenguaje | Amigable al humano | Inicio de tarea más rápido ⏱️ |
- 🛰️ Corto plazo: enviar pilotos que midan error de pose, márgenes ESDF y transferencias humanas.
- 🏗️ Mediano plazo: añadir localización temporal y exploración activa para zonas con pocas características.
- 🌍 Largo plazo: estandarizar etiquetas semánticas entre sitios para compartir mapas y políticas.
Perspectiva: un estándar de doble modelo da a los integradores un contrato estable: semántica global adentro, movimiento local seguro afuera.
{“@context”:”https://schema.org”,”@type”:”FAQPage”,”mainEntity”:[{“@type”:”Question”,”name”:”¿Qué hace a Astra diferente de las pilas de navegación tradicionales?”,”acceptedAnswer”:{“@type”:”Answer”,”text”:”Consolida muchos módulos frágiles en dos modelos: Astra-Global para localización multimodal propia/objetivo usando un mapa semántico-topológico, y Astra-Local para planificación predictiva y odometría precisa. La división preserva el razonamiento de alto nivel mientras mantiene el control de bajo nivel rápido y seguro.”}},{“@type”:”Question”,”name”:”¿Puede Astra funcionar en hardware común de edge?”,”acceptedAnswer”:{“@type”:”Answer”,”text”:”Sí. Los equipos típicamente apuntan a módulos clase NVIDIA Jetson para tuberías multi-cámara y pueden escalar a GPUs discretas para instalaciones más grandes. La integración con ROS2 mantiene el despliegue sencillo.”}},{“@type”:”Question”,”name”:”¿Cómo maneja Astra las instrucciones en lenguaje natural?”,”acceptedAnswer”:{“@type”:”Answer”,”text”:”Astra-Global ancla el texto a puntos de referencia semánticos y nodos del mapa mediante un proceso visual-lingüístico de grueso a fino, devolviendo imágenes objetivo y poses 6-DoF que Astra-Local puede navegar hacia ellas.”}},{“@type”:”Question”,”name”:”¿Es Astra compatible con robots existentes?”,”acceptedAnswer”:{“@type”:”Answer”,”text”:”La arquitectura es agnóstica al robot. Plataformas de Boston Dynamics, Fetch Robotics, ABB Robotics, Honda Robotics, iRobot y Samsung Robotics pueden integrarse vía ROS2, siempre que haya sensores adecuados (multi-cam, IMU, ruedas).”}},{“@type”:”Question”,”name”:”¿Cuáles son las principales limitaciones a vigilar?”,”acceptedAnswer”:{“@type”:”Answer”,”text”:”La localización de un solo cuadro puede tener dificultades en áreas con pocas características o altamente repetitivas, y la compresión de mapas estrecha puede perder semántica. La hoja de ruta incluye razonamiento temporal, exploración activa y mejor cambio de respaldo.”}}]}¿Qué hace a Astra diferente de las pilas de navegación tradicionales?
Consolida muchos módulos frágiles en dos modelos: Astra-Global para localización multimodal propia/objetivo usando un mapa semántico-topológico, y Astra-Local para planificación predictiva y odometría precisa. La división preserva el razonamiento de alto nivel mientras mantiene el control de bajo nivel rápido y seguro.
¿Puede Astra funcionar en hardware común de edge?
Sí. Los equipos típicamente apuntan a módulos clase NVIDIA Jetson para tuberías multi-cámara y pueden escalar a GPUs discretas para instalaciones más grandes. La integración con ROS2 mantiene el despliegue sencillo.
¿Cómo maneja Astra las instrucciones en lenguaje natural?
Astra-Global ancla el texto a puntos de referencia semánticos y nodos del mapa mediante un proceso visual-lingüístico de grueso a fino, devolviendo imágenes objetivo y poses 6-DoF que Astra-Local puede navegar hacia ellas.
¿Es Astra compatible con robots existentes?
La arquitectura es agnóstica al robot. Plataformas de Boston Dynamics, Fetch Robotics, ABB Robotics, Honda Robotics, iRobot y Samsung Robotics pueden integrarse vía ROS2, siempre que haya sensores adecuados (multi-cam, IMU, ruedas).
¿Cuáles son las principales limitaciones a vigilar?
La localización de un solo cuadro puede tener dificultades en áreas con pocas características o altamente repetitivas, y la compresión de mapas estrecha puede perder semántica. La hoja de ruta incluye razonamiento temporal, exploración activa y mejor cambio de respaldo.
-
Open Ai7 days agoDesbloqueando el Poder de los Plugins de ChatGPT: Mejora Tu Experiencia en 2025
-
Open Ai6 days agoDominando la Fine-Tuning de GPT: Una guía para personalizar eficazmente tus modelos en 2025
-
Open Ai6 days agoComparando ChatGPT de OpenAI, Claude de Anthropic y Bard de Google: ¿Qué herramienta de IA generativa reinará suprema en 2025?
-
Open Ai6 days agoPrecios de ChatGPT en 2025: Todo lo que necesitas saber sobre tarifas y suscripciones
-
Open Ai6 days agoLa eliminación progresiva de los modelos GPT: qué pueden esperar los usuarios en 2025
-
Modelos de IA6 days agoModelos GPT-4: Cómo la inteligencia artificial está transformando 2025