Skip to main content
IA & Software

Robot Autónomo Full-Stack: Computer Vision, NLP y Mecatrónica

Maedcore diseña y construye un robot autónomo completo: computer vision de doble cámara, inferencia NLP a bordo, 15 servos de actuación, chasis impreso en 3D en 22 partes e impresión térmica. Caso de estudio de robótica extremo a extremo.

Eduardo Fuentevilla Blanco

Publicado por Eduardo Fuentevilla Blanco

Robotics Engineer at Maedcore · Robotics Engineer LinkedIn ↗

1 de febrero de 2024 7 min de lectura
Revisado por Maedcore Team
Robot Autónomo Full-Stack: Computer Vision, NLP y Mecatrónica
Robot Autónomo Full-Stack: Computer Vision, NLP y Mecatrónica

Robot Autónomo Full-Stack: Computer Vision, NLP y Mecatrónica

Resumen ejecutivo: Maedcore diseñó y construyó un robot móvil autónomo completo desde cero: un sistema de computer vision de doble cámara para detección y seguimiento de objetos, un motor de inferencia NLP a bordo que genera salida en lenguaje natural, un sistema de actuación de 15 servos para locomoción y expresión, un chasis impreso en 3D fabricado en 22 partes y una mini impresora térmica para entrega de salida física. El proyecto cubre el stack completo de robótica — diseño mecánico, cableado electrónico, integración de sistemas embebidos y desarrollo de código IA — en una única construcción de extremo a extremo. La aplicación de despliegue es la crítica de arte autónoma; el stack de ingeniería es aplicable a robots de inspección, plataformas de navegación autónoma y sistemas de colaboración humano-robot.


El Alcance de Ingeniería

Este proyecto requirió que Maedcore operara en cinco disciplinas de ingeniería simultáneas:

  1. Diseño mecánico — modelado CAD de un chasis cuadrúpedo optimizado para imprimibilidad 3D, empaquetamiento de componentes internos y acceso de mantenimiento.
  2. Fabricación 3D — trabajo de impresión de 22 partes, con piezas individuales que requieren hasta 36 horas de tiempo de impresión, seguido de post-procesado y ensamblaje.
  3. Integración electrónica — cableado completo de un sistema de actuación de 15 servos, cámaras duales, hardware de audio, impresora térmica, refrigeración y gestión de energía.
  4. Sistemas embebidos — configuración del SO en tiempo real, programación de tareas para control concurrente de computer vision y locomoción, gestión de latencia sensor-a-actuador.
  5. Desarrollo IA — modelo de computer vision para detección y targeting de objetos, pipeline NLP para generación de salida en lenguaje natural, integración de ambos en un único bucle operacional.

La restricción clave en las cinco disciplinas: cada componente debe caber dentro de un chasis sellado, sin cableado externo ni hardware expuesto.


Fase 1: Diseño Mecánico

Modelo 3D del chasis del robot autónomo con todos los componentes electrónicos posicionados para ajuste y acceso de mantenimiento

La fase de diseño mecánico estableció las restricciones para todo lo posterior:

Modelo CAD conceptual — geometría general, posiciones de las articulaciones y envolvente de movimiento. La configuración cuadrúpeda se eligió por la estabilidad en superficies irregulares y la gama de poses expresivas alcanzables mediante actuación coordinada de servos.

Disposición detallada de componentes — cada componente electrónico se modeló en el chasis en esta fase. Las decisiones tomadas aquí determinaron:

  • Rutas de flujo de aire interno para el ventilador de refrigeración.
  • Enrutamiento de cables desde los 15 servos hasta el controlador central.
  • Geometría de montaje de cámara para los ángulos de campo de visión requeridos.
  • Posicionamiento de la impresora térmica relativo a la ranura de salida en el cuerpo.

División de fabricación — el chasis se dividió en 22 partes imprimibles, cada una dimensionada para caber dentro del volumen de impresión minimizando el material de soporte.


Fase 2: Fabricación 3D y Ensamblaje

Las 22 partes del chasis se imprimieron secuencialmente, con las más grandes requiriendo hasta 36 horas por parte. Los parámetros de impresión se ajustaron por parte según los requisitos de carga estructural.

El ensamblaje procedió en tres sub-fases:

  1. Ensamblaje de la cabeza — integrando la cámara gran angular, la cámara de autoenfoque, el altavoz y el micrófono en la unidad de cabeza antes de cerrar la carcasa.
  2. Ensamblaje del cuerpo — enrutando todo el cableado del arnés de servos, la placa de gestión de energía y la impresora térmica en el chasis principal antes de cerrarlo.
  3. Ensamblaje de extremidades — fijando y calibrando los 15 servos para las patas, la cola y la cabeza, con verificación de posición final antes de la integración de software.

Fase 3: Electrónica y Cableado

La integración electrónica requirió coordinar 14 componentes de hardware distintos:

ComponenteFunción
Cámara gran angularDetección de escena — identifica objetos en el entorno
Cámara de autoenfoqueCaptura de objetivo — adquisición de imágenes de alta resolución
Unidad de procesamiento centralEjecuta el modelo CV, el modelo NLP y el controlador de locomoción
15 servosArticulaciones de patas (12), cola (1), panorámica de cabeza (1), inclinación de cabeza (1)
Ventilador de refrigeración internoGestión térmica para CPU bajo carga de inferencia
AltavozSalida de audio para discurso generado por NLP
MicrófonoEntrada de audio ambiental y detección de interacción
Mini impresora térmicaSalida física — imprime texto generado en papel
Antena de comunicaciónConectividad inalámbrica para monitoreo remoto
Placa de gestión de energíaRegulación de voltaje y gestión de batería
4 motores de tracciónLocomoción autónoma en superficies planas

Fase 4: Integración IA

El sistema IA opera como un pipeline secuencial de dos etapas:

Etapa A — Detección de Objetos y Navegación

La cámara gran angular alimenta un modelo de computer vision que detecta y clasifica objetos dentro del campo de visión del robot. Cuando se identifica un objetivo válido, el sistema calcula el desplazamiento angular, transmite comandos de navegación al controlador de locomoción, impulsa el robot hacia el objetivo y se detiene cuando el objetivo está dentro del rango óptimo de captura.

El bucle de navegación corre a 10 Hz, actualizando la corrección de rumbo en cada fotograma.

Etapa B — Análisis y Generación de Salida

Una vez posicionado, la cámara de autoenfoque captura una imagen de alta resolución del objetivo. El modelo CV extrae características visuales, que se pasan al modelo NLP para generar una descripción en lenguaje natural. El texto generado se enruta al altavoz para salida de audio y simultáneamente la impresora térmica produce una copia en papel.


Métricas de Rendimiento

MétricaResultado
Precisión de detección de objetosAlta — validada en múltiples tipos de objetivo y condiciones de iluminación
Tiempo de navegación al objetivo~15 segundos desde la detección hasta la posición óptima de captura
Generación de salida NLP< 3 segundos desde la captura de imagen hasta la salida de audio
Coordinación de servos15 servos operando en patrones de marcha coordinados sin conflictos de actuación
Operación continuaOperación autónoma de múltiples horas entre intervenciones de mantenimiento

Aplicaciones Tecnológicas

Inspección autónoma. El pipeline percepción-navegación-captura es la arquitectura central para robots de inspección automatizados en fabricación, infraestructura y energía.

Navegación industrial. El sistema de locomoción multi-servo y el bucle de navegación impulsado por CV en tiempo real escalan a AGVs de almacén y robots de línea de ensamblaje.

Colaboración humano-robot. El sistema de audio I/O y la capa de salida NLP son la base para robots que comunican su estado y hallazgos a operadores humanos en lenguaje natural.

Control de calidad por computer vision. El pipeline CV de dos etapas es directamente aplicable a sistemas de inspección visual automatizada para detección de defectos en líneas de producción.


Tecnologías Utilizadas

Proyecto desarrollado con: Robótica Autónoma — Computer Vision — NLP — Sistemas Embebidos — Diseño y Fabricación 3D — Control de Servos — Mecatrónica — Inferencia Edge AI


¿Construyendo un Robot Autónomo o Sistema de Computer Vision?

Este proyecto demuestra que Maedcore puede llevar un sistema robótico complejo desde el diseño CAD hasta la operación completamente autónoma. Si tienes un requisito de robótica, inspección o computer vision, solicita un presupuesto técnico.

Solicitar Presupuesto de Robótica | Ver Servicios de Mecatrónica | Ver Servicios de IA

Sobre el Autor

Eduardo Fuentevilla Blanco

Eduardo Fuentevilla Blanco

Robotics Engineer

For over a decade, I have been driven by a single mission: leveraging AI and robotics to build a world of automated production. I believe that by creating self-sufficient systems, we can empower people to refocus on what truly matters—their families and their passions. My expertise spans from winning prestigious European startup competitions to architecting complex, integrated hardware and software projects. I specialize in bridging the gap between today's industrial challenges and tomorrow's autonomous solutions.

AI & RoboticsIndustrial AutomationHardware & Software IntegrationIoT
LinkedIn ↗

Revisión experta: Maedcore Team

¿Listo para transformar tu empresa?

Reserva una reunión gratuita de 30 minutos con un ingeniero.