Ingeniero de IA — Sistemas de Voz en Producción
Posted 2026-05-06Serás responsable de la capa de IA de un agente de voz en tiempo real en producción — incluyendo el motor de conversación, el pipeline basado en eventos y los workflows del agente.
Nivel: Mid–Senior
Etapa: Producto en fase temprana (con clientes reales)
Modalidad: Mayormente remoto
Stack: OpenAI Realtime API · Python · AWS
Arquitectura: Basada en eventos
Idiomas: Inglés (obligatorio) · Español (comunicación interna)
SOBRE EL ROL
No buscamos un perfil tradicional de IA.
Este rol está enfocado en construir sistemas en producción, NO en entrenar modelos, hacer experimentos o analizar datos.
Trabajarás:
De forma autónoma en modalidad asíncrona, con sincronización semanal
Siendo responsable de tu servicio de IA de extremo a extremo:
código, pruebas, CI/CD y despliegue
Participando en decisiones de arquitectura (alineadas con el equipo antes de implementar)
Construyendo para usuarios reales con estándares altos desde el inicio
Aunque es un producto en etapa temprana, los estándares no lo son:
se espera código limpio, documentación sólida y pruebas como práctica habitual.
El inglés es obligatorio para código, documentación y comunicación.
NO ES UN PERFIL ADECUADO SI
Tu experiencia principal está en:
Ciencia de datos (modelos, estadística, experimentos)
Ingeniería de ML (pipelines de entrenamiento, despliegue de modelos)
Prompt engineering únicamente (herramientas no-code)
Investigación en IA (papers, teoría, benchmarks)
REQUISITO OBLIGATORIO (NO NEGOCIABLE)
Debes haber llevado a producción un producto real de IA de voz o audio en tiempo real.
Debes tener experiencia directa con la OpenAI Realtime API, incluyendo:
Ciclo de vida de sesiones
Flujo de eventos
Manejo de fallos
Si esto es nuevo para ti, no apliques.
EL SISTEMA QUE LIDERARÁS
Un agente de voz con IA en producción construido sobre OpenAI Realtime API:
Arquitectura basada en eventos (trigger pipeline respuesta)
Conversación en tiempo real + clasificación de intención + captura de datos estructurados
Orquestación de workflows con Relevance AI
Serás responsable de ambas capas:
Integración de IA
Arquitectura de workflows y prompting
Tú construyes, tú eres dueño, tú despliegas. No hay hand-offs.
RESPONSABILIDADES
1. Integración con OpenAI Realtime API
Gestionar el ciclo completo de sesiones (creación, tokens, eventos, cierre)
Manejar fallos (sesiones caídas, errores de secuencia, timeouts, reconexión)
Optimizar continuamente:
Calidad de voz
Latencia
Naturalidad de la conversación
2. Arquitectura e Infraestructura (Event-driven)
Diseñar y mantener el pipeline basado en eventos
Garantizar confiabilidad, observabilidad y manejo robusto de errores
Ser responsable del stack completo:
CI/CD
Infraestructura
Despliegues en múltiples entornos
3. Workflows de Agentes y Prompting
Diseñar workflows multi-paso en Relevance AI:
Clasificación
Enrutamiento
Uso de herramientas
Captura de datos
Construir prompts, function calling y lógica condicional
Crear nuevos workflows desde cero
Documentar y proponer arquitecturas antes de implementar
4. Calidad, Testing y Documentación
Escribir y mantener pruebas con pytest (obligatorio)
Aplicar estándares de calidad:
Linting con ruff
Controles en CI antes de cada merge
Monitorear:
Calidad de conversaciones
Confiabilidad de eventos
Costos de API
Documentar todo en inglés
Proponer cambios relevantes y alinearlos antes de ejecutar
REQUISITOS
Obligatorios (no negociables)
Experiencia en producción con OpenAI Realtime API
Python sólido (async/await, arquitectura limpia, pytest)
Diseño de sistemas basados en eventos
Function calling de LLM en producción
Diseño de workflows de agentes (multi-paso, con estado)
AWS:
Lambda
API Gateway
DynamoDB
SAM
SSM
Gestión completa de CI/CD (GitHub Actions, pipelines, despliegues)
Inglés fluido (oral y escrito)
Español (comunicación interna)
Deseable
Experiencia con Relevance AI o similares
Fundamentos de WebRTC (SDP, ICE, signaling)
FastAPI, Pydantic v2, httpx, Mangum
Docker, ruff, freezegun
Experiencia en startups
STACK TECNOLÓGICO
Core:
OpenAI Realtime API · Python 3.11 · FastAPI · httpx · Pydantic v2 · Mangum
Infraestructura:
AWS Lambda · API Gateway · DynamoDB · SSM · SAM · S3
Herramientas:
GitHub Actions · Docker · pytest · ruff · Relevance AI
FORMA DE TRABAJO
Trabajo asíncrono con sincronización semanal
Alta autonomía y responsabilidad
Alineación antes de implementar
Ejecución rápida después de acordar
Por favor envía tu CV con el link de tus repositorios y tu expectativa salarial al correo [email protected]
Correos sin estos datos no se tendrán en cuenta...