Ingeniero de IA — Sistemas de Voz en Producción

Posted 2026-05-06
Remote, USA Full-time Immediate Start

Serás responsable de la capa de IA de un agente de voz en tiempo real en producción — incluyendo el motor de conversación, el pipeline basado en eventos y los workflows del agente.


Nivel: Mid–Senior

Etapa: Producto en fase temprana (con clientes reales)

Modalidad: Mayormente remoto

Stack: OpenAI Realtime API · Python · AWS

Arquitectura: Basada en eventos

Idiomas: Inglés (obligatorio) · Español (comunicación interna)


SOBRE EL ROL


No buscamos un perfil tradicional de IA.


Este rol está enfocado en construir sistemas en producción, NO en entrenar modelos, hacer experimentos o analizar datos.


Trabajarás:




  • De forma autónoma en modalidad asíncrona, con sincronización semanal


  • Siendo responsable de tu servicio de IA de extremo a extremo:

    código, pruebas, CI/CD y despliegue


  • Participando en decisiones de arquitectura (alineadas con el equipo antes de implementar)


  • Construyendo para usuarios reales con estándares altos desde el inicio


Aunque es un producto en etapa temprana, los estándares no lo son:

se espera código limpio, documentación sólida y pruebas como práctica habitual.


El inglés es obligatorio para código, documentación y comunicación.


NO ES UN PERFIL ADECUADO SI


Tu experiencia principal está en:




  • Ciencia de datos (modelos, estadística, experimentos)


  • Ingeniería de ML (pipelines de entrenamiento, despliegue de modelos)


  • Prompt engineering únicamente (herramientas no-code)


  • Investigación en IA (papers, teoría, benchmarks)


REQUISITO OBLIGATORIO (NO NEGOCIABLE)


Debes haber llevado a producción un producto real de IA de voz o audio en tiempo real.


Debes tener experiencia directa con la OpenAI Realtime API, incluyendo:




  • Ciclo de vida de sesiones


  • Flujo de eventos


  • Manejo de fallos


Si esto es nuevo para ti, no apliques.


EL SISTEMA QUE LIDERARÁS


Un agente de voz con IA en producción construido sobre OpenAI Realtime API:




  • Arquitectura basada en eventos (trigger pipeline respuesta)


  • Conversación en tiempo real + clasificación de intención + captura de datos estructurados


  • Orquestación de workflows con Relevance AI


Serás responsable de ambas capas:




  • Integración de IA


  • Arquitectura de workflows y prompting


Tú construyes, tú eres dueño, tú despliegas. No hay hand-offs.


RESPONSABILIDADES


1. Integración con OpenAI Realtime API




  • Gestionar el ciclo completo de sesiones (creación, tokens, eventos, cierre)


  • Manejar fallos (sesiones caídas, errores de secuencia, timeouts, reconexión)


  • Optimizar continuamente:


    • Calidad de voz


    • Latencia


    • Naturalidad de la conversación




2. Arquitectura e Infraestructura (Event-driven)




  • Diseñar y mantener el pipeline basado en eventos


  • Garantizar confiabilidad, observabilidad y manejo robusto de errores


  • Ser responsable del stack completo:


    • CI/CD


    • Infraestructura


    • Despliegues en múltiples entornos




3. Workflows de Agentes y Prompting




  • Diseñar workflows multi-paso en Relevance AI:


    • Clasificación


    • Enrutamiento


    • Uso de herramientas


    • Captura de datos




  • Construir prompts, function calling y lógica condicional


  • Crear nuevos workflows desde cero


  • Documentar y proponer arquitecturas antes de implementar


4. Calidad, Testing y Documentación




  • Escribir y mantener pruebas con pytest (obligatorio)


  • Aplicar estándares de calidad:


    • Linting con ruff


    • Controles en CI antes de cada merge




  • Monitorear:


    • Calidad de conversaciones


    • Confiabilidad de eventos


    • Costos de API




  • Documentar todo en inglés


  • Proponer cambios relevantes y alinearlos antes de ejecutar


REQUISITOS


Obligatorios (no negociables)




  • Experiencia en producción con OpenAI Realtime API


  • Python sólido (async/await, arquitectura limpia, pytest)


  • Diseño de sistemas basados en eventos


  • Function calling de LLM en producción


  • Diseño de workflows de agentes (multi-paso, con estado)


  • AWS:


    • Lambda


    • API Gateway


    • DynamoDB


    • SAM


    • SSM




  • Gestión completa de CI/CD (GitHub Actions, pipelines, despliegues)


  • Inglés fluido (oral y escrito)


  • Español (comunicación interna)


Deseable




  • Experiencia con Relevance AI o similares


  • Fundamentos de WebRTC (SDP, ICE, signaling)


  • FastAPI, Pydantic v2, httpx, Mangum


  • Docker, ruff, freezegun


  • Experiencia en startups


STACK TECNOLÓGICO


Core:

OpenAI Realtime API · Python 3.11 · FastAPI · httpx · Pydantic v2 · Mangum


Infraestructura:

AWS Lambda · API Gateway · DynamoDB · SSM · SAM · S3


Herramientas:

GitHub Actions · Docker · pytest · ruff · Relevance AI


FORMA DE TRABAJO




  • Trabajo asíncrono con sincronización semanal


  • Alta autonomía y responsabilidad


  • Alineación antes de implementar


  • Ejecución rápida después de acordar

Por favor envía tu CV con el link de tus repositorios y tu expectativa salarial al correo [email protected]


Correos sin estos datos no se tendrán en cuenta...

Similar Jobs

Back to Job Board