// casos de uso · atención al cliente

Soporte a escala,
datos en la UE.

Desvía y resuelve tickets y conversaciones por chat, email y voz, anclado en el help center, con datos de cliente que no salen de la UE.

reservar_llamada

// cómo funciona

Resuelve más, con conocimiento propio.

Recuperación, razonamiento, herramientas y voz en un único endpoint compatible con OpenAI, en cada canal, y solo dentro de la UE.

paso 01

Ancla en el help center

qwen3-embedding

Se recupera de la base de conocimiento, documentación y tickets anteriores para que las respuestas sean precisas y conformes a la política, ancladas en la realidad del negocio, no en la de un modelo genérico.

paso 02

Responde y actúa

deepseek-v4-flash

Resuelve tickets y chats con tool calling, consulta pedidos, revisa cuentas, ejecuta acciones, y escala de forma limpia a un humano cuando es lo correcto.

paso 03

En cada canal

kokoro

Chat, email o voz, se transcribe y se habla con whisper-large-v3 y kokoro para voicebots e IVR. Un stack para cada punto de contacto con el cliente.

// drop-in

Cambia una línea. El helpdesk sigue igual.

Respuestas ancladas en la base de conocimiento, con herramientas, en una sola chat completion. Cambias la base URL y la key y el bot de soporte corre sobre modelos privados de la UE.

leer_los_docs

support.py

from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.helmcode.com/v1",  # one line changes
)

# answer from your help center, with tools to take action
reply = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "Answer from the help center." + kb_context},
        *conversation,
    ],
    tools=tools,            # look up orders, check accounts
)

// por qué helmcode

Soporte que mantiene los datos del cliente en casa.

Cada ticket y cada llamada están llenos de PII. Las APIs cerradas lo quieren todo, los mensajes y las grabaciones.

La PII del cliente no se almacena.

Tickets, chats y grabaciones no se registran nunca ni entrenan ningún modelo. Los datos personales de una conversación se quedan exactamente donde deben.

Procesado en la UE.

Las conversaciones y los datos de cliente permanecen en infraestructura de la UE, no en hyperscalers de EE. UU. sujetos al Cloud Act. GDPR y AI Act nativos.

Menor coste por interacción.

Cada ticket, mensaje y minuto está incluido. Los límites son RPM y concurrencia por key, nunca el total de tokens, así que el coste por interacción baja a medida que crece el volumen.

Chat + voz, una API.

Texto y voz, STT, LLM y TTS, tras un único endpoint compatible con OpenAI. Un stack para tickets, chat y voicebots.

Anclado en el help center.

Respuestas recuperadas de la base de conocimiento propia, con citas, menos alucinaciones, menos respuestas erróneas, menos escalados.

Se integra en el stack.

Chat, herramientas y audio compatibles con OpenAI. Cambias la base URL y la key; el helpdesk, CCaaS o framework de bots sigue funcionando.

En producción en

Contact center / BPO
E-commerce y retail
Telco
Banca y fintech
Sector público
Productos AI-native

En producción en

// faq de soporte

Soporte, respondido.

Lo que preguntan los equipos de CX e ingeniería antes de automatizar el soporte sobre datos propios.

¿Puede responder desde el help center propio?

Sí. Las respuestas se anclan con recuperación (qwen3-embedding + rerank) sobre la base de conocimiento, documentación y tickets anteriores, para que sean precisas y conformes a la política, con citas.

¿Puede ejecutar acciones, no solo responder?

Sí. Con tool calling puede consultar pedidos, revisar cuentas y lanzar flujos, y escalar a un humano cuando haga falta, las mismas herramientas JSON que ya se usan con OpenAI.

¿Soporta voz?

Sí. Transcribe llamadas con whisper-large-v3 y sintetiza respuestas con kokoro (por debajo del segundo, 67 voces) para voicebots e IVR, todo desde la misma API.

¿Almacenáis tickets o grabaciones de llamadas?

No. Sin logs, conversaciones, transcripciones y grabaciones no se persisten nunca ni entrenan ningún modelo.

¿Cómo se reduce el coste por interacción?

Con tarifa plana y sin límites de tokens, cada ticket desviado y cada mensaje está incluido, así que, a medida que crece el volumen, el coste por interacción baja en lugar de subir.

¿Se puede ejecutar on-premise para soporte regulado?

Sí. Se ejecuta en una GPU dedicada o totalmente on-premise dentro de tu datacenter, la misma API y el mismo código, con datos que no salen de tu red.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.