// casos de uso · atencion al cliente

Soporte a escala,
datos en la UE.

Desvía y resuelve tickets y conversaciones por chat, email y voz, anclado en el help center, con datos de cliente que no salen de la UE.

// como funciona

Resuelve mas, con conocimiento propio.

Recuperacion, razonamiento, herramientas y voz en un unico endpoint compatible con OpenAI — en cada canal, y solo dentro de la UE.

paso 01

Ancla en el help center

qwen3-embedding

Se recupera de la base de conocimiento, documentacion y tickets anteriores para que las respuestas sean precisas y conformes a la politica — ancladas en la realidad del negocio, no en la de un modelo generico.

paso 02

Responde y actua

deepseek-v4-flash

Resuelve tickets y chats con tool calling — consulta pedidos, revisa cuentas, ejecuta acciones — y escala de forma limpia a un humano cuando es lo correcto.

paso 03

En cada canal

kokoro

Chat, email o voz — se transcribe y se habla con whisper-large-v3 y kokoro para voicebots e IVR. Un stack para cada punto de contacto con el cliente.

// drop-in

Se cambia una linea. El helpdesk sigue igual.

Respuestas ancladas en la base de conocimiento, con herramientas, en una sola chat completion. Se cambia la base URL y la key y el bot de soporte corre sobre modelos privados de la UE.

leer_los_docs
support.py
from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.helmcode.com/v1",  # one line changes
)

# answer from your help center, with tools to take action
reply = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "Answer from the help center." + kb_context},
        *conversation,
    ],
    tools=tools,            # look up orders, check accounts
)

// por que helmcode

Soporte que mantiene los datos del cliente en casa.

Cada ticket y cada llamada estan llenos de PII. Las APIs cerradas lo quieren todo — los mensajes y las grabaciones.

01

La PII del cliente no se almacena.

Tickets, chats y grabaciones no se registran nunca ni entrenan ningun modelo. Los datos personales de una conversacion se quedan exactamente donde deben.

02

Procesado en la UE.

Las conversaciones y los datos de cliente permanecen en infraestructura de la UE — no en hyperscalers de EE. UU. sujetos al Cloud Act. GDPR y AI Act nativos.

03

Menor coste por interaccion.

Cada ticket, mensaje y minuto esta incluido. Los limites son RPM y concurrencia por key — nunca el total de tokens — asi que el coste por interaccion baja a medida que crece el volumen.

04

Chat + voz, una API.

Texto y voz — STT, LLM y TTS — tras un unico endpoint compatible con OpenAI. Un stack para tickets, chat y voicebots.

05

Anclado en el help center.

Respuestas recuperadas de la base de conocimiento propia, con citas — menos alucinaciones, menos respuestas erroneas, menos escalados.

06

Se integra en el stack.

Chat, herramientas y audio compatibles con OpenAI. Se cambia la base URL y la key; el helpdesk, CCaaS o framework de bots sigue funcionando.

En produccion en
  • Contact center / BPO
  • E-commerce y retail
  • Telco
  • Banca y fintech
  • Sector publico
  • Productos AI-native
En producción en

// faq de soporte

Soporte, respondido.

Lo que preguntan los equipos de CX e ingenieria antes de automatizar el soporte sobre datos propios.

¿Puede responder desde el help center propio?

Si. Las respuestas se anclan con recuperacion (qwen3-embedding + rerank) sobre la base de conocimiento, documentacion y tickets anteriores, para que sean precisas y conformes a la politica — con citas.

¿Puede ejecutar acciones, no solo responder?

Si. Con tool calling puede consultar pedidos, revisar cuentas y lanzar flujos, y escalar a un humano cuando haga falta — las mismas herramientas JSON que ya se usan con OpenAI.

¿Soporta voz?

Si. Transcribe llamadas con whisper-large-v3 y sintetiza respuestas con kokoro (por debajo del segundo, 67 voces) para voicebots e IVR — todo desde la misma API.

¿Almacenais tickets o grabaciones de llamadas?

No. Sin logs — conversaciones, transcripciones y grabaciones no se persisten nunca ni entrenan ningun modelo.

¿Como se reduce el coste por interaccion?

Con tarifa plana y sin limites de tokens, cada ticket desviado y cada mensaje esta incluido — asi que, a medida que crece el volumen, el coste por interaccion baja en lugar de subir.

¿Se puede ejecutar on-premise para soporte regulado?

Si. Se ejecuta en una GPU dedicada o totalmente on-premise dentro del datacenter del cliente — la misma API y el mismo codigo, con datos que no salen de la red.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.