// casos de uso · copilots

Copilots para
el equipo experto.

Asistentes in-app e internos sobre modelos open, con tool calling, razonamiento y contexto de dominio propio.

// como funciona

Asistentes que actuan, no que solo chatean.

Recuperacion, tool calling y razonamiento en un unico endpoint compatible con OpenAI — el copilot trabaja sobre datos propios y solo dentro de la UE.

paso 01

Ancla en el dominio

qwen3-embedding

Recupera sobre documentacion, codigo y tickets para que el copilot responda desde la realidad del equipo — no desde lo que un modelo generico memorizo.

paso 02

Conecta las herramientas

deepseek-v4-flash

Con tool y function calling nativo, el copilot consulta sistemas internos, ejecuta acciones y encadena pasos — el mismo JSON schema que ya se usa con OpenAI.

paso 03

Razona y responde

qwen3.6

El modelo razona sobre el contexto y la salida de las herramientas, y despues envia la respuesta en streaming al producto — 2x de rendimiento via speculative decoding, y sin logs.

// drop-in

Se cambia una linea. El stack sigue igual.

Apunta el SDK de OpenAI — o Vercel AI SDK, LangChain, cualquier bucle de chat — a Helmcode. Mismas herramientas, mismo streaming, modelos privados en la UE.

leer_los_docs
copilot.py
from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.helmcode.com/v1",  # one line changes
)

# the tools your copilot is allowed to call
tools = [{
    "type": "function",
    "function": {
        "name": "search_tickets",
        "description": "Search the customer's support history",
        "parameters": schema,
    },
}]

reply = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=messages,
    tools=tools,            # native tool calling
    stream=True,
)

// por que helmcode

Copilots en los que el equipo puede confiar.

El asistente accede al trabajo mas sensible — codigo, expedientes, datos de clientes. Exactamente lo que las APIs cerradas piden enviar fuera.

01

Sin logs, desde la arquitectura.

Lo que preguntan los expertos y lo que lee el copilot no se almacena nunca ni entrena ningun modelo — ni el nuestro ni el de nadie.

02

Se ejecuta en la UE.

Cada turno del copilot se procesa solo en infraestructura de la UE — no en hyperscalers de EE. UU. sujetos al Cloud Act. GDPR y AI Act nativos.

03

Tool calling y razonamiento.

Modelos abiertos de referencia con function calling nativo y razonamiento — todo lo que necesita un copilot real para actuar, no solo para chatear.

04

Sin limites de turnos.

Cada mensaje, reintento y bucle de agente esta incluido. Los limites son RPM y concurrencia por key — nunca el total de tokens. Un usuario intensivo no dispara la factura.

05

Modelos abiertos, sin lock-in.

DeepSeek V4-Flash, Qwen 3.6, Gemma 4. Ningun proveedor puede deprecar el modelo que hay detras del copilot ni cambiar el precio de un dia para otro.

06

Se integra en la app.

Basta con cambiar la base URL y la key. Vercel AI SDK, LangChain, LlamaIndex y codigo propio de chat siguen funcionando — streaming y herramientas incluidos.

En produccion en
  • B2B SaaS
  • Seguros
  • Salud
  • RRHH y seleccion
  • Energia y utilities
  • Educacion
  • Industria
En producción en

// faq de copilots

Copilots, respondido.

Lo que preguntan los equipos de producto e ingenieria antes de construir asistentes sobre datos propios.

¿Que modelos son mejores para construir copilots?

deepseek-v4-flash para razonamiento de referencia y tool calling, qwen3.6 (35B MoE) para 2x de rendimiento via speculative decoding, y gemma4 cuando se necesita vision. Todos comparten una API compatible con OpenAI.

¿Soportais tool / function calling?

Si — function calling nativo con el mismo JSON schema que ya se usa con OpenAI, mas streaming. El copilot puede consultar sistemas y ejecutar acciones, no solo responder.

¿Puede el copilot usar datos internos?

Si. Se combina con recuperacion (qwen3-embedding + rerank) para anclar las respuestas en documentacion, codigo y tickets — sin fine-tuning, y los datos se quedan en la UE.

¿Almacenais prompts o respuestas?

No. Sin logs — lo que escriben los expertos y lo que lee el copilot no se persiste nunca ni entrena ningun modelo.

¿Funciona con Vercel AI SDK o LangChain?

Si. Basta con apuntar cualquier cliente compatible con OpenAI a nuestra base URL con la API key. Vercel AI SDK, LangChain, LlamaIndex y codigo a medida funcionan sin cambios.

¿Se puede ejecutar un copilot totalmente on-premise?

Si. Para compliance estricto, se ejecuta en una GPU dedicada o on-premise dentro del datacenter del cliente — la misma API y el mismo codigo, con datos que nunca salen de la red.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.