// casos de uso · copilots

Copilots para
el equipo experto.

Asistentes in-app e internos sobre modelos open, con tool calling, razonamiento y contexto de dominio propio.

// cómo funciona

Asistentes que actúan, no que solo chatean.

Recuperación, tool calling y razonamiento en un único endpoint compatible con OpenAI, el copilot trabaja sobre datos propios y solo dentro de la UE.

paso 01

Ancla en el dominio

qwen3-embedding

Recupera sobre documentación, código y tickets para que el copilot responda desde la realidad del equipo, no desde lo que un modelo genérico memorizo.

paso 02

Conecta las herramientas

deepseek-v4-flash

Con tool y function calling nativo, el copilot consulta sistemas internos, ejecuta acciones y encadena pasos, el mismo JSON schema que ya se usa con OpenAI.

paso 03

Razona y responde

qwen3.6

El modelo razona sobre el contexto y la salida de las herramientas, y después envia la respuesta en streaming al producto, 2x de rendimiento via speculative decoding, y sin logs.

// drop-in

Cambia una línea. El stack sigue igual.

Apunta el SDK de OpenAI, o Vercel AI SDK, LangChain, cualquier bucle de chat, a Helmcode. Mismas herramientas, mismo streaming, modelos privados en la UE.

leer_los_docs

copilot.py

from openai import OpenAI

client = OpenAI(
    api_key="sk-...",
    base_url="https://api.helmcode.com/v1",  # one line changes
)

# the tools your copilot is allowed to call
tools = [{
    "type": "function",
    "function": {
        "name": "search_tickets",
        "description": "Search the customer's support history",
        "parameters": schema,
    },
}]

reply = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=messages,
    tools=tools,            # native tool calling
    stream=True,
)

// por qué helmcode

Copilots en los que el equipo puede confiar.

El asistente accede al trabajo más sensible, código, expedientes, datos de clientes. Exactamente lo que las APIs cerradas piden enviar fuera.

Sin logs, por arquitectura.

Lo que preguntan los expertos y lo que lee el copilot no se almacena nunca ni entrena ningún modelo, ni el nuestro ni el de nadie.

Se ejecuta en la UE.

Cada turno del copilot se procesa solo en infraestructura de la UE, no en hyperscalers de EE. UU. sujetos al Cloud Act. GDPR y AI Act nativos.

Tool calling y razonamiento.

Modelos abiertos de referencia con function calling nativo y razonamiento, todo lo que necesita un copilot real para actuar, no solo para chatear.

Sin límites de turnos.

Cada mensaje, reintento y bucle de agente está incluido. Los límites son RPM y concurrencia por key, nunca el total de tokens. Un usuario intensivo no dispara la factura.

Modelos abiertos, sin lock-in.

DeepSeek V4-Flash, Qwen 3.6, Gemma 4. Ningún proveedor puede deprecar el modelo que hay detras del copilot ni cambiar el precio de un día para otro.

Se integra en la app.

Basta con cambiar la base URL y la key. Vercel AI SDK, LangChain, LlamaIndex y código propio de chat siguen funcionando, streaming y herramientas incluidos.

En producción en

B2B SaaS
Seguros
Salud
RRHH y seleccion
Energia y utilities
Educacion
Industria

En producción en

// faq de copilots

Copilots, respondido.

Lo que preguntan los equipos de producto e ingeniería antes de construir asistentes sobre datos propios.

¿Qué modelos son mejores para construir copilots?

deepseek-v4-flash para razonamiento de referencia y tool calling, qwen3.6 (35B MoE) para 2x de rendimiento via speculative decoding, y gemma4 cuando se necesita vision. Todos comparten una API compatible con OpenAI.

¿Soportáis tool / function calling?

Sí, function calling nativo con el mismo JSON schema que ya se usa con OpenAI, más streaming. El copilot puede consultar sistemas y ejecutar acciones, no solo responder.

¿Puede el copilot usar datos internos?

Sí. Se combina con recuperación (qwen3-embedding + rerank) para anclar las respuestas en documentación, código y tickets, sin fine-tuning, y los datos se quedan en la UE.

¿Almacenáis prompts o respuestas?

No. Sin logs, lo que escriben los expertos y lo que lee el copilot no se persiste nunca ni entrena ningún modelo.

¿Funciona con Vercel AI SDK o LangChain?

Sí. Basta con apuntar cualquier cliente compatible con OpenAI a nuestra base URL con la API key. Vercel AI SDK, LangChain, LlamaIndex y código a medida funcionan sin cambios.

¿Se puede ejecutar un copilot totalmente on-premise?

Sí. Para compliance estricto, se ejecuta en una GPU dedicada o on-premise dentro de tu datacenter, la misma API y el mismo código, con datos que nunca salen de tu red.

// empezar

EMPIEZA A QUEMAR TOKENS

Olvídate de la infra de IA. Despliega hoy el primer endpoint de inferencia privada.

Tarifa plana. Datos en la UE. Compatible con la API de OpenAI.

reservar_llamada

Copilots parael equipo experto.