Technical reference · rate limits + 429 handling

API rate limits por tier

10 recursos con límites visibles por tier · 6 principios cap-protect · headers HTTP estándar · 429 handling con retry-after · notification flow gradual (60% → 80% → 95% → 100%). Zero overage charges sorpresa.

API docs completos Pricing + tiers Arquitectura técnica

Recursos con cap

Visibles · por tier · sin sorpresas

429

HTTP standard

Retry-After header · documentado

0 €

Overage

Cero charges sorpresa · pausa graceful

Custom

Enterprise

Caps negociados · sin límite publicado

10 recursos · límites por tier

Caps mensuales agregados (mes natural · reset día 1) excepto API HTTP requests (burst per-minute sliding window). Unit visible al lado de cada valor.

Recurso	Starter	Growth	Scale	Elite	Enterprise
WhatsApp inbound messages /mes/clinica	1.000	5.000	15.000	50.000	Custom
WhatsApp outbound messages /mes/clinica	1.500	7.500	22.500	75.000	Custom
LLM tokens (GPT-4.1 inference) /mes/clinica	500.000	2.500.000	7.500.000	25.000.000	Custom
Embeddings tokens (RAG indexing) /mes/clinica	1.000.000	5.000.000	15.000.000	50.000.000	Custom
Webhook outbound (Cal.com · Stripe · custom) /mes/clinica	10.000	50.000	150.000	500.000	Custom
API GET requests dashboard /min/clinica (burst)	60	300	600	1.200	Custom
API POST requests (mutations) /min/clinica (burst)	30	100	200	500	Custom
Concurrent WebSocket connections simultáneas/clinica	5	25	100	500	Custom
File uploads (KB documents) /mes/clinica	100MB	500MB	2GB	10GB	Custom
Audit log retention retención	12 meses	24 meses	36 meses	84 meses (7 años)	Custom

6 principios cap-protect

Cap protege · no penaliza

Los caps existen para proteger tu unit economics · no para forzar upgrade. Alerta al 80% del cap + pausa graceful al 100% + email founder. Cero overage charges sorpresa.

Burst tolerante

Rate limits API HTTP son burst-tolerant: si en 1 min tienes 100 requests pero promedio mes es 30/min, se permite. Sliding window 60s · no token bucket strict.

Headers visibles

Cada response API incluye headers X-RateLimit-Limit · X-RateLimit-Remaining · X-RateLimit-Reset · X-RateLimit-Window. Tu integration sabe exactamente dónde está.

429 con retry-after

Si llegas al cap burst: response 429 + header Retry-After (segundos). Tu integration debe respetarlo · exponential backoff start 2s · max 60s. Documentado en /api-docs.

Cap mensual ≠ cap diario

El cap mensual es agregado. Si gastas 90% en primeros 10 días del mes, no se prorrate. Pausamos al 100% del mensual hasta nuevo billing cycle o upgrade tier.

Custom Enterprise sin caps

Enterprise tier negotia caps custom según volumen real. Default 'sin caps publicados' · pricing escalable. Reserva sesión técnica si volumen >Elite tier.

Headers HTTP + 429 example

Tu integration recibe siempre headers rate-limit info en cada response API. Cuando agotas burst capacity, response 429 con Retry-After. Exponential backoff documentado en /api-docs.

# Request
GET /api/v1/patients HTTP/1.1
Host: api.aiempire.software
Authorization: Bearer <your_token>

# Response
HTTP/1.1 200 OK
Content-Type: application/json
X-RateLimit-Limit: 300
X-RateLimit-Remaining: 247
X-RateLimit-Reset: 1747523400
X-RateLimit-Window: 60

# Response cuando agotas el burst
HTTP/1.1 429 Too Many Requests
Content-Type: application/json
Retry-After: 15
X-RateLimit-Limit: 300
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1747523415

{
  "error": "rate_limit_exceeded",
  "message": "API burst limit reached (300/min)",
  "retry_after_seconds": 15,
  "docs_url": "https://aiempire.software/api-rate-limits"
}

Notification flow · cómo te avisamos

4 thresholds graduales · cero pause sorpresa · siempre tienes ventana para decidir upgrade pro-rate o esperar billing cycle.

Threshold	Acción	Timing
60% del cap mensual	Email founder + cliente · informativo · sin pausa	Real-time · alert inmediato
80% del cap mensual	Email cliente · sugerencia upgrade tier preventivo · sin pausa	Real-time + recordatorio en 48h si no acción
95% del cap mensual	Email + WhatsApp founder cliente · oferta upgrade pro-rate immediato	Real-time + escalation Slack founder
100% del cap mensual	Graceful pause · bot responde plantilla 'capacidad alcanzada · contacto directo' · zero penalización · pacientes derivados a teléfono clínica	Inmediato + opciones upgrade pro-rate o esperar próximo billing cycle

Reality check · 99% clínicas nunca tocan caps

Caps mensuales generosos · sector benchmark clínica privada típica genera 500-2000 mensajes WhatsApp/mes inbound. Starter tier 1.000 messages cubre ~80% de clínicas pequeñas. Growth cubre ~95% mid-market.

Solo escalations reales · si llegas al cap, no es problema · señal positiva (estás creciendo). Upgrade pro-rate al tier siguiente · sin friction · sin penalización. Pricing escalable diseñado para esto.

Custom Enterprise para outliers · si tu volumen real excede Elite tier (50k+ WhatsApp/mes), reservamos sesión técnica para custom pricing · típicamente DSOs · clínicas multi-sede grandes · campañas masivas.

¿Tu volumen excede los tiers publicados?

Si necesitas Enterprise tier con caps custom (DSO · multi-sede · campañas masivas WhatsApp), reservamos sesión técnica directa founder. Pricing transparente discutido caso por caso · sin "contact sales for pricing" oculto.

Reservar sesión técnica API docs completos Arquitectura técnica Pricing tiers