Saltar al contenido principal
Technical reference · rate limits + 429 handling

API rate limits por tier

10 recursos con límites visibles por tier · 6 principios cap-protect · headers HTTP estándar · 429 handling con retry-after · notification flow gradual (60% → 80% → 95% → 100%). Zero overage charges sorpresa.

10
Recursos con cap
Visibles · por tier · sin sorpresas
429
HTTP standard
Retry-After header · documentado
0 €
Overage
Cero charges sorpresa · pausa graceful
Custom
Enterprise
Caps negociados · sin límite publicado

10 recursos · límites por tier

Caps mensuales agregados (mes natural · reset día 1) excepto API HTTP requests (burst per-minute sliding window). Unit visible al lado de cada valor.

RecursoStarterGrowthScaleEliteEnterprise
WhatsApp inbound messages
/mes/clinica
1.0005.00015.00050.000Custom
WhatsApp outbound messages
/mes/clinica
1.5007.50022.50075.000Custom
LLM tokens (GPT-4.1 inference)
/mes/clinica
500.0002.500.0007.500.00025.000.000Custom
Embeddings tokens (RAG indexing)
/mes/clinica
1.000.0005.000.00015.000.00050.000.000Custom
Webhook outbound (Cal.com · Stripe · custom)
/mes/clinica
10.00050.000150.000500.000Custom
API GET requests dashboard
/min/clinica (burst)
603006001.200Custom
API POST requests (mutations)
/min/clinica (burst)
30100200500Custom
Concurrent WebSocket connections
simultáneas/clinica
525100500Custom
File uploads (KB documents)
/mes/clinica
100MB500MB2GB10GBCustom
Audit log retention
retención
12 meses24 meses36 meses84 meses (7 años)Custom

6 principios cap-protect

Cap protege · no penaliza
Los caps existen para proteger tu unit economics · no para forzar upgrade. Alerta al 80% del cap + pausa graceful al 100% + email founder. Cero overage charges sorpresa.
Burst tolerante
Rate limits API HTTP son burst-tolerant: si en 1 min tienes 100 requests pero promedio mes es 30/min, se permite. Sliding window 60s · no token bucket strict.
Headers visibles
Cada response API incluye headers X-RateLimit-Limit · X-RateLimit-Remaining · X-RateLimit-Reset · X-RateLimit-Window. Tu integration sabe exactamente dónde está.
429 con retry-after
Si llegas al cap burst: response 429 + header Retry-After (segundos). Tu integration debe respetarlo · exponential backoff start 2s · max 60s. Documentado en /api-docs.
Cap mensual ≠ cap diario
El cap mensual es agregado. Si gastas 90% en primeros 10 días del mes, no se prorrate. Pausamos al 100% del mensual hasta nuevo billing cycle o upgrade tier.
Custom Enterprise sin caps
Enterprise tier negotia caps custom según volumen real. Default 'sin caps publicados' · pricing escalable. Reserva sesión técnica si volumen >Elite tier.

Headers HTTP + 429 example

Tu integration recibe siempre headers rate-limit info en cada response API. Cuando agotas burst capacity, response 429 con Retry-After. Exponential backoff documentado en /api-docs.

# Request
GET /api/v1/patients HTTP/1.1
Host: api.aiempire.software
Authorization: Bearer <your_token>

# Response
HTTP/1.1 200 OK
Content-Type: application/json
X-RateLimit-Limit: 300
X-RateLimit-Remaining: 247
X-RateLimit-Reset: 1747523400
X-RateLimit-Window: 60

# Response cuando agotas el burst
HTTP/1.1 429 Too Many Requests
Content-Type: application/json
Retry-After: 15
X-RateLimit-Limit: 300
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1747523415

{
  "error": "rate_limit_exceeded",
  "message": "API burst limit reached (300/min)",
  "retry_after_seconds": 15,
  "docs_url": "https://aiempire.software/api-rate-limits"
}

Notification flow · cómo te avisamos

4 thresholds graduales · cero pause sorpresa · siempre tienes ventana para decidir upgrade pro-rate o esperar billing cycle.

ThresholdAcciónTiming
60% del cap mensualEmail founder + cliente · informativo · sin pausaReal-time · alert inmediato
80% del cap mensualEmail cliente · sugerencia upgrade tier preventivo · sin pausaReal-time + recordatorio en 48h si no acción
95% del cap mensualEmail + WhatsApp founder cliente · oferta upgrade pro-rate immediatoReal-time + escalation Slack founder
100% del cap mensualGraceful pause · bot responde plantilla 'capacidad alcanzada · contacto directo' · zero penalización · pacientes derivados a teléfono clínicaInmediato + opciones upgrade pro-rate o esperar próximo billing cycle
Reality check · 99% clínicas nunca tocan caps

Caps mensuales generosos · sector benchmark clínica privada típica genera 500-2000 mensajes WhatsApp/mes inbound. Starter tier 1.000 messages cubre ~80% de clínicas pequeñas. Growth cubre ~95% mid-market.

Solo escalations reales · si llegas al cap, no es problema · señal positiva (estás creciendo). Upgrade pro-rate al tier siguiente · sin friction · sin penalización. Pricing escalable diseñado para esto.

Custom Enterprise para outliers · si tu volumen real excede Elite tier (50k+ WhatsApp/mes), reservamos sesión técnica para custom pricing · típicamente DSOs · clínicas multi-sede grandes · campañas masivas.

¿Tu volumen excede los tiers publicados?

Si necesitas Enterprise tier con caps custom (DSO · multi-sede · campañas masivas WhatsApp), reservamos sesión técnica directa founder. Pricing transparente discutido caso por caso · sin "contact sales for pricing" oculto.