API rate limits por tier
10 recursos con límites visibles por tier · 6 principios cap-protect · headers HTTP estándar · 429 handling con retry-after · notification flow gradual (60% → 80% → 95% → 100%). Zero overage charges sorpresa.
10 recursos · límites por tier
Caps mensuales agregados (mes natural · reset día 1) excepto API HTTP requests (burst per-minute sliding window). Unit visible al lado de cada valor.
| Recurso | Starter | Growth | Scale | Elite | Enterprise |
|---|---|---|---|---|---|
WhatsApp inbound messages /mes/clinica | 1.000 | 5.000 | 15.000 | 50.000 | Custom |
WhatsApp outbound messages /mes/clinica | 1.500 | 7.500 | 22.500 | 75.000 | Custom |
LLM tokens (GPT-4.1 inference) /mes/clinica | 500.000 | 2.500.000 | 7.500.000 | 25.000.000 | Custom |
Embeddings tokens (RAG indexing) /mes/clinica | 1.000.000 | 5.000.000 | 15.000.000 | 50.000.000 | Custom |
Webhook outbound (Cal.com · Stripe · custom) /mes/clinica | 10.000 | 50.000 | 150.000 | 500.000 | Custom |
API GET requests dashboard /min/clinica (burst) | 60 | 300 | 600 | 1.200 | Custom |
API POST requests (mutations) /min/clinica (burst) | 30 | 100 | 200 | 500 | Custom |
Concurrent WebSocket connections simultáneas/clinica | 5 | 25 | 100 | 500 | Custom |
File uploads (KB documents) /mes/clinica | 100MB | 500MB | 2GB | 10GB | Custom |
Audit log retention retención | 12 meses | 24 meses | 36 meses | 84 meses (7 años) | Custom |
6 principios cap-protect
Headers HTTP + 429 example
Tu integration recibe siempre headers rate-limit info en cada response API. Cuando agotas burst capacity, response 429 con Retry-After. Exponential backoff documentado en /api-docs.
# Request
GET /api/v1/patients HTTP/1.1
Host: api.aiempire.software
Authorization: Bearer <your_token>
# Response
HTTP/1.1 200 OK
Content-Type: application/json
X-RateLimit-Limit: 300
X-RateLimit-Remaining: 247
X-RateLimit-Reset: 1747523400
X-RateLimit-Window: 60
# Response cuando agotas el burst
HTTP/1.1 429 Too Many Requests
Content-Type: application/json
Retry-After: 15
X-RateLimit-Limit: 300
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1747523415
{
"error": "rate_limit_exceeded",
"message": "API burst limit reached (300/min)",
"retry_after_seconds": 15,
"docs_url": "https://aiempire.software/api-rate-limits"
}Notification flow · cómo te avisamos
4 thresholds graduales · cero pause sorpresa · siempre tienes ventana para decidir upgrade pro-rate o esperar billing cycle.
| Threshold | Acción | Timing |
|---|---|---|
| 60% del cap mensual | Email founder + cliente · informativo · sin pausa | Real-time · alert inmediato |
| 80% del cap mensual | Email cliente · sugerencia upgrade tier preventivo · sin pausa | Real-time + recordatorio en 48h si no acción |
| 95% del cap mensual | Email + WhatsApp founder cliente · oferta upgrade pro-rate immediato | Real-time + escalation Slack founder |
| 100% del cap mensual | Graceful pause · bot responde plantilla 'capacidad alcanzada · contacto directo' · zero penalización · pacientes derivados a teléfono clínica | Inmediato + opciones upgrade pro-rate o esperar próximo billing cycle |
Caps mensuales generosos · sector benchmark clínica privada típica genera 500-2000 mensajes WhatsApp/mes inbound. Starter tier 1.000 messages cubre ~80% de clínicas pequeñas. Growth cubre ~95% mid-market.
Solo escalations reales · si llegas al cap, no es problema · señal positiva (estás creciendo). Upgrade pro-rate al tier siguiente · sin friction · sin penalización. Pricing escalable diseñado para esto.
Custom Enterprise para outliers · si tu volumen real excede Elite tier (50k+ WhatsApp/mes), reservamos sesión técnica para custom pricing · típicamente DSOs · clínicas multi-sede grandes · campañas masivas.
¿Tu volumen excede los tiers publicados?
Si necesitas Enterprise tier con caps custom (DSO · multi-sede · campañas masivas WhatsApp), reservamos sesión técnica directa founder. Pricing transparente discutido caso por caso · sin "contact sales for pricing" oculto.