Roteamento Inteligente
Como o Ignus Code roteia requisições entre provedores para máxima performance e disponibilidade.
O motor de roteamento do Ignus Code recebe cada requisição, decide qual provedor usar e garante que a resposta chegue ao seu app com o mínimo de latência e máxima disponibilidade.
O que o motor de roteamento faz
Cada vez que você faz uma chamada à API do Ignus Code:
- Valida a requisição e sua API key
- Seleciona o provedor com menor latência atual
- Roteia a request para o provedor escolhido
- Monitora a resposta em tempo real
- Aplica fallback se o provedor retornar erro
- Registra latência, tokens e custo no seu dashboard
Sua App → Motor de roteamento → OpenAI ✅ (45ms) ← selecionado
→ Anthropic (62ms)
→ Google (71ms)
Seleção de provedor
O sistema mantém métricas em tempo real de cada provedor:
- Latência média das últimas requisições
- Taxa de erros nos últimos 60 segundos
- Disponibilidade (uptime contínuo)
O provedor com menor pontuação combinada é selecionado automaticamente.
Fallback automático
Se o provedor selecionado retornar um erro recuperável (429, 500, 502, 503, 504), o sistema tenta o próximo provedor na lista sem que seu app perceba:
Requisição → OpenAI (429 Rate Limit)
→ retry automático → Anthropic (200 OK) ✅
O fallback acontece em menos de 100ms na maioria dos casos.
Erros 4xx de autenticação ou requisição inválida não são retriados — indicam problema na request, não no provedor.
Latência adicionada
O roteamento adiciona menos de 50ms de overhead em média. Para a maioria das aplicações, essa latência é imperceptível em comparação com o tempo de geração dos tokens.
| Operação | Tempo médio |
|---|---|
| Validação da API key | ~5ms |
| Seleção de provedor | ~10ms |
| Overhead total | < 50ms |
Observabilidade
Cada requisição roteada gera um registro no seu Dashboard com:
- Provedor usado
- Latência total e por etapa
- Tokens consumidos (entrada + saída)
- Custo em reais
- Status da resposta
Acesse em: Dashboard → Logs.