Como você escala uma implantação em Kubernetes?
Você pode implantações automáticas com base na utilização da CPU de pods usando Kubectl AutoScale ou do menu GKE Workloads no Google Cloud Console. Kubectl AutoScale cria um objeto horizontalpodaUtroscaler (ou HPA) que tem como alvo um recurso especificado (chamado de alvo de escala) e o escala conforme necessário.
Qual é o limite da API de Kubernetes?
Limite para solicitações de API
O limite de taxa padrão para a API do mecanismo Kubernetes é de 3000 solicitações por minuto, imposto em intervalos de cada 100 segundos.