26 Abr 2026 5 min de leitura

Kubernetes v1.36 elimina de vez o risco de RCE via kubelet: autorização granular finalmente GA

Por quase uma década, uma única permissão aparentemente inofensiva — `GET nodes/proxy` — foi a chave mestra para execução remota de comandos em clusters inteiros. Sem registros, sem alertas, sem contenção. Agora, o Kubernetes v1.36 enterra esse vetor de ataque de uma vez por todas.

O problema silencioso: nodes/proxy e o RCE não logado

Desde as primeiras versões do Kubernetes, o verbo GET sobre o recurso nodes/proxy era a chave mestra para acessar os endpoints mais sensíveis do kubelet: /metrics, /stats, /logs, /pods, /healthz e muitos outros.

A conveniência vinha com um preço altíssimo. Essa mesma permissão permitia estabelecer um túnel WebSocket capaz de executar comandos arbitrários dentro de contêineres, sem deixar qualquer rastro no audit trail do apiserver.

Qualquer ator com o direito de fazer GET nodes/proxy podia se tornar o proprietário do nó e, em poucos movimentos, escalar para todo o cluster.

A vulnerabilidade permaneceu em estado latente até que, em 2026, pesquisadores de segurança encenaram publicamente o ataque. Com apenas uma permissão aparentemente inofensiva, demonstraram um RCE completo, transformando o que muitos consideravam um incômodo teórico em um pesadelo operacional tangível.

A correção era esperada desde então — e finalmente chegou com a maturidade da autorização granular.

O que o Kubernetes v1.36 entrega de fato

A funcionalidade KubeletFineGrainedAuthz desmembra os paths da API do kubelet em subrecursos RBAC dedicados e independentes. Em vez do guarda-chuva permissivo nodes/proxy, cada endpoint agora mapeia para um subrecurso específico, criando uma taxonomia de acessos que reflete a real necessidade de cada consumidor.

Path do kubelet	Subrecurso RBAC correspondente
`/metrics`	`nodes/metrics`
`/stats`	`nodes/stats`
`/logs`	`nodes/log`
`/pods`	`nodes/pods`
`/healthz`	`nodes/healthz`
`/configz`	`nodes/configz`
`/spec`	`nodes/spec`
`/checkpoint`	`nodes/checkpoint`

O mecanismo de fallback: bênção e armadilha

Para garantir uma transição suave entre versões e configurações de RBAC herdadas, o mecanismo implementa um dual authorization check:

A autorização é tentada primeiro via subrecurso específico.
Se falhar — por exemplo, em clusters com versões mistas ou Roles ainda não atualizadas — o sistema recorre ao nodes/proxy como fallback de compatibilidade.

Embora esse comportamento assegure que nenhum workload será quebrado abruptamente, ele carrega uma armadilha sutil, mas perigosa: o risco RCE persiste enquanto as permissões não forem explicitamente ajustadas.

Por que isso é um divisor de águas na segurança

A mudança não é apenas uma questão de boas práticas: ela elimina o vetor de ataque baseado exclusivamente em nodes/proxy, o mesmo utilizado na demonstração pública de RCE.

Ferramentas de monitoramento e observabilidade — Prometheus, Datadog, New Relic, Grafana Agent e similares — agora podem operar com privilégio mínimo real, restringindo seu acesso a nodes/metrics e nodes/stats, sem jamais carregarem a chave para uma escalada de privilégios.

O raio de explosão de qualquer incidente envolvendo essas ferramentas encolhe drasticamente, de "cluster inteiro" para "apenas leitura de métricas".

Esta é, na prática, a aplicação concreta do princípio do menor privilégio na camada de observabilidade, um desejo antigo da comunidade que remonta pelo menos a 2019. A segurança deixa de depender de esperança e passa a ser imposta pela arquitetura.

Implicações técnicas detalhadas

O ClusterRole system:kubelet-api-admin é automaticamente atualizado com todos os novos subrecursos, mantendo compatibilidade total para ferramentas que demandam acesso administrativo amplo.
O feature gate KubeletFineGrainedAuthz agora está travado como ativo (locked to enabled) na versão v1.36. Não é mais possível desabilitá-lo voluntariamente, tampouco regredir.
O fallback é transparente e não interrompe cargas de trabalho, mas gera logs de aviso no apiserver, encorajando os administradores a migrarem proativamente.
Nenhuma alteração de configuração no kubelet ou no apiserver é necessária. A ativação é puramente uma mudança de RBAC, que depende da ação consciente das equipes.

O que muda para ferramentas e ecossistema

O Prometheus Operator e charts Helm equivalentes precisarão atualizar seus ClusterRole para solicitar apenas nodes/metrics, abandonando o superpoder de nodes/proxy. Essa simples troca reduz a superfície de ataque de todo o pipeline de monitoramento.
Admission controllers modernos — como Kyverno, OPA/Gatekeeper — ganham uma nova oportunidade de ouro: eles podem bloquear a criação de qualquer Role ou ClusterRole que utilize nodes/proxy sem justificativa explícita, forçando a migração de forma controlada.
Charts amplamente utilizados como kube-prometheus-stack, datadog-agent e newrelic-infrastructure devem publicar, nas próximas semanas, versões alinhadas às novas permissões. Manter-se atualizado aqui será sinônimo de postura segura.
Com a adoção ampla dos subrecursos, é plausível que o próprio nodes/proxy venha a ser depreciado para casos de monitoramento e observabilidade em uma futura versão LTS.

Riscos e limites que não podem ser ignorados

Nenhuma estratégia de segurança pode ser celebrada sem um olhar crítico. Três aspectos merecem atenção redobrada:

O fallback é uma armadilha real. Se as organizações simplesmente atualizarem para v1.36 e não ajustarem o RBAC, o risco RCE permanece exatamente o mesmo. A migração é manual e exige que cada ServiceAccount, Role e ClusterRole seja revisitado.
A funcionalidade cobre apenas a API do kubelet. Outros vetores de ataque — apiserver, etcd, engine de contêiner, redes — continuam exigindo controles complementares. A autorização granular não é uma bala de prata universal.
O risco residual é significativo. Enquanto houver uma única credencial com nodes/proxy GET, o caminho de RCE permanece aberto. A proteção plena só se concretiza quando o fallback nunca for invocado.

Passos práticos para migrar seus clusters com segurança

A transição não requer downtime, mas exige método rigoroso. Siga este roteiro:

Identifique todos os ServiceAccounts, Roles e ClusterRoles que concedem nodes/proxy no verbo GET. Um bom ponto de partida é vasculhar com:

kubectl get clusterrole,role -A -o yaml | grep "nodes/proxy"

Substitua cada ocorrência pela combinação adequada de subrecursos: nodes/metrics para métricas, nodes/stats para estatísticas, nodes/log para logs, e assim por diante. Seja conservador: adicione apenas o que o workload realmente consome.
Teste em um ambiente de staging primeiro. O fallback assegura que nenhum workload será quebrado, mas fique atento aos logs de aviso do apiserver. Eles são o semáforo amarelo antes da remoção definitiva.
Remova a permissão nodes/proxy somente após confirmar que todos os consumidores estão migrados. Esta é a etapa que efetivamente elimina a vulnerabilidade.
Blinde o futuro configurando admission controllers para bloquear novas tentativas de uso de nodes/proxy sem uma exceção documentada e aprovada.

O fim dos superpoderes genéricos

A promoção do KubeletFineGrainedAuthz a GA não é apenas mais uma feature no extenso changelog do Kubernetes. É o fechamento cirúrgico de uma vulnerabilidade estrutural que acompanhou a plataforma desde suas raízes.

A partir de agora, a observabilidade e o monitoramento podem operar com confiança zero em relação ao kubelet, sem sacrificar a visibilidade. Menos poderes implícitos, mais segurança explícita.

O horizonte aponta para um Kubernetes onde cada endpoint da API do kubelet terá seu próprio escopo RBAC, eliminando progressivamente as "super-permissões" genéricas que serviam de atalho para adversários. Espera-se que a depreciação completa do nodes/proxy para cenários de monitoramento se concretize já na próxima versão LTS.

A mensagem é inequívoca: migre agora, antes que o fallback se torne o vetor do próximo ataque. A janela de oportunidade defensiva está aberta, mas cabe aos operadores atravessá-la. A segurança no Kubernetes nunca foi tão granular — e a urgência de agir, tão real.

Revise hoje mesmo o RBAC dos seus clusters. Uma única permissão herdada pode ser a diferença entre contenção e comprometimento total. Comece pelo comando de auditoria e garanta que o nodes/proxy não tenha mais espaço na sua infraestrutura.