06 Mai 2026 5 min de leitura

Azure Cosmos DB Conf 2026: Escalar Bancos de Dados é Design, Não Throughput – Como Reduzir Custos em 60%

Photo by Growtika on Unsplash

Na Azure Cosmos DB Conf 2026, engenheiros da OpenAI, Vercel e Walmart expuseram uma verdade inconveniente: adicionar mais throughput é apenas um analgésico. A cura real está em um design de dados que entende como cada query respira.

A falácia do throughput infinito

O maior erro ao escalar um banco de dados na nuvem é acreditar que o problema é de throughput. Engenheiros de produção foram categóricos: falhas de escala são quase sempre falhas de design.

Casos reais mostraram times operando com 100% de utilização de RU, enfrentando throttling constante. Após redesigns cirúrgicos de partition keys e otimização de queries, caíram para 20–35% de utilização — sem provisionar uma única RU extra.

O throughput existente era suficiente. Ele só estava sendo desperdiçado.

Não se trata de adicionar mais RUs. Trata-se de entender como seus dados são acessados e modelá-los para que a capacidade provisionada seja suficiente.

O problema real: partições quentes e queries órfãs

A mecânica do Azure Cosmos DB é enganosamente simples: você provisiona throughput que é distribuído igualmente entre partições físicas. O problema explode quando uma única partição concentra a maior parte da carga.

A anatomia de uma hot partition

O time de Anurag Dutt, engenheiro sênior da Microsoft, demonstrou isso ao vivo. O sistema deles estava sufocando no limite de RU, mas a causa raiz era uma partition key que jogava todas as escritas na mesma partição lógica.

A solução foi adicionar uma dimensão temporal à chave: transformar userId em userId_dateBucket. A carga se distribuiu uniformemente e o throttling desapareceu — sem custo adicional.

"Antes de escalar, pergunte-se: todas as minhas escritas estão indo para o mesmo lugar? Se sim, você não tem um problema de throughput — você tem um problema de design."

Dashboard do Azure Cosmos DB mostrando distribuição de partições e métricas de otimização de queries

O preço oculto das cross-partition queries

Consultas que cruzam partições custam 100 a 400 RUs. Consultas filtradas pela partition key custam 1 a 4 RUs. A diferença é brutal: duas ordens de magnitude.

Durante a conferência, múltiplos casos mostraram que adicionar o partitionKey na cláusula WHERE reduziu o custo em mais de 60%. A otimização do modelo de dados é a alavanca de custo mais poderosa que existe no Azure Cosmos DB.

Resumo prático: Antes de escalar, audite suas queries. Se elas não estão usando a partition key, você está queimando dinheiro em cada requisição.

Novos padrões de design que estão redefinindo o jogo

Partition keys compostas: o fim das partições solitárias

A lição mais prática da conferência foi o uso de partition keys compostas. Em vez de depender de um único campo, combine múltiplas dimensões para distribuir a carga:

userId + timestampBucket (ex: dia/hora) — evita que um usuário pesado aqueça uma partição
tenantId + entityType — isola cargas de diferentes entidades no mesmo tenant
region + userId + date — adiciona localidade geográfica ao particionamento

O Azure Cosmos DB agora suporta hierarchical partition keys com até 3 níveis, tornando esse padrão ainda mais natural.

Observação: Chaves hierárquicas permitem que você faça queries eficientes em qualquer nível da hierarquia, sem precisar do nível mais granular.

Change Feed: arquitetura orientada a eventos sem dual-writes

O Azure Cosmos DB Change Feed foi apresentado como mecanismo central para event sourcing e transactional outbox. Em vez de fazer dual-writes — escrever no banco e depois publicar em uma fila — use o Change Feed para capturar mudanças como eventos ordenados por partição.

O Walmart apresentou um caso onde migraram de dual-writes para Change Feed, eliminando inconsistências de dados e reduzindo a latência de replicação em 40%.

Vector Search e cargas de AI: convergência sob a mesma chave

O anúncio mais impactante: vector search e semantic search agora convergem no mesmo engine de query. Isso permite que workloads de AI agent memory — sliding window, memory tiers hierárquicos, grafos de entidades — sejam armazenadas na mesma partição que os dados operacionais.

Farah Abdou, lead engineer da OpenAI, demonstrou como unificar dados operacionais e vetores sob a mesma partition key reduziu custos em 73% e melhorou latência em 65%.

A grande virada: Não separe o banco operacional do banco vetorial. Tudo vive no Cosmos DB, na mesma partição, com o mesmo schema. A partição se torna a unidade atômica de dados + contexto + memória.

O impacto no mercado: o fim da era "jogue hardware no problema"

Redução de custos sem escalar

Empresas como a Next (plataforma de e-commerce) reduziram seus gastos com Azure Cosmos DB em 60% apenas corrigindo designs ruins antes de pensar em escalar. O padrão é consistente:

Redesenhe partition keys → Reduza RU utilization
Otimize queries → Reduza custo por operação
Adote Change Feed → Elimine dual-writes caros e frágeis

Isso transforma o custo de cloud databases de imprevisível para previsível e controlável.

AI agent memory como workload first-class

O fato de que AI agent memory está emergindo como um workload principal para bancos de dados é uma mudança de paradigma. Em vez de usar bancos vetoriais separados, as empresas estão consolidando tudo no Azure Cosmos DB.

Isso cria uma demanda massiva por expertise em design de partition keys para dados híbridos — vetores, JSON e dados operacionais coexistindo na mesma partição. A Microsoft agora oferece certificação DP-420 gratuita através do Skills Challenge para acelerar essa capacitação.

A cultura do design consciente de custos

Uma tendência sutil mas poderosa: desenvolvedores começando a ver custos de RU por query durante a codificação. Ferramentas como o Cosmos DB Emulator e o Data Explorer agora mostram o custo estimado em tempo real. Isso está transformando a cultura de desenvolvimento — design consciente de custos está deixando de ser residual para se tornar central na engenharia de software.

Riscos e limitações: onde o design não basta

A complexidade do retrofitting

Redesenhar partition keys em sistemas existentes é complexo e arriscado. Migrações ao vivo exigem estratégias de dual-writes ou offline migration. Para sistemas legados, o custo da migração pode superar o benefício imediato.

Vendor lock-in profundo

Otimizar profundamente para Azure Cosmos DB — usando Change Feed, hierarchical partition keys, vetores — cria dependência forte do ecossistema. Migrar para outro NoSQL exigiria reescrever grande parte da lógica de dados.

Nem todo problema é design

Há workloads que genuinamente precisam de mais throughput. Processamento de IoT em tempo real com milhões de dispositivos, ou sessões de e-commerce em Black Friday, podem exigir provisionamento extra mesmo com design perfeito. A abordagem de design-first é necessária, mas não suficiente para todos os cenários.

Abordagem	Vantagem	Risco
Engine Swap	Rápido, sem mudança de schema	Não resolve problemas de design
Schema Redesign	Resolve gargalos na raiz	Mais lento, exige análise de access patterns

Ambas as abordagens exigem análise de padrões de acesso. Sem isso, qualquer migração é um tiro no escuro.

Visão final: o design de dados como disciplina de engenharia

A Azure Cosmos DB Conf 2026 cristalizou uma verdade que vinha se formando: bancos de dados não escalam porque você provisiona mais capacidade — eles escalam porque você entende como os dados são consumidos e os modela para isso.

O futuro não será sobre provisionamento elástico automático, embora isso ajude. Será sobre design inteligente:

Ferramentas de IA que sugerem partition keys ótimas baseadas em padrões de acesso históricos
Schemas que evoluem dinamicamente conforme os patterns de query mudam
Unificação total de workloads operacionais e de AI sob a mesma partição lógica

O desenvolvedor que dominar design de dados como engineering discipline — e não como arte obscura — será o arquiteto mais valioso da próxima década.

"A pergunta não é 'quanto RU você tem?'. A pergunta é: 'Seus dados estão onde suas queries precisam que eles estejam?'"

Se a resposta for não, adicionar mais RUs é apenas adiar o inevitável.

O caminho prático: Comece auditando suas queries mais caras. Identifique as que não usam partition key. Redesenhe uma chave composta. Meça a diferença. Depois, explore Change Feed para eliminar dual-writes. Por fim, investigue se suas cargas de AI podem ser consolidadas na mesma partição. Design primeiro. Escale depois.