Governança de dados sem tickets: Snowflake Cortex Code transforma SQL em linguagem natural
Imagine um analista de compliance abrindo um ticket para auditoria de acesso. Três dias depois, um engenheiro de dados executa uma consulta SQL, exporta um CSV e entrega um relatório já desatualizado. Agora multiplique esse gargalo por cinco domínios de governança. Essa é a realidade que o Snowflake Cortex Code Data Governance Skills promete eliminar — substituindo filas de espera por prompts em linguagem natural e resultados imediatos.
O que aconteceu
Por meio de um artigo técnico detalhado de Satish Kumar, especialista Snowflake, a plataforma apresentou as Data Governance Skills dentro do Cortex Code. Trata-se de um conjunto de capacidades que permite realizar tarefas fundamentais de governança de dados — classificação de dados sensíveis, geração de políticas de proteção, monitoramento de qualidade, análise de linhagem e auditoria de acesso — utilizando prompts em linguagem natural.
Diferente de soluções que apenas encapsulam consultas SQL pré-definidas, as Skills usam padrões verificados e testados contra casos reais de uso. As políticas geradas já saem com as funções corretas, evitando anti-patterns comuns que podem comprometer a segurança.
O que há de novo
A novidade real não é apenas o uso de linguagem natural — outras ferramentas já oferecem interfaces conversacionais. O que diferencia este lançamento são três aspectos:
- Integração nativa com cinco domínios: classificação, proteção, qualidade, linhagem e auditoria em uma única interface, sem precisar saltar entre ferramentas.
- Padrões de consulta verificados: as políticas geradas usam
IS_ROLE_IN_SESSION()em vez deCURRENT_ROLE(), corrigindo um erro comum que falha ao verificar a hierarquia completa de papéis. Além disso, incluem funções memoizáveis para reduzir o custo de avaliação das políticas em tempo de consulta. - Workflow assess-to-remediate: o ciclo completo — estabelecer baseline, classificar, proteger, monitorar e medir — cabe em uma única sessão do Cortex Code. O destaque é o governance maturity score, uma métrica composta que avalia três pilares (classificação, proteção e monitoramento) em escala de 0 a 5, calculada a partir de dados ao vivo do ACCOUNT_USAGE.
Por que isso importa
O impacto prático é imediato para qualquer organização que lida com dados regulados ou busca melhorar sua postura de governança. Ao eliminar a dependência de engenheiros para tarefas rotineiras, o Cortex Code democratiza o acesso à governança:
- Data stewards podem classificar dados e aplicar políticas sem precisar entender o schema do ACCOUNT_USAGE.
- Analistas de compliance executam auditorias GDPR, verificam linhagem e geram relatórios sob demanda — sem abrir tickets.
- Engenheiros de dados usam a análise de impacto de linhagem antes de cada mudança de schema, evitando incidentes de produção.
O resultado? Ciclos de compliance que levavam dias passam a ser concluídos em minutos. A governança deixa de ser um projeto pontual e se torna um processo contínuo e mensurável.
“O uso de linguagem natural como interface para infraestrutura de dados é uma tendência que deve se acelerar. A Snowflake está apostando que o futuro do dado não é só analítico, mas também conversacional e governado por padrão.”
A leitura técnica
Por baixo dos panos, as Data Governance Skills operam sobre o Snowflake Horizon Catalog, que mantém metadados de governança nativos — tags de classificação, políticas de mascaramento, métricas de qualidade e linhagem — sempre atualizados e executáveis em tempo de consulta.
Os cinco domínios técnicos
- Classificação de dados sensíveis: descobre PII, PHI e PCI usando categorias built-in, com auto-tagging para novos dados. Permite criar classificadores personalizados para padrões específicos, como IDs de produtos.
- Políticas de proteção: gera masking policies, row access policies, projection policies e aggregation policies com templates de compliance (HIPAA, PCI-DSS, GDPR, CCPA, SOX, FERPA). As políticas geradas usam
IS_ROLE_IN_SESSION()por padrão, garantindo verificação correta da hierarquia de papéis. - Monitoramento de qualidade: analisa resultados de Data Metric Functions (DMFs) para gerar health scores por schema, detecção de regressões e alertas automatizados por email ou webhook.
- Análise de linhagem: fornece impacto de mudanças com scoring de severidade (CRITICAL/MODERATE/LOW), trust scores por dataset e mapeamento de dependências em nível de coluna.
- Auditoria de acesso e governança geral: consulta quem acessou o quê e quando, análise de hierarquia de papéis, detecção de escalada de privilégios e geração de relatórios de compliance.
O governance maturity score na prática
O ponto mais acionável do artigo é a automação do maturity score. O código fornecido inclui uma stored procedure (COMPUTE_MATURITY_SCORE) que calcula os três pilares a partir do ACCOUNT_USAGE e persiste o resultado em uma tabela histórica, acionada mensalmente por uma Task agendada.
A lógica é direta: o pilar de classificação mede a proporção de databases com perfis de classificação; o de proteção mede a proporção de colunas sensíveis cobertas por masking policies; o de monitoramento mede a proporção de tabelas base cobertas por políticas ou DMFs. Cada pilar é normalizado para 0–5, e a média simples forma o overall score.
Automação proativa: em vez de auditorias pontuais, você tem um histórico mensal que pode ser apresentado à liderança como evidência de melhoria contínua.
A leitura de mercado
O movimento da Snowflake com as Data Governance Skills pressiona diretamente concorrentes como Databricks (Unity Catalog) e Google BigQuery a oferecerem funcionalidades similares de governança por linguagem natural. Mais importante, reduz a barreira de entrada para práticas de governança em organizações de médio porte que antes dependiam de consultorias caras ou engenheiros especializados.
Para empresas que já estão no ecossistema Snowflake, o recurso pode acelerar a conformidade com regulamentações como GDPR, HIPAA e PCI-DSS, automatizando auditorias e relatórios — e reduzindo custos operacionais. O governance maturity score, em particular, fornece uma métrica quantitativa para justificar investimentos contínuos em governança.
Por outro lado, a funcionalidade cria uma dependência maior da plataforma para funções críticas. Se a governança se torna nativa e fluida dentro do Snowflake, migrar para outro data warehouse pode significar reconstruir todo o framework de governança — o que aumenta o vendor lock-in.
Riscos, limites e pontos de atenção
É essencial considerar que o artigo que deu origem a este texto é de autoria de um especialista individual e não representa documentação oficial da Snowflake. O próprio autor inclui um disclaimer: as opiniões são próprias, algumas capacidades podem estar em preview ou com disponibilidade regional restrita.
Pontos de atenção:
- Disponibilidade: funcionalidades como criação de classificadores personalizados podem não estar geralmente disponíveis em todas as regiões ou tiers (Enterprise, Business Critical).
- Precisão do maturity score: o próprio artigo o descreve como “direcional, não uma métrica precisa”. Um score alto não significa que todos os riscos foram mitigados.
- Dependência de permissões: a implementação requer acesso a ACCOUNT_USAGE, GOVERNANCE_VIEWER, SECURITY_VIEWER e outras roles que podem não estar disponíveis em todas as contas.
- Documentação oficial: antes de implementar em produção, consulte a documentação oficial da Snowflake para validar a sintaxe, a disponibilidade e os pré-requisitos exatos.
O que isso sinaliza daqui para frente
As Data Governance Skills do Cortex Code apontam para uma direção clara: a governança de dados está caminhando para o autosserviço. Em vez de ser um gargalo gerenciado por poucos especialistas, ela se torna uma capacidade distribuída que qualquer papel de dados pode exercitar sob demanda.
O uso de linguagem natural como interface para infraestrutura de dados é uma tendência que deve se acelerar. Se a governança pode ser feita com prompts, o mesmo vale para outras áreas — observabilidade, orquestração, até mesmo modelagem. A Snowflake está apostando que o futuro do dado não é só analítico, mas também conversacional e governado por padrão.
Para equipes de dados, o recado é claro: comece a medir. Execute o COMPUTE_MATURITY_SCORE hoje, estabeleça seu baseline e acompanhe a evolução mês a mês. O número que você obtiver agora — seja ele alto ou baixo — é o ponto de partida para uma governança que não precisa mais de tickets para existir.
Resumo prático:
O Snowflake Cortex Code Data Governance Skills eliminam a necessidade de tickets e SQL especializado para tarefas de governança. Com prompts em linguagem natural, qualquer profissional de dados pode classificar, proteger, monitorar, auditar e medir a maturidade da governança — em minutos, não dias. O workflow assess-to-remediate, integrado a domínios como classificação, proteção e monitoramento, permite um ciclo contínuo de melhoria, com um maturity score automatizado que transforma governança reativa em proativa.
Na Metatron Omni, acreditamos que governança de dados não deve ser um gargalo. O movimento da Snowflake reforça nossa visão de que o futuro da gestão de dados é autosserviço, inteligente e conversacional. Quer explorar como aplicar esse paradigma na sua organização? Vamos conversar.