search A mídia que reinventa a empresa

Como tornar anônimos ou pseudônimos os dados abertos?

Como tornar anônimos ou pseudônimos os dados abertos?

Por Jérôme Chagnoux

Em 28 de outubro de 2024

Há alguns meses, tudo o que você tem ouvido falar é sobre o RGPD, o Regulamento Geral de Proteção de Dados da União Europeia. Todos estão perguntando como a sua empresa vai se adequar... sem realmente entender do que se trata. Os fornecedores e consultores estão se tornando cada vez mais criativos ao oferecer a você a chance de participar de eventos sobre o assunto... mas tudo o que eles fazem é apenas superficial.

Quando se trata de soluções de segurança de TI, você já implementou a criptografia e controlou cuidadosamente o acesso ao seu sistema de informações. Agora você está analisando a anonimização, que aparece repetidamente em suas discussões, juntamente com a pseudonimização: como fazer isso? Como ela deve ser organizada?

RESUMO :

Uma conscientização tardia

É surpreendente que tenhamos esperado o advento de uma restrição regulatória importante para enfatizar novamente uma disciplina que existe há tanto tempo.

Portanto, é legítimo perguntar "Por quê?

"Por que esperamos tanto tempo?" "Por que isso ainda não foi feito?


... é tão óbvio para todos os clientes que não se deve "brincar" com suas informações pessoais.

Há muitas explicações, mas, no final, elas só interessam àqueles que vivem no passado.

Então, vamos analisar o cenário atual: as empresas estão compartilhando dados de produção (os dados de que precisam para seus negócios diários) para atender a uma variedade de necessidades:

  • Copiar toda a execução da produção para permitir que os desenvolvedores e administradores testem upgrades, patches e atualizações de versão,

  • Aumentar a agilidade e a competitividade, desenvolvendo novas funcionalidades e modelos analíticos em um ambiente o mais próximo possível da produção,

  • Analisar tendências (consumo, comportamento, pesquisa médica etc.) compartilhando dados com consultores e pesquisadores para que eles possam aplicar modelos estatísticos ou de aprendizado de máquina.

Como resultado, bilhões de dados de clientes (não importa quão sensíveis sejam) estão deixando os ambientes de produção desprotegidos.

O RGPD, um acelerador para a responsabilização de todos os participantes

Estudos recentes realizados por analistas sobre a confidencialidade dos dados tendem a mostrar que as empresas não têm como saber se os dados que saem de um ambiente de produção foram comprometidos.

Acho que a pergunta "Por quê?" se torna óbvia: não obstante quaisquer restrições regulamentares, a pessoa cujos dados pessoais estão sendo usados sem saber se serão compartilhados e comprometidos é você, sou eu, são nossos filhos...

A proteção da privacidade é um direito fundamental garantido pela Declaração Universal dos Direitos Humanos.

Todos nós devemos implementar esse mecanismo para garantir que nossos dados sejam usados para fins justificados e limitados.

É por isso que todos nós, como diretores de empresas e gerentes de sistemas de TI, devemos implementar esse mecanismo para garantir que nossos dados sejam usados para fins justificados e limitados.

Identificação dos meios corretos de proteção

O GDPR não é a resposta para a pergunta "Por quê?", mas pode ser o início da resposta para a pergunta "Como?

Em primeiro lugar, a estrutura regulatória e, acima de tudo, as penalidades financeiras e outras multas associadas a ela são uma alavanca para financiar a implementação do projeto de anonimização.

A elaboração de um registro de operações de processamento de dados, conforme exigido pelo GDPR, é uma boa maneira de identificar a localização exata dos dados pessoais no sistema de informações... para que você possa identificar rapidamente o que precisa ser anonimizado.

Em segundo lugar, o Regulamento nos incentiva a pensar, em primeiro lugar, na necessidade de processar dados pessoais e defende o princípio da minimização de dados: "o que é necessário em relação às finalidades para as quais os dados são processados".

Por exemplo:

É realmente necessário ter todos os dados de produção nos ambientes de desenvolvimento, qualificação ou treinamento? Em última análise, não é muito caro e muito arriscado?


A amostragem de dados é uma segunda resposta: reduzir a superfície de risco selecionando (de forma inteligente) um conjunto representativo de dados, que pode então ser anonimizado de acordo com as necessidades da empresa.

O regulamento também propõe mecanismos simplificados, como a pseudonimização, que consiste na substituição de dados pessoais por um pseudônimo, mascarando efetivamente o vínculo com o indivíduo original (desde que o vínculo entre o pseudônimo e o indivíduo não seja trivial ou preservado).

Como a anonimização de dados pode ser implementada?

Dito isso, nenhum desses caminhos dá às empresas qualquer orientação sobre como elas devem se organizar. Esse pode muito bem ser o nó górdio da anonimização:

  • "Devo tornar anônimo aplicativo por aplicativo?"
  • "O que deve ser feito com os aplicativos que compartilham os dados pessoais do mesmo indivíduo?
  • "Qual estrutura organizacional atenderá aos requisitos comerciais?
  • "Perderei agilidade na evolução do sistema de informações?

Claramente, a organização é a pedra fundamental do projeto de anonimização e determina seu sucesso.

É preciso implementar um "serviço de anonimização industrializado" capaz de atender às necessidades de todas as equipes de TI, que serão as mais afetadas:

  • ter a capacidade de lidar com todas as tecnologias (respeitando suas regras de licenciamento e suporte, é claro);

  • ofereça amostragem inteligente e de alto desempenho: você não olha apenas para as primeiras 1.000 linhas... você procura um conjunto representativo de dados em uma fonte de dados e em repositórios subsidiários (para garantir a integridade referencial entre aplicativos);

  • garantir níveis de serviço de alto desempenho: oferecer anonimização sob demanda ou automatizada;

  • fornecer uma biblioteca de formatos completos de anonimização (substituição aleatória, exclusão de dados, reescrita etc.).

Esse serviço de anonimização trará mudanças positivas nos métodos de trabalho das equipes de TI, com impacto mínimo no trabalho diário.

Escolhendo as ferramentas certas

Como você deve ter percebido, esse assunto não é, em última análise, impulsionado pela tecnologia. Mas e quanto às ferramentas?

A literatura o ajudará a entender os vários algoritmos de anonimização, como "k-anonymity", "l-diversity", "t-proximity" ou "differential confidentiality", cuja eficácia e nível de proteção podem ser avaliados...

Tantas ferramentas disponíveis para especialistas implementarem a anonimização certa para o conjunto certo de dados.

Em vez disso, gostaria de me concentrar em uma solução de anonimização industrial que garanta :

  • conectividade com várias fontes e vários alvos, de modo que se torne a ferramenta central e unificadora da empresa, garantindo a anonimização que respeita a integridade referencial entre aplicativos;

  • um assistente que permite a construção de fluxos de trabalho de anonimização adaptados ao conjunto de dados (descoberta de dados confidenciais na fonte, proposta de algoritmos adequados, visualização dos resultados, etc.);

  • a capacidade de automatizar cadeias de anonimização para garantir níveis de serviço otimizados (processamento noturno, atualização do conjunto de dados sob demanda, etc.);

  • facilidade de uso, para que a equipe responsável pelo serviço de anonimização possa aumentar suas habilidades e capacidade de forma rápida e fácil.

Obviamente, a solução deve garantir que ela própria esteja em conformidade com as práticas recomendadas do RGPD: criptografia, controle de acesso para contas privilegiadas, supervisão... porque a infraestrutura de anonimização estará no cruzamento dos fluxos de dados pessoais.


A iniciativa "Data Masking Factory " da Oracle atende a esses requisitos e se tornou uma solução agnóstica e de alto desempenho para fornecer serviços de anonimização.

Dados pessoais não são motivo de piada

2018 é o ano da mudança de paradigma: é a era da percepção de que nossos próprios dados pessoais são o que as empresas tratam com muita leveza.

Todos, em seu próprio nível, devem se integrar e entender que o jogo com os dados acabou.

O RGPD é um lembrete de boas práticas, das quais a anonimização desempenha um papel fundamental.

Mais do que apenas um projeto técnico, precisamos de uma organização e ferramentas eficazes para fornecer aos usuários corporativos um serviço de anonimização de alto desempenho.

Artigo traduzido do francês