Datalab: os pequenos laboratórios que dão origem a grandes projetos
Os dados são o novo Eldorado dos negócios. É um fenômeno do qual todos, de GAFAMs e redes sociais a PMEs, estão cientes agora. Os dados podem ser uma fonte de inovação, receita e produtos e serviços aprimorados.
Daí o surgimento, nos últimos anos, dentro das organizações, de estruturas dedicadas a explorá-los. Mais ou menos avançadas, elas foram gradualmente integradas ao organograma existente. Várias delas podem coexistir em paralelo, assim como as tecnologias que exploram esses dados.
Como podemos fazer com que os recursos humanos e a infraestrutura trabalhem juntos de forma mais eficaz nesse tema central dos dados? Como podemos inovar e implementar novos aplicativos o mais rápido possível?
Esse é o objetivo de um laboratório interdisciplinar dedicado aos dados: o Datalab. Explicamos o que implica um projeto desse tipo, como ele pode ser realizado e quais empresas estão tirando proveito dele.
O que é um Datalab?
Os laboratórios estão na moda. Em um mundo em que a agilidade se tornou fundamental, eles trazem flexibilidade e capacidade de resposta às organizações. E fazem isso sem a necessidade de reformular a hierarquia ou o organograma.
Seu objetivo é incentivar a inovação, permitindo a experimentação.
Um laboratório pode ser definido como "uma estrutura que incentiva o surgimento de ideias disruptivas, isolando projetos incertos para que possam ser implementados sem perturbar a organização existente" (Olivier Laborde).
Esse conceito de laboratório assume muitas formas. É natural que ele tenha sido transposto para o campo da exploração de dados.
Atualmente, uma empresa pode ter muitos profissionais de dados. Eles incluem, entre outros, o diretor de dados (CDO), o cientista de dados e o cientista-chefe de dados, o analista de dados, o arquiteto e engenheiro de Big Data, o gerente de dados mestre, o gerente de business intelligence, o minerador de dados, o diretor de proteção de dados, o engenheiro de aprendizado de máquina...
Essa lista aponta imediatamente o problema. Todas essas funções não estão vinculadas ao mesmo departamento, não têm necessariamente o mesmo objetivo ou a mesma cultura. Elas não usam as mesmas ferramentas de software. Não estão em contato constante.
Além disso, outras funções geram, manipulam, usam ou se beneficiam dos dados. Marketing, por exemplo.
Como reunir todas essas habilidades e combinar seus conhecimentos em uma estrutura de dados ágil e eficiente? Criando um Datalab.
A criação de um Datalab também é uma oportunidade de integrar novas habilidades e talentos. Alguns projetos incluem uma grande porcentagem de novos recrutas desde o início.
O Datalab terá a vantagem de funcionar como uma start-up, ou uma incubadora, dentro da própria organização. Ele não substitui o que já existe, mas visa a aprimorá-lo em um contexto diferente.
Defina uma estratégia com antecedência
Mesmo que a ideia inicial seja incentivar a flexibilidade e a criatividade, é melhor criar um Datalab com certos pré-requisitos em mente.
Estrategicamente, se possível, os objetivos prioritários devem ser definidos. Essa é a principal tarefa da gerência. Mesmo que o objetivo do Datalab seja incentivar a fermentação intelectual e o surgimento de projetos criativos, é possível direcionar seus esforços. É melhor especificar desde o início se o seu objetivo é diversificar os negócios, melhorar o atendimento ao cliente, coletar novos dados, etc.
No entanto, o máximo de liberdade também pode gerar maior comprometimento e inovação disruptiva.
Tecnicamente, você provavelmente terá de lidar com a complexidade inerente ao gerenciamento de dados e ao Big Data. Em uma empresa de grande porte, pode haver vários "silos" independentes lidando com dados, por motivos históricos, geográficos ou técnicos. As tecnologias usadas para coletar, armazenar, processar e usar dados podem, portanto, ser múltiplas e redundantes e exigir adaptação.
Uma das vantagens de um Datalab é que ele pode incentivar a harmonização técnica, talvez até mesmo antecipadamente. O Datalab pode levar à criação de um Data Lake, se ele ainda não estiver em vigor. Além disso, como a qualidade e a validação dos dados são de suma importância, essa pode ser uma oportunidade para verificar esses pré-requisitos.
Do ponto de vista jurídico, também é necessário um trabalho aprofundado. Mas ele é sempre necessário quando se deseja usar dados em grande escala. A origem heterogênea dos dados significa que eles não foram coletados nos mesmos contextos, com os mesmos objetivos e, portanto, não necessariamente com as mesmas restrições legais iniciais. Essa é uma dificuldade clássica, que não deve ser subestimada desde o início.
Não negligencie os recursos humanos
Além desses três pilares a serem levados em conta, ainda há outra dificuldade. Ela é inerente à criação de uma estrutura multifuncional: é o fator humano.
De repente, você vai reunir, em uma entidade às vezes informal, funcionários que têm uma coisa em comum: dados. Mas eles também podem ser radicalmente diferentes. Nada os predestina a formar um grupo feliz de amigos unidos em torno de um objetivo comum.
No Datalab, você pode encontrar perfis tão diferentes quanto um profissional de marketing, um engenheiro de dados, um vendedor e um programador especializado em aprendizado de máquina. É disso que se trata um laboratório.
Portanto, pode ser uma boa ideia planejar algum trabalho preliminar, ou acompanhamento, com um consultor especializado em gerenciamento de mudanças.
Ainda mais porque pode haver resistência a essa mudança, o que é bastante lógico. Os funcionários podem estar mais inclinados a guardar suas ideias, habilidades e contribuições para si mesmos e usá-las em seu próprio departamento. Portanto, precisamos garantir que os resultados do Datalab sejam gratificantes para todos.
Um detalhe, mas não o único: as instalações
Como você verá nos exemplos a seguir, a maioria das empresas que montam um Datalab (e provavelmente outros tipos de laboratório) o fazem em instalações dedicadas1.
Há vários motivos para isso:
- É importante que as instalações reflitam a liberdade da organização. Elas devem ser abertas, iluminadas, flexíveis e divertidas, com um mínimo de restrições.
- Também pode ser importante que as instalações sejam interdisciplinares. Isso significa que elas não devem estar fisicamente ligadas a um serviço ou departamento (que teria precedência sobre os demais).
- O ideal é que as instalações escolhidas sejam completamente novas, projetadas para esse projeto, mesmo que isso obviamente não esteja ao alcance de todas as empresas.
Inspirando-se em histórias de sucesso: 3 exemplos de Datalabs
De acordo com Les Echos, dois terços das empresas do CAC 40 já têm um Datalab, portanto, é fácil e útil se interessar por eles, copiar seu modelo ou evitar cometer os mesmos erros.
Aqui estão alguns comentários de diversos setores.
Axa: uma seguradora no centro dos dados
O Data Innovation Lab2 da Axa foi projetado em torno de uma equipe de P&D de... 4 pessoas. Lançado com 15 funcionários, hoje conta com mais de 70, aos quais se somam cerca de trinta participantes externos ou pontuais.
Criado em 2014, um dos objetivos do Lab era criar apólices de seguro de automóveis cujo preço mudasse de acordo com o comportamento do motorista. Ele estabeleceu cinco objetivos de pesquisa: fraude, gerenciamento de sinistros, análise do comportamento do motorista para reduzir os prêmios para motoristas virtuosos, saúde conectada e marketing.
A Axa assinou um contrato com o Facebook em 2014, na época do lançamento. Como resultado, a seguradora não gerencia mais apenas seus próprios fluxos de dados, mas também dados externos com o Open Data.
Os projetos que saem desse laboratório são considerados pela Axa como "satélites ágeis", plataformas que são independentes da TI desde o início. Posteriormente, se forem sustentáveis e comprovarem seu ROI, poderão ser integrados ao sistema existente.
O projeto Datalab da AXA é altamente significativo, pois inclui uma dimensão de "criação de novos talentos" desde o início. A seguradora liberou um orçamento de 180 milhões de euros para treinar futuros funcionários. Isso levou à abertura de uma cadeira de "Estratégia digital e Big Data" na HEC Paris e outro curso de "Ciência de dados para o setor de seguros" na Polytechniques.
Por fim, para levar sua abordagem inovadora ao próximo nível, o Datalab também criou uma incubadora. A incubadora conta com o fundo de investimento AXA Strategic Ventures (ASV) para apoiar projetos promissores.
Um compromisso total com a transição digital. Assim, a seguradora está em condições de ajudar no surgimento de novos projetos, torná-los realidade e integrar funcionários treinados para essas tarefas. Uma obrigação.
A SNCF, uma empresa de dados que não sabia que estava lá
Você teria citado espontaneamente a SNCF como exemplo de um Datalab? Provavelmente não, mas essa criação é perfeitamente justificada.
Foi em 29 de agosto de 2018 que os responsáveis pelas diversas entidades do grupo SNCF apresentaram a nova etapa da estratégia digital: construir a empresa do futuro graças aos dados3.
A empresa histórica tem uma riqueza de dados. Só precisamos estar cientes disso e aproveitá-los ao máximo. Nossos ativos de dados incluem dados históricos, como horários, dados de serviço de 15.000 trens, 30.000 quilômetros de trilhos e 3.000 estações.
Mas, mais recentemente, também inclui os dados que os clientes nos confiam por meio dos serviços oferecidos nas estações e a experiência a bordo (conectividade 3G/4G, Wifi, etc.). O objetivo é usar todos esses dados para apoiar a tomada de decisões, o gerenciamento de negócios, o desempenho e a segurança.
Isso levou à criação de um Datalab. Aqui, o objetivo não é tanto inovar, mas dar a todos acesso aos dados. O laboratório é um veículo para o compartilhamento de dados. Potencialmente, qualquer agente pode se conectar ao DataLab e acessar conjuntos de dados . A possível criação de valor virá da manipulação pelos agentes.
O laboratório está em operação desde 2018. Em 2019, ele tinha 350 conjuntos de dados referenciados.
Deve-se observar que, desde 2010, já existem Minilabs desenvolvidos com a École des Mines Paristech. Alguns desses Minilabs também são dedicados ao uso de dados. Um deles, por exemplo, tem como objetivo antecipar o impacto das mudanças climáticas nas redes ferroviárias4.
BNP: usando a Inteligência Artificial para inovar
Além de ser 100% dedicado aos dados, o Datalab também pode ser um acelerador para a Inteligência Artificial. E, em particular, para o desenvolvimento de projetos de aprendizado de máquina.
Essa é a abordagem adotada pelo BNP. No contexto específico do mercado bancário, foi a necessidade de confidencialidade que levou o Grupo a trazer essa estrutura para dentro de casa. Isso significa que a pesquisa, a manipulação de dados e a criação de novos aplicativos podem ser realizadas com total segurança.
Entre os projetos que saíram desse laboratório está um aplicativo de tradução surpreendente chamado "Translate". Inicialmente, eram necessários apenas três cientistas de dados para desenvolver a PoC (Prova de Conceito). Depois, foi uma equipe reforçada de aprendizado de máquina que ajudou a finalizá-lo. Essa nova ferramenta, projetada para documentação profissional (contratos, relatórios, documentos técnicos etc.), rapidamente se tornou uma das favoritas na empresa.
Pelo menos uma dúzia de outros projetos já foram lançados. Entre eles, um sistema de análise automática de contratos, um mecanismo de busca, um chatbot, uma ferramenta de análise de emoções, análise de imagens e reconhecimento de caracteres.
O BNP não esconde sua ambição, por meio desse Datalab, de adquirir e desenvolver uma vasta experiência em campos relacionados à IA. Isso permitirá que ele se posicione como um participante confiável nesse setor no futuro.
Pontos importantes a serem lembrados
- Um Datalab é uma estrutura dedicada à inovação em torno de dados.
- Seu objetivo é reunir uma ampla variedade de recursos humanos e infraestruturas.
- Ele pode ser uma estrutura transversal ou dar origem a uma criação mais integrada no organograma.
- Foi adotado por um grande número de empresas do CAC 40.
- Pode ser estendida a áreas relacionadas, como a Inteligência Artificial.
1. https://dataanalyticspost.com/faut-il-un-datalab-pour-innover-dans-la-data/ 2. https://octopeek.com/fr/blog-bigdata-datascience/big-data-axa-5-ans-de-dispositifs-strategiques/
3. https://www.digital.sncf.com/actualites/la-donnee-nouvelle-etape-de-la-transformation-de-sncf 4. https://www.digital.sncf.com/actualites/changement-climatique-utiliser-la-data-pour-anticiper-les-impacts-sur-le-reseau