Data Science & Data Art
Onde a “ARTE” contribui com a “CIÊNCIA” no campo que é hoje uma das principais vertentes do desenvolvimento tecnológico e dos negócios?
Este artigo é útil somente para aqueles que já trabalharam com DADOS… ou seja, praticamente todos nós! A “Data Science”, como o próprio nome diz, é uma ciência que se apoia em diferentes disciplinas para extrair conhecimentos e “insights” a partir de dados, matéria-prima cada vez mais abundante e barata de ser armazenada, processada e analisada.
A ciência de dados envolve conceitos de matemática, mineração, big data, exploratory data analysis, estatística, data visualization, ciência da computação, machine learning, deep learning etc. Tudo isso para que possamos compreender melhor a realidade, visualizar a mesma sob diferentes perspectivas (sem vícios e/ou influências) e avançar em um velho desafio: PREVER (a modelagem preditiva hoje nos auxilia a prever resultados, sejam eles no futuro ou mesmo no passado). Passado? Sim, você pode extrair de uma base de dados modelos preditivos que contribuem com a investigação de acidentes, problemas de produção e logística de causas ainda desconhecidas etc.
Em minhas experiências pessoais, geralmente, projetos que envolvem inovação, no sentido de transformar mais “radicalmente” a forma com que um determinado processo é realizado, demandam justificativas que passam por modelos preditivos, a fim da empresa visualizar o quanto já perdeu no passado e o quanto ainda perderá no futuro se não seguir o que o modelo preditivo está dizendo. Denominamos isso de “PERDA INVISÍVEL”, que só é possível ser claramente visualizada por meio de um bom trabalho de DATA SCIENCE.
E a ARTE?
Em 33 anos, desenvolvendo mais de 300 projetos pude observar que, invariavelmente, os mesmos iniciam com DADOS e com equipes/pessoas completamente diferentes. Assim, dá para assegurar hoje que a ciência de dados que alcança as melhores soluções integra: pesquisas empíricas e científicas + ciência computacional (que hoje navega em um “oceano” de dados que cresce, cada vez mais, exponencialmente).
Mas observe que eu citei no parágrafo anterior “Pesquisas Empíricas” como um dos componentes para se alcançar as melhores soluções. Elas compõem o conjunto de ações para coleta de dados e/ou conhecimentos por meio da OBSERVAÇÃO e EXPERIÊNCIA.
Assim, por exemplo: se você está desenvolvendo um projeto de manufatura e/ou logística e deseja obter dados relevantes, sem preconceitos, escute atentamente aqueles mais experientes que já estão há 10, 20, 30 anos observando aquela determinada operação. Certamente eles terão dados empíricos que podem gerar “insights” interessantes para o cientista de dados.
Aliás, não é por acaso que um dos lemas da IMAM é: “A ARTE e a CIÊNCIA do Fluxo de Materiais”…
A ARTE deriva do termo latino “ARS” (técnica ou habilidade) e é desenvolvida de diversas formas como pintura, escultura, música, dança, cinema… e por que não em suas atividades profissionais? Sim, o processo criativo também é muitas vezes disparado (“insights”) a partir de conhecimentos empíricos adquiridos por observação e experiências pessoais. E são justamente estes “insights”, que muitas vezes nem o próprio profissional sabe explicar, que acabam sendo os precursores de grandes inovações (vide Youtube, Facebook etc.).
Obviamente, hoje, a boa CIÊNCIA já integra a ARTE em seus estudos, mas o fato da mesma não estar tão explícita para os cientistas de dados, principalmente para os jovens, vale o destaque da importância de se respeitar o conhecimento empírico dos mais experientes.
Tipos de Problemas/Oportunidades com Dados
Cada tipo de problema tem uma demanda maior ou menor no que diz respeito à ARTE (empirismo, criatividade, “insights”…) e à CIÊNCIA (métodos quantitativos, estatística, modelos…). Em artigos futuros detalharemos cada problema…
Que venham muito mais cientistas de dados para avançarmos em soluções inteligentes, criativas, inovativas, visuais, disruptivas…
“FALAR BEM COM DADOS É UMA CIÊNCIA E UMA ARTE…”
Eduardo BANZATO, diretor do Grupo IMAM
Sucesso e vamos em frente…
Saiba mais no curso: Data Science Para Supply Chain e Logística
Eduardo BANZATO