Entra
ano, sai ano e temos milhares de previsões para o novo ano que
nasce. Mesmo que façamos previsões baseados em estatísticas, as
mesmas são falhas, vou explicar o porquê disto. Quando se tem dados
como altura, peso, notas, em uma amostra com milhões de pessoas, o
que acontece é que quando temos extremos como nota muito alta,
alturas e pesos acima da média, estes extremos em uma amostragem
grande, fazem a média subir muito pouco. Diferente de aplicações
financeiras, que por maior controle que se tenha do comportamento de
mercado, de uma hora para outra você pode ganhar ou até perder
milhões. Este tipo de comportamento não vai acontecer em um
levantamento de altura média da população, por que você não terá
um indivíduo com uma altura muito acima de 2,5 metros. Como resolver
este problema que a estatística falha? Ciência de dados. Para
compreender melhor a ciência de dados, vamos escrever sobre previsão
do tempo que é dificílimo prever pois temos um numero muito grande
de variáveis. Imagine que você tem uma previsão baseada em
estatísticas dos últimos 10 anos onde em momento algum chove no dia
11 de março na cidade de Curitiba. Uma estação meteorológica que
monitora 24 horas por dia os céus do Brasil percebeu em tempo real
que uma frente fria está entrando no sul do nosso país, e junto
com ela vem trazendo chuva e alagando por onde passa, e no dia 11 de
março em Curitiba chove. O monitoramento gerou “dados” que
abasteceu um base de dados que a ciência de dados tratou e gerou uma
previsão mais segura. Não estou relatando que estatística não
ajuda, e sim que o monitoramento das informações corretas geram
informações mais seguras.
Grato,
e
um Feliz Ano Novo!