Revisando a aula sobre Viés X Variância que irei dar no curso de Data Science da Tera esta semana, pensei em compartilhar algumas coisas por aqui. Um modelo é uma extrapolação do mundo real, e existe um trade-off entre torná-lo mais complexo (por exemplo incluindo mais variáveis), reduzindo seu erro. No entanto, essa complexidade faz com que o modelo fique ajustado apenas aos dados de treino e varie muito com os dados de teste e em produção. Existem diversas alternativas para reduzir esses efeitos, quando se está utilizando regressão, podemos partir para Lasso, Ridge ou até mesmo Elastic-Net. Quem sabe falo sobre essas técnicas em uma próxima publicação...
Thiago Buselato MaurÃcio