Em breve no Tableau: mais poder, simplicidade e flexibilidade preditiva
Ficamos entusiasmados em lançar funções de modelagem preditiva em 2020.3, capacitando os usuários do Tableau com funções estatísticas preditivas acessíveis a partir da interface de cálculo de tabela nativa do Tableau.
Colocamos análises preditivas poderosas nas mãos dos usuários de negócios, mantendo-os no fluxo de trabalho com seus dados. Os usuários podem construir modelos estatísticos rapidamente e iterar com base na qualidade de predição, prever valores para dados ausentes e entender os relacionamentos em seus dados.
No entanto, sabíamos que um caso de uso significativo ainda era desafiador. Não surpreendendo ninguém, um caso de uso chave para modelagem preditiva é gerar previsões para datas futuras. Embora você possa fazer isso em 2020.3 com alguns cálculos complicados, certamente não é fácil.
Também sabíamos que a regressão linear, especificamente os mínimos quadrados ordinários, nem sempre será o melhor modelo preditivo para muitos conjuntos de dados e situações.
Embora seja amplamente usado e simples de entender, existem outros modelos de regressão que são mais adequados para certos casos de uso ou conjuntos de dados, especialmente quando você está olhando para dados de série temporal e deseja fazer projeções futuras.
Queremos ter certeza de que nossos usuários têm o poder, a simplicidade e a flexibilidade de que precisam para aplicar essas funções a uma ampla variedade de casos de uso e, por isso, temos o prazer de anunciar dois aprimoramentos nas funções de modelagem preditiva.
Na versão 2020.4, você poderá selecionar seu modelo de regressão estatística de regressão linear (a opção padrão), regressão linear regularizada ou regressão de processo Gaussiano. Você também poderá estender seu período – e, portanto, suas previsões – com apenas alguns cliques, usando um menu simples.
Com esses novos recursos, as funções de modelagem preditiva tornam-se ainda mais poderosas e flexíveis, ajudando você a ver e entender seus dados usando as melhores técnicas estatísticas.
Vamos dar uma olhada em cada recurso:
Seleção de modelo
Por padrão, as funções de modelagem preditiva usam regressão linear como modelo estatístico subjacente. A regressão linear é um modelo estatístico comum que é melhor usado quando há um ou mais preditores que têm uma relação linear com o destino da previsão (por exemplo, “metragem quadrada” e “avaliação de impostos”) e esses preditores não representam duas instâncias dos mesmos dados (“vendas em libras esterlinas” e “vendas em dólares americanos” representam os mesmos dados e não devem ser usados como preditores em uma regressão linear).
A regressão linear é adequada para uma ampla variedade de casos de uso, mas há algumas situações em que um modelo diferente é melhor.
Em 2020.4, o Tableau oferece suporte para regressão linear, regressão linear regularizada e regressão de processo Gaussiano como modelos. Por exemplo, a regressão linear regularizada seria um modelo melhor em uma situação em que há uma relação aproximadamente linear entre dois ou mais preditores, como “altura” e “peso” ou “idade” e “salário”.
A regressão de processo gaussiana é melhor utilizada ao gerar predições em um domínio ordenado, como tempo ou espaço, ou quando há um relacionamento não linear entre o preditor e o alvo de predição. Os modelos podem ser facilmente selecionados incluindo “model = linear”, “model = rl” ou “model = gp” como o primeiro argumento em uma função de modelagem preditiva.
Extensão de eixo de data
Além disso, sabíamos que fazer previsões para datas futuras é um recurso crítico das funções de modelagem preditiva. Para oferecer suporte a isso, adicionamos uma nova opção de menu às pílulas de data que permitem que você estenda seu eixo de data no futuro de forma rápida e fácil.
Embora tenhamos construído esta função para suportar funções de modelagem preditiva, ela também pode ser usada com RUNNING_SUM ou outros cálculos RUNNING_, bem como com nossas integrações R & Python.
Vamos dar uma olhada em como essas novas funções podem ser aplicadas!
Primeiro, vamos ver como estender seu eixo de data e fazer previsões para o futuro. No exemplo a seguir, já construímos uma função de modelagem preditiva que irá prever nossas vendas de vários tipos de bebidas.
Obviamente, como esta é uma série temporal, queremos ver que tipo de números de vendas podemos esperar para os próximos meses. Isso é tão simples quanto clicar na pílula de data, selecionar “Mostrar valores futuros” e usar as opções do menu para definir o quanto no futuro você deseja gerar previsões.
A seguir, vamos dar uma olhada na seleção do modelo. No exemplo abaixo, já construímos uma função de modelagem preditiva que usa mês e categoria como preditores para vendas de vários tipos de bebidas.
Podemos ver que a regressão linear padrão está capturando a sazonalidade das vendas e as tendências gerais. No entanto, podemos facilmente mudar para o uso de regressão linear regularizada para ver como o modelo regularizado afeta a amplitude geral do comportamento sazonal.
Como estamos construindo previsões em um domínio ordenado (tempo), o processo Gaussiano também é um modelo válido para usar com esse conjunto de dados. Em qualquer caso, é tão simples quanto incluir “model = rl” ou “model = gp” como o primeiro argumento da função preditiva.
Embora tenhamos tornado muito fácil alternar entre os modelos, para a maioria dos casos de uso, a regressão linear será uma escolha apropriada. A seleção de um modelo incorreto pode levar a previsões totalmente imprecisas, portanto, essa funcionalidade é melhor reservada para uso por aqueles com um forte background estatístico e compreensão dos prós e contras dos diferentes modelos.
Comece com a versão mais recente do Tableau
Se você gosta deste tipo de conteúdo não deixe de compartilhar, e caso queira saber mais sobre como podemos lhe ajudar com nossas análises de dados, ou receber algum de nossos dashboards, clique aqui e um especialista entrará em contato.
Obrigada pela atenção e lhe vejo na próxima!