Como calcular o R2 Excel

Investidor trabalhando em novo projeto de inicialização.

Em finanças e estatística, o coeficiente de determinação, também conhecido como R-quadrado (ou R2), é uma medida da relação entre dois conjuntos de dados usados ​​em um modelo matemático.

Crédito da imagem: ijeab / iStock / GettyImages

Em finanças e estatísticas, o coeficiente de determinação, também conhecido como R ao quadrado (ou R2) é uma medida da relação entre dois conjuntos de dados usados ​​em um modelo matemático. Ele representa a razão de variância na variável dependente que pode ser prevista a partir da variável independente no modelo. É frequentemente usado em análises de regressão para avaliar previsões de resultados futuros com base nos resultados observados. Você pode calcular R-quadrado no Excel usando a função RSQ.

Coeficiente. de determinação no Excel

No Microsoft Excel, a função RSQ é usada para determinar o valor de R ao quadrado para dois conjuntos de pontos de dados. A função retorna o quadrado do coeficiente de correlação do momento do produto de Pearson, que mede a correlação linear entre as variáveis ​​x e y. O coeficiente de correlação sempre fica na faixa de -1 e +1. O valor retornado pelo RSQ no Excel está sempre entre 0 e 1 (uma vez que é calculado como o quadrado de um coeficiente de correlação, ele nunca pode retornar um valor negativo).

Vídeo do dia

Sintaxe da função RSQ

A função RSQ aceita dois conjuntos de dados como argumentos, chamados de known_x e known_y. Esses conjuntos de dados podem ser na forma de uma lista de números ou uma lista ou intervalo de referências de células. Por exemplo, digamos que você queira fazer uma análise de regressão do dinheiro gasto com publicidade em comparação com receita de vendas, em que as despesas mensais com anúncios são listadas na coluna A e a receita mensal é listada na coluna B. Você pode usar a função RSQ inserindo RSQ (A1: A10, B1: B10), que usa valores nas linhas 1 a 10 das colunas A (custos de anúncios) e B (receita).

Usando as funções CORREL e PEARSON

O Excel também fornece uma maneira de calcular o coeficiente de correlação para dois conjuntos de dados usando as funções CORREL e PEARSON. Como a função RSQ, CORREL e PEARSON usam dois intervalos de valores de células como argumentos. Pegar o resultado de CORREL ou PEARSON para encontrar o coeficiente de correlação e elevar o resultado ao quadrado é o mesmo que usar a função RSQ para determinar o coeficiente de determinação.

Interpretando resultados RSQ

As funções CORREL e PEARSON retornam valores entre -1 e 1. Esta é uma medida adimensional de correlação positiva ou negativa entre os dois conjuntos de dados fornecidos como argumentos. O valor de retorno da função RSQ está entre 0 e 1, às vezes expresso como uma porcentagem de 0 a 100. Muitos analistas acreditam que um resultado de RSQ mais alto indica um modelo matemático mais preciso, enquanto outros dizem que é importante olhar para todos os fatores que podem distorcer um resultado alto ou baixo antes de desenhar conclusões.

Os especialistas também dizem que você deve evitar comparar valores de R ao quadrado para diferentes modelos e conjuntos de dados. Nos casos em que existem grandes diferenças entre os tipos de dados que estão sendo comparados, os resultados podem ser enganosos. Existem medidas mais complicadas para comparar modelos do que valores de R ao quadrado, como testes F e critérios de informação.

Visualizando Análise de Regressão

O gráfico de dispersão do Excel é mais frequentemente usado para mostrar relações entre conjuntos de dados durante análises de regressão. O intervalo de valores para um conjunto de dados é mostrado no eixo x horizontal e o intervalo para o outro conjunto no eixo y vertical. Os pontos de dados são mapeados para a interseção dos valores xey usando pares de valores de cada conjunto de dados.

Usando o exemplo de publicidade e vendas, onde os custos de anúncios são listados na coluna A e a renda mensal na coluna B, o eixo horizontal mostraria a variação da renda mensal e o vertical mostraria a variação da publicidade custos. Os pontos de dados no gráfico seriam plotados observando as células adjacentes na coluna A e coluna B. O padrão de pontos resultante pode ser usado para visualizar a quantidade de correlação entre as variáveis.