![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Linear_regression.svg/langgl-640px-Linear_regression.svg.png&w=640&q=50)
Análise da regresión
From Wikipedia, the free encyclopedia
En estatística, a análise da regresión é un proceso estatístico que se emprega para estimar as relacións entre variables. Inclúe moitas técnicas para a modelaxe e a análise de varias variables, cando se considera unha variable dependente e unha ou máis variables independentes. Máis especificamente, a análise da regresión axuda a entender como varía o valor da variable dependente ao cambiar o valor dunha das variables independentes, mantendo o valor das outras variables independentes fixas. Comunmente, a análise da regresión estima a esperanza condicional da variable dependente dadas as variables independentes, é dicir, o valor medio da variable dependente cando se fixan as variables independentes. Menos habitualmente, a atención se centra nun cuantil ou outro parámetro de localización da distribución condicional da variable dependente dadas as variables independentes. En todos os casos, o obxectivo é a estimación dunha función das variables independentes chamada a función da regresión. A análise da regresión, tamén é de interese para caracterizar a variación da variable dependente a partir da función da regresión e pode ser descrita por unha distribución de probabilidade.
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Linear_regression.svg/320px-Linear_regression.svg.png)
A análise da regresión é amplamente empregada para a predición e a previsión, onde o seu uso ten superposición substancial no campo de aprendizaxe automático. A análise da regresión emprégase tamén para comprender cales das variables independentes están relacionadas coa variable dependente, e explorar as formas destas relacións. En determinadas circunstancias, a análise da regresión pode empregarse para inferir relacións causais entre as variables independentes e dependentes. Non obstante, isto pode levar a falsas relacións, polo que é recomendable ter certa precaución,[1] por exemplo, a correlación non implica causalidade.
Existen moitas técnicas para levar a cabo a análise da regresión. Os métodos familiares tales como a regresión linear e a ordinaria dos mínimos cadrados da regresión son paramétricos, nos que a función da regresión se define en termos dun número finito de parámetros descoñecidos que se estiman a partir dos datos. A regresión non paramétrica refírese ás técnicas que permiten que a función da regresión se explique nun conxunto específico de funcións, que pode ser de dimensión infinita.
A aplicación dos métodos de análise da regresión na práctica depende da forma do proceso de xeración de datos, e como se relaciona co método da regresión que se emprega. Dado que a forma verdadeira do proceso de xeración de datos en xeral non se coñece, habitualmente a análise da regresión depende ata certo punto de facer suposicións sobre este proceso. Estes supostos son ás veces comprobables se se dispón dunha cantidade suficiente de datos. Os modelos da regresión para a predición, aínda que poden non funcionar de maneira óptima, en moitas aplicacións, sobre todo con pequenos efectos ou por mor da causalidade sobre a base dos datos de observación, poden dar resultados enganosos.[2][3]