Distribuciones bidimensionales
De Wikillerato
(→2. Definición) |
(→2. Definición) |
||
Línea 27: | Línea 27: | ||
Pensando en el ejemplo anteriór, si '''X son las alturas''' e '''Y los pesos''' de las personas de una clase, X e Y podrían tener los valores: | Pensando en el ejemplo anteriór, si '''X son las alturas''' e '''Y los pesos''' de las personas de una clase, X e Y podrían tener los valores: | ||
+ | <br/> | ||
<math>X = \{x_{1}=1'72,x_{2}=1'56,x_{3}=1'63,x_{4}=1'86,x_{5}=1'68,...\}</math> | <math>X = \{x_{1}=1'72,x_{2}=1'56,x_{3}=1'63,x_{4}=1'86,x_{5}=1'68,...\}</math> | ||
<br/> | <br/> |
Revisión actual
Tabla de contenidos |
1. Introducción
En apartados anteriores hemos estudiado qué es y cómo se comporta una distribución unidimensional o lo que es lo mismo una variable. Lo que estudiaremos en este apartado es cómo podemos hablar en el lenguaje de las matemáticas sobre las relaciones entre variables.
Como ejemplo podemos definir dos variabels X e Y, digamos que:
Como podemos suponer, si estudiamos estas variables en los compañeros de una clase, existirán relaciones. La mayoría de las personas altas pesarán mas, aunque haya excepciones y tengamos un amigo alto que es muy delgado.
En este apartado trataremos de ver como podemos cuantificar este tipo de relaciones.
2. Definición
Desde este punto de vista, podemos definir distribución bidimensional como una distribución a la que a cada individuo, se le corresponden valores de dos variables.
Pensando en el ejemplo anteriór, si X son las alturas e Y los pesos de las personas de una clase, X e Y podrían tener los valores:
3. Diagramas de dispersión
Cada par de valores lo podemos representar como las coordenadas de un punto en el plano. La nube de puntos resultante de esta representación, la llamaremos diagrama de dispersión.
4. Covarianza
Para cuantificar la relación que existe entre ambas variables existen diferentes medidas. La mas simple de ellas es la covarianza y viene definida por:
Realizando las siguientes operaciones podemos encontrar una expresión mas simple:
.
5. Coeficiente de correlacion lineal
El inconveniente de la covarianza como medida de la asociación lineal entre dos variables es que depende de las unidades de X e Y , por ello se define el coeficiente de correlación entre dos variables X e Y , por:
6. Recta de regresión
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresión que se calcula de la siguiente manera: