Patrocinado por PHPDocX

Síguenos en Twitter

Buscar en WikilleratO
   

Distribuciones bidimensionales

De Wikillerato

Tabla de contenidos

1. Introducción

En apartados anteriores hemos estudiado qué es y cómo se comporta una distribución unidimensional o lo que es lo mismo una variable. Lo que estudiaremos en este apartado es cómo podemos hablar en el lenguaje de las matemáticas sobre las relaciones entre variables.

Como ejemplo podemos definir dos variabels X e Y, digamos que:


X = \{La \: altura \: de \: los alumnos \: de \: una\: clase\} Y = \{El \: peso \: de \: los \: alumnos \: de \: una \: clase\}

Como podemos suponer, si estudiamos estas variables en los compañeros de una clase, existirán relaciones. La mayoría de las personas altas pesarán mas, aunque haya excepciones y tengamos un amigo alto que es muy delgado.

En este apartado trataremos de ver como podemos cuantificar este tipo de relaciones.

2. Definición


Desde este punto de vista, podemos definir distribución bidimensional como una distribución a la que a cada individuo, se le corresponden valores de dos variables.

 \left( X, Y\right) = \{ (x_{1}, y_{1}), (x_{2}, y_{2}), ...,  (x_{n}, y_{n})\}


Pensando en el ejemplo anteriór, si X son las alturas e Y los pesos de las personas de una clase, X e Y podrían tener los valores:

X = \{x_{1}=1'72,x_{2}=1'56,x_{3}=1'63,x_{4}=1'86,x_{5}=1'68,...\}
Y = \{y_{1}=75,y_{2}=49,y_{3}=60,y_{4}=80,y_{5}=64,...\}

3. Diagramas de dispersión

Cada par de valores  ( x_{i}, y_{i} ) lo podemos representar como las coordenadas de un punto en el plano. La nube de puntos resultante de esta representación, la llamaremos diagrama de dispersión.


Imagen:figura_1.jpg

4. Covarianza

Para cuantificar la relación que existe entre ambas variables existen diferentes medidas. La mas simple de ellas es la covarianza y viene definida por:


S_{XY}={E([X - E(X)][Y - E(Y)])}

Realizando las siguientes operaciones podemos encontrar una expresión mas simple:


S_{XY} = \frac 1n \sum_{i=1}^n { (x_i - \overline{x})(y_i - \overline{y})} = {1 \over n} \sum_{i,j}^n {x_{i.}y_{.j}n_{ij}} - \overline{x} \overline{y}.


5. Coeficiente de correlacion lineal

El inconveniente de la covarianza como medida de la asociación lineal entre dos variables es que depende de las unidades de X e Y , por ello se define el coeficiente de correlación entre dos variables X e Y , por:



\rho_{X,Y}={\sigma_{XY} \over \sigma_X \sigma_Y} ={E[(X-\mu_X)(Y-\mu_Y)] \over \sigma_X\sigma_Y}


6. Recta de regresión

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresión que se calcula de la siguiente manera:


y - \bar{y} = \frac{S_{xy}}{S_{x}^2}\left\( x - \bar{x} \right\)


Imagen:figura_2.jpg

   
 
ASIGNATURAS
MatemáticasFísicaQuímicaBiologíaDibujoHistoriaLengua y LiteraturaHistoria del ArteFilosofía
Creative Commons License
Los contenidos de Wikillerato están disponibles bajo una licencia de Creative Commons.
Pueden utilizarse y redistribuirse libremente siempre que se reconozca su procedencia.