gravatar

DanielRdMs

Daniel Rodríguez

Recently Published

Estadística Multivariada: Parcial 1
La base de datos crabs de la librerÍa MASS (Venables & Ripley 2002) del entorno y lenguaje R, contiene datos de 200 cangrejos de la especie Leptograpsus Variegatus, recolectados en la costa de Australia Occidental. La columna sp identifica el color, que puede ser azul (B) o naranja (O). Para cada color se recolectaron 50 cangrejos de cada sexo (columna sex) y se registraron 5 medidas físicas: Tamaño del lóbulo frontal (FL), anchura trasera (RW), la longitud del caparazón (CL), ancho del caparazón (CW) y profundidad del cuerpo (BD). Los investigadores buscaban demostrar que los dos colores podrían ser claramente diferenciados morfológicamente y que en realidad son dos especies diferentes. Se accede a los datos mediante las órdenes library(MASS) data(crabs) Se respondieron las siguientes preguntas: a) Realice un dispersograma de los datos diferenciando los puntos de acuerdo al factor sp, es decir, en el dispersograma use puntos de acuerdo con el color de la especie. ¿Considera que el color en realidad diferencia las especies? Justifique su respuesta. b) Realice el boxplot de cada medida numérica para cada nivel de especie (color). Comente los resultados. c) Realice el boxplot de cada medida numérica para cada nivel de sexo. d) Calcule el vector de medias, la matriz de covarianzas y la matriz de correlaciones de las cinco medidas numéricas pero para cada combinación de los niveles de sexo y especie. e) Cuando se tienen dos poblaciones que se asumen con la misma matriz de covarianzas, un buen estimador para esta matriz común a las dos poblaciones es Sp = {(n1−1)S1+(n2−1)S2}/(n1+n2−2) , donde Si es la matriz de covarianzas de los datos de la población i. Considere cada color como una población distinta y calcule la matriz Sp. f) Calcule la distancia de Mahalanobis entre los centroides de las dos especies usando la matriz Sp obtenida en el inciso anterior.