23.10.2020 Views

REVISTA ESTADISTICA I. CORRELACION LINEAL..!!FZD

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

CORRELACION LINEAL

Estadistica i

ARQ. GENOVEVA LUCAS

OCTUBRE

2020

Q15.00

Y CONOCEREIS LA VERDAD, Y LA VERDAD OS HARA LIBRE


En una modalidad de estudio virtual de estadistica I, nos

complace darles a conocer una manera de aprendizaje de la

clase de Estadistica, impartida por nuestra docente Arq.

Genoveva Lucas, nos es grato colocar conceptos basicos,

asi haciendo total enfasis en la Correlacion lineal, dando a

conocer detalles de ejemplos ilustrativos, llegando al lector

con una buena presentacion y siendo atractiva nuestra

presentacion.

Revista editada y creada por 3 estudiantes de

4to. Ciclo de Licenciatura de Administracion de

empresas, Universidad Mariano Galvez 23 de

octubre 2020.


Actualmente laboro como encargado de oficina para Rancho

Siguacan en Sevilla, una ganadería élite de Guatemala en el cual

se enfoca producir genética de la raza Brahmán Gris, con ello

contribuyen ejemplares que se adapten a las diferentes

necesidades de cada una de las ganaderías de toda Centro

América y México.

Estoy en proceso de ser licenciado en Administración de Empresas,

para ello sueño en tener mi propia empresa de negocios.

Mi objetivo está en ser un licenciado de éxito en el cual pueda

crecer continuamente con mi familia y mi empresa, generando

fuentes de empleo.

Ferdy Ivan Alfaro Ramirez

Me caracterizo por ser alguien humilde y de buenos valores,

he venido creciendo en mi ámbito profesional.

Trabajo en el área de Gestión Humana en Agrofortress S.A.

Soy contadora de profesión y estoy en proceso de llegar a

ser una Licenciada en Administración de empresas.

Mi meta es graduarme de la UMG y ser una profesional de

éxito y asi demostrar que como Mujer puedes lograr tus

sueños.

ZUCELY YAHAIRA MATEO YANES

“Ten claro que a la cima no llegarás superando a los demás,

sino superándote a ti mismo.”

Me identifico por ser una persona honesta, responsable.

Me dedico a la ganadería y agricultura.

Soy perito en administración de empresas, estoy en proceso

de ser licenciado en administración de empresas. Mi mayor

anhelo es ganar mi título universitario que me acredite como

licenciado.

Darwin Ramiro Carias de la Cruz


ESTADISTICA

DEFINICIONES

ANALISIS DE CORRELACION LINEAL

GRAFICOS

EJEMPLOS ILUSTRATIVOS

PUBLICIDAD

ANUNCIOS


Universidad Mariano Gálvez de

Guatemala

La Universidad Mariano Gálvez de Guatemala es una universidad privada en Guatemala. Su

nombre hace referencia al prócer y preclaro jurisconsulto Doctor José Mariano Gálvez (Jefe

del Estado de Guatemala 1831-1838), fundador de la Academia de Estudios y reformador de

la educación guatemalteca, quien promovió importantes innovaciones en todos los órdenes

de la vida del Estado. Luchó por que la enseñanza fuera laica, fue fundador de la Biblioteca y

Museo Nacional, respetó las leyes y garantías individuales, libertad de prensa y emisión del

pensamiento.

De acuerdo con sus principios Institucionales, la Universidad Mariano Gálvez atiende,

esencialmente, a la formación ética, científica, profesional y técnica de los estudiantes,

mediante el ejercicio integrado de la docencia, la investigación y el servicio a la comunidad,

al fomento de la investigación como fuente de conocimiento y de progreso y al estudio de

los problemas con el objeto de contribuir a su solución.

La universidad cuenta con carreras de Pregrado (Licenciaturas), Postgrados (Maestrías y

Doctorados); además dispone de una Escuela de Idiomas y facultades como Administración

de Empresas, Ciencias de la Comunicación, Ciencias Económicas, Ciencias Jurídicas y Sociales,

Ingeniería, Humanidades, Medicina, Psicología, Teología, entre otras.

1


ESTADISTICA

DEFINICION

Es el conjunto de métodos y procedimientos que implican recopilación, presentación, ordenación

y análisis de datos, con el fin que a partir de ellos puedan inferirse conclusiones. Pueden

distinguirse dos ramas diferentes en Estadística: , la cual es la que se utiliza en la c Estadística

Descriptiva descripción y análisis de conjuntos de datos o población. , la cual hace posible la

estimación de una característica de una c Inferencia Estadística población, o la toma de una

decisión con respecto a una población, con base únicamente en resultados muéstrales.

2


3


GRAFICO DE LA HISTORIA DE LA ESTADISTICA

EDAD ANTIGUA

Los comienzos de la estadística pueden

ser hallados en el antiguo Egipto, cuyos

faraones lograron recopilar, hacia el año

3050 antes de Cristo, prolijos datos

relativos a la población y la riqueza del

país. En Egipto, Ramsés II hizo un censo

de las tierras. También los chinos

efectuaron censos hace más de cuarenta

siglos

EDAD CONTEMPORANEA

El desarrollo del Muestreo y la Inferencia

estadística hacen posible que el estudio

de la población. Hoy en día, se crean

oficinas de estadística como La oficina de

estadística de España es el INE y Además,

la Comisión de Estadística de Naciones

Unidas fija el 20 de octubre de 2010 como

fecha conmemorativa del primer Día

Mundial de la Estadística.

SURGIMIENTO DE LA

ESTADÍSTICA

En antiguas civilizaciones

como Babilonia, Egipto,

China, Roma etc. Incluso

aparece en la Biblia libro

de Numeros

EDAD MEDIA

Durante la Edad Media (aprox. 476 –

1453 d.C.) la estadística no

experimentó grandes avances.

También pueden citarse varios censos

como el de Carlos Magno en 762, al

igual En la América prehispánica

también se elaboraban censos.

EDAD MODERNA

Matemáticos como Pascal y Fermat

sentaron las bases de la Teoría de la

Probabilidad, utilizada para estudiar

fenómenos aleatorios, para utilzarse en

a aplicarse a sucesos demográficos y

económicos. El profesor alemán

Gottfried Achenwall (1719 – 1772) fue

la persona que acuñó el término

estadística.

4


MAPA MENTAL DE DIVISION DE LA ESTADÍSTICA

TIPOS DE VARIABLES

Una variable es una característica que

al ser medida en diferentes individuos

es susceptible de adoptar diferentes

valores.

VARIABLES CUALITATIVA

TIPOS DE CUANTITATIVA

Se ocupa de inferir importantes

conclusiones de una población a

partir de una muestra

representativa. usando tenicas

como la prueba de hipótesis, las

estimaciones, la correlación, el

análisis de regresión, las series

de tiempo, la minería de datos,

grafica de datos etc.

DISCRETA

CONTINUA

ESTADISTICA

INFERENCIAL

POBLACION Y MUESTRA

ESTADÍSTICA

5


ANÁLISIS DE CORRELACIÓN

A menudo nos interesa observar y medir la relación entre 2 variables numéricas

mediante el análisis de correlación. Se trata de una de las técnicas más habituales en

análisis de datos y el primer paso necesario antes de construir cualquier modelo

explicativo o predictivo más complejo.

6


COMO SE INTERPRETA LA

CORRELACIÓN

¿QUÉ ES LA

CORRELACIÓN?

La correlación es un tipo

de asociación entre dos

La correlación nos permite medir el signo y magnitud de la

tendencia entre dos variables. En la figura 1 vemos diferentes

valores del coeficiente de correlación y sus diagramas de dispersión

correspondientes. Podemos ver que:

El signo nos indica la dirección de la relación, como hemos visto

en el diagrama de dispersión.

un valor positivo indica una relación directa o positiva,

un valor negativo indica relación indirecta, inversa o negativa,

un valor nulo indica que no existe una tendencia entre ambas

variables (puede ocurrir que no exista relación o que la relación sea

más compleja que una tendencia, por ejemplo, una relación en

forma de U).

La magnitud nos indica la fuerza de la relación, y toma valores

entre -1 a 1. Cuanto más cercano sea el valor a los extremos del

intervalo (1 o -1) más fuerte será la tendencia de las variables, o

será menor la dispersión que existe en los puntos alrededor de

dicha tendencia. Cuanto más cerca del cero esté el coeficiente de

correlación, más débil será la tendencia, es decir, habrá más

dispersión en la nube de puntos.

Si la correlación vale 1 o -1 diremos que la correlación es

“perfecta”,

variables numéricas,

específicamente evalúa la

tendencia (creciente o

decreciente) en los datos.

Dos variables están

asociadas cuando una

variable nos da

información acerca de la

otra. Por el contrario,

cuando no existe

asociación, el aumento o

disminución de una

variable no nos dice nada

sobre el comportamiento

de la otra variable.

Dos variables se

correlacionan cuando

muestran una tendencia

creciente o

decreciente.

7


TAMAÑO DEL EFECTO.

En estadística, el tamaño del efecto es una medida de la fuerza o

magnitud de un fenómeno. El coeficiente de correlación es una

medida del tamaño del efecto para la relación (lineal) entre dos

variables numéricas.

Para interpretar qué tan fuerte es la correlación podemos utilizar el

criterio de Cohen (1988)3, quien para valores absolutos indica que

valores entre:

.1-.3 representan un efecto pequeño,

.3-.5 un efecto medio y

≥.5 un efecto grande.

Son valores arbitrarios que te pueden servir de guía, pero te

recomiendo interpretar la fuerza (o tamaño) de la correlación

según el contexto de tu investigación. No es lo mismo analizar

datos de un experimento físico controlado donde habrá poco

ruido en los datos, que analizar datos sociales o biológicos

donde se espera encontrar menores valores de correlación

debido a la gran cantidad de dispersión o variabilidad de los

datos.

Cómo se mide la correlación

Veamos ahora los coeficientes de correlación más utilizados.

En estadística, el coeficiente de

correlación de Pearson es una medida

de dependencia lineal entre dos

variables aleatorias cuantitativas. A

diferencia de la covarianza, la

correlación de Pearson es

independiente de la escala de medida

de las variables.

De manera menos formal, podemos

definir el coeficiente de

correlación de Pearson como un

índice que puede utilizarse para

medir el grado de relación de dos

variables siempre y cuando

ambas sean cuantitativas y

continuas.

Tenemos el coeficiente de correlación lineal de Pearson que se

sirve para cuantificar tendencias lineales, y el coeficiente de

correlación de Spearman que se utiliza para tendencias de

aumento o disminución, no necesariamente lineales pero sí

monótonas (las variables tienden a moverse en la misma

dirección relativa, pero no necesariamente a un ritmo

constante; Figura 2).

Relación lineal y relación no lineal (monótona).

Vemos representado con una «r» negra el

coeficiente de Pearson y con una «s» en rojo el de

Spearman. Cuando la relación es lineal, ambos

coeficientes coinciden (valen 1), pero cuando la

relación no es lineal el coeficiente de correlación

de Spearman representa mejor la relación

entre las variables

8


El coeficiente de correlación lineal de Pearson mide una

tendencia lineal entre dos variables numéricas.

Es el método de correlación más utilizado, pero asume que:

la tendencia debe ser de tipo lineal.

no existen valores atípicos (outliers).

Las variables deben ser numé Si las variables son de tipo ordinal

(como las preguntas en escala de likert), no podremos aplicar la

correlación de Pearson.

Tenemos suficientes datos (algunos autores recomiendan tener

más de 30 puntos u observaciones).

Los dos primeros supuestos se pueden evaluar simplemente con

un diagrama de dispersión, mientras que para los últimos basta

con mirar los datos y evaluar el diseño que tenemos.

El coeficiente de correlación de Spearman mide una

tendencia monótona (creciente o decreciente) entre dos

variables. Está basado en los rangos de los valores.

En los casos donde no se cumplen los requisitos del coeficiente

de correlación lineal de Pearson, es conveniente utilizar la

correlación de Spearman. Es una prueba no paramétrica (no

asume una distribución previa de los datos) y es más robusta

frente a la presencia de outliers que la prueba paramétrica de

Pearson

9


ARQUITECTA GENOVEVA LUCAS MAZARIEGOS

EGRESADA DE LA UNIVERSIDAD SAN CARLOS DE GUATEMALA.

DOCENTE DE MATEMATICAS Y ESTADISTICA EN LA

UNIVERSIDAD MARIANO GALVEZ.

TRABAJA ACTUALMENTE EN ASASGUA (Asociación de

azucareros)

Profesional, madre de familia,

digna de admirar, gracias a su

esfuerzo se ha logrado posicionar

en una jerarquía que marca la

diferencia haciéndonos saber que

con metas y objetivos podemos

lograr nuestros sueños.

Como alumnos de Estadística l de

Administración de la UMG

estamos agradecidos por la

enseñanza y motivación en este

nuevo método de aprendizaje

virtual.

10


QUÉ MIDE EL COEFICIENTE DE CORRELACIÓN

El coeficiente de correlación r de Pearson expresa en qué grado los sujetos tienen el mismo orden

en dos variables. Si los sujetos más altos pesan más y los más bajitos pesan menos, entre peso y

altura tendremos una correlación positiva: a mayor altura, mayor peso. Si los de más edad corren

más despacio y los más jóvenes corren más deprisa, entre edad y velocidad tendremos una

correlación negativa; a mayor edad, menor velocidad. Los coeficientes de correlación pueden ser

por lo tanto positivos o negativos. Lo que expresan estos coeficientes se entiende bien mediante

su representación gráfica, los diagramas de dispersión en los que las dos variables están

simbolizadas con las letras X e Y.

Cuando se estudian en forma conjunta dos características (variables estadísticas) de una población

o muestra, se dice que estamos analizando una variable estadística bidimensional. La correlación

es el grado de relación que existe entre ambas características, y la regresión es la forma de

expresar matemáticamente dicha relación.

Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo

el valor de la otra variable.

NOTA: Te recomiendo siempre comenzar a analizar la

Correlación realizando un diagrama de dispersión

entre las variables que quieres analizar.

11


1 VARIABLE CUANTITATIVA 10 DIAGRAMA DE SECTORES

2 MUESTRA 11 MODA

3 HISTOGRAMA 12 CENTRALIZACION

4 POBLACION 13 VARIABLE CUALITATIVA

5 PARAMETROS ESTADISTICOS 14 CONTINUA

6 MEDIA 15 INTERVALOS

7 MEDIANA 16 INDIVIDUO

8 DIAGRAMA DE BARRAS 17 DISCRETA

9 TABLA DE FRECIENCIAS

12


COEFICIENTES DE

CORRELACION

Los coeficientes de correlación son medidas

que indican la situación relativa de los mismos

sucesos respecto a las dos variables, es decir,

son la expresión numérica que nos indica el

grado de relación existente entre las 2

variables y en qué medida se relacionan. Son

números que varían entre los límites +1 y -1.

Su magnitud indica el grado de asociación

entre las variables; el valor r = 0 indica que no

existe relación entre las variables; los valores ±

1 son indicadores de una correlación perfecta

positiva (al crecer o decrecer X, crece o

decrece Y) o negativa (Al crecer o decrecer X,

decrece o crece Y).

Correlación Negativa

Para interpretar el coeficiente de correlación

utilizamos la siguiente escala:

Valor

-1

Significado

Correlación negativa grande y

perfecta

-0,9 a -0,99 Correlación negativa muy alta

-0,7 a -0,89 Correlación negativa alta

-0,4 a -0,69 Correlación negativa moderada

-0,2 a -0,39 Correlación negativa baja

-0,01 a -0,19 Correlación negativa muy baja

0 Correlación nula

No hay correlación

0,01 a 0,19 Correlación positiva muy baja

0,2 a 0,39 Correlación positiva baja

0,4 a 0,69 Correlación positiva moderada

0,7 a 0,89 Correlación positiva alta

0,9 a 0,99 Correlación positiva muy alta

1

Correlación positiva grande y

perfecta

13


COEFICIENTE DE CORRELACIÓN

DE KARL PEARSON

Llamando también coeficiente de

correlación producto-momento.

a) Para datos no agrupados se calcula

aplicando la siguiente ecuación:

Correlación Positiva

r = Coeficiente producto-momento de

correlación lineal

14


Según el

número de

variables.

Gráfico de clasificación

Correlación

Según la relación

entre variables.

Correlación

simple.

Correlación

múltiple.

La variable

dependiente

actúa sobre la

variable

independiente.

Cuando la

variable

dependiente

actúa sobre la

variable

independiente.

Clasificación

de la

corrección

Correlación

lineal.

Se representa

mediante una

línea recta.

Correlación no

lineal.

Se representa

con una línea

curva.

Correlación parcial.

Es cuando la relación

que existe entre una

variable

independiente y

dependiendo los

factores son

cortantes.

Según el valor

cuantitativo.

Según el signo.

Correlación

positiva.

Es cuando

una

disminuye y

la otra

aumenta.

Correlación

perfecta.

El valor de los

coeficientes de

correlación es 1.

Correlación

imperfecta. El

coeficiente de

correlación es menor

a 1. Sea positivo o

negativo

Correlación nula.

El coeficiente de

correlación es 0.

15


Y Exportaciones

Y Exportaciones

TEMA 5

EJEMPLO: Empresa sector citrícola

Gasto Marketing Exportaciones

(miles €) (miles €)

X Y Y*=a+bX Menu insertar, opción función:

Año 1 6 600 a= -99.1810345 función estadística =intersección.eje

Año 2 7.8 760 b= 113.936782 función estadística =pendiente

Año 3 10.2 1080 R 2 = 0.99481355 función estadística =coeficiente.R2

Año 4 12 1265

1300

1100

900

700

500

4 6 8 10 12 14

X Gasto Marketing

Gráfico XY (dispersión)

1300

Y* = -99,181+113,94X

R 2 = 0,9948

1100

900

700

500

4 6 8 10 12 14

X Gasto Marketing

16


Instrucciones para representar la recta de regresión en el gráfico:

1) Pinchar el gráfico XY(dispersión) con el ratón,

2) Elegir el menú "Gráfico"

3) Elegir la opción "Agregar línea de tenencia",

4) Elegir "Tipo de tendencia o regresión": Lineal,

5) En la solapa "Opciones", marcar las opciones "Presentar ecuación el gráfico"

y "Presentar el valor de R cuadrado en el gráfico".

X Y Y*=a+bX e=Y-Y*

6 600 584.4398 15.5602

7.8 760 789.52604 -29.5260

10.2 1080 1062.97436 17.0256

12 1265 1268.0606 -3.0606

3705 3705 0

Obtención de los parámetros de la recta de regresión con el menú "Herramientas", opción "Análisis de Datos",

función de análisis: "Regresión" de Excel.

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.997403402

Coeficiente de determinación R^2 0.994813546

R^2 ajustado 0.992220319

Error típico 26.58144608

Observaciones 4

Coeficientes

Intercepción -99.18103448

X 113.9367816

Análisis de los residuales

Observación Pronóstico Y Residuos

1 584.4396552 15.56034483

2 789.5258621 -29.52586207

3 1062.974138 17.02586207

4 1268.060345 -3.060344828

17


i

18


Ejemplo ilustrativo:

Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el

tipo de correlación que existe entre ellas mediante el coeficiente de PEARSON.

X 18 17 15 16 14 12 9 15 16 14 16 18

Y 13 15 14 13 9 10 8 13 12 13 10 8

SX

=180

SY=

138

Solución:

Se calcula la media aritmética

Se llena la siguiente tabla:

19


Se aplica la fórmula:

Existe una correlación moderada

En Excel se calcula de la siguiente manera:

a) Se inserta la función COEF.DE.CORREL y pulsar en Aceptar.

20


b) En el cuadro de argumentos de la función, en el recuadro de la Matriz 1 seleccionar las

celdas de X, y en el recuadro de la Matriz 2 seleccionar las celdas de Y.

c) Pulsar en Aceptar.

21


DIAGRAMA DE DISPERSIÓN

Los diagramas de dispersión son planos cartesianos en los que se marcan los puntos

correspondientes a los pares ordenados (X,Y) de los valores de las variables.

El diagrama de dispersión en Excel se realiza de la siguiente manera:

a) Seleccionar los datos e insertar diagrama de dispersión.

22


b) En diagrama dispersión, escoger el primero.

c) Para que ver las coordenadas escoger el diseño N° 7.

23


d) Borrar Serie 1, las líneas horizontales y verticales (haciendo clic y suprimir en cada

objeto).

e) En título del gráfico escribir Diagrama de dispersión.

f) Clic en el eje x, y luego clic derecho para dar formato al eje.

24


g) Poner 2 en la casilla unidad mayor para ver los números de 2 en 2 en el eje x.

25


h) Clic en Cerrar para culminar la elaboración del diagrama de dispersión, aunque se le

puede seguir haciendo más mejoras.

26


Para realizar el diagrama de dispersión en el programa Graph se procede de la siguiente

manera:

a) Clic en Función.

b) Clic en Insertar serie de puntos.

27


RESPUESTA

28


29


INFORMATE DEL

COVID-19

Los adultos mayores y las personas con

ciertas afecciones subyacentes, como

enfermedades cardiacas o pulmonares o

diabetes, corren mayor riesgo de enfermarse

gravemente a causa del COVID-19. Encuentre

más información en la página ¿Tiene usted

un mayor riesgo de presentar un caso grave

de enfermedad.

Cómo se propaga

En estos momentos no existe una vacuna

para prevenir la enfermedad del coronavirus

2019 (COVID-19).

La mejor manera de prevenir la enfermedad

es evitar la exposición a este virus.

Se cree que el virus se propaga

principalmente de persona a persona..

Entre personas que están en contacto

cercano (a una distancia de hasta

aproximadamente 6 pies).

A través de gotitas respiratorias que se

producen cuando una persona infectada

tose, estornuda o habla.

30


DEPORTES

NUEVA

CONCEPCIÓN

El Club Deportivo Nueva Concepción

usualmente conocido como Deportivo Nueva

Concepción es un equipo de fútbol con sede

en la localidad de Nueva Concepción

(Escuintla), participa en la Primera División de

Guatemala.

Futbolista destacada internacional de Nva.

Concepción

JENIFER ORTIZ Gracias por poner ese ha destacado por su

increíble talento futbolístico, se desarrolló en el club deportivo

Nueva Concepción, ahora se va a las competiciones más grandes.

Poniendo en alto en Guatemala.

Nueva Concepción hay talento! Solo debemos apoyar... dejemos

un mensaje de motivación a

JENIFER! Seguramente

Jennifer los responderá

desde España

31


Universidad Mariano Gálvez

Nueva Concepción

Y CONOCEREIS LA VERDAD, Y LA

VERDAD OS HARA LIBRE

32

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!