REVISTA ESTADISTICA I. CORRELACION LINEAL..!!FZD
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
CORRELACION LINEAL
Estadistica i
ARQ. GENOVEVA LUCAS
OCTUBRE
2020
Q15.00
Y CONOCEREIS LA VERDAD, Y LA VERDAD OS HARA LIBRE
En una modalidad de estudio virtual de estadistica I, nos
complace darles a conocer una manera de aprendizaje de la
clase de Estadistica, impartida por nuestra docente Arq.
Genoveva Lucas, nos es grato colocar conceptos basicos,
asi haciendo total enfasis en la Correlacion lineal, dando a
conocer detalles de ejemplos ilustrativos, llegando al lector
con una buena presentacion y siendo atractiva nuestra
presentacion.
Revista editada y creada por 3 estudiantes de
4to. Ciclo de Licenciatura de Administracion de
empresas, Universidad Mariano Galvez 23 de
octubre 2020.
Actualmente laboro como encargado de oficina para Rancho
Siguacan en Sevilla, una ganadería élite de Guatemala en el cual
se enfoca producir genética de la raza Brahmán Gris, con ello
contribuyen ejemplares que se adapten a las diferentes
necesidades de cada una de las ganaderías de toda Centro
América y México.
Estoy en proceso de ser licenciado en Administración de Empresas,
para ello sueño en tener mi propia empresa de negocios.
Mi objetivo está en ser un licenciado de éxito en el cual pueda
crecer continuamente con mi familia y mi empresa, generando
fuentes de empleo.
Ferdy Ivan Alfaro Ramirez
Me caracterizo por ser alguien humilde y de buenos valores,
he venido creciendo en mi ámbito profesional.
Trabajo en el área de Gestión Humana en Agrofortress S.A.
Soy contadora de profesión y estoy en proceso de llegar a
ser una Licenciada en Administración de empresas.
Mi meta es graduarme de la UMG y ser una profesional de
éxito y asi demostrar que como Mujer puedes lograr tus
sueños.
ZUCELY YAHAIRA MATEO YANES
“Ten claro que a la cima no llegarás superando a los demás,
sino superándote a ti mismo.”
Me identifico por ser una persona honesta, responsable.
Me dedico a la ganadería y agricultura.
Soy perito en administración de empresas, estoy en proceso
de ser licenciado en administración de empresas. Mi mayor
anhelo es ganar mi título universitario que me acredite como
licenciado.
Darwin Ramiro Carias de la Cruz
ESTADISTICA
DEFINICIONES
ANALISIS DE CORRELACION LINEAL
GRAFICOS
EJEMPLOS ILUSTRATIVOS
PUBLICIDAD
ANUNCIOS
Universidad Mariano Gálvez de
Guatemala
La Universidad Mariano Gálvez de Guatemala es una universidad privada en Guatemala. Su
nombre hace referencia al prócer y preclaro jurisconsulto Doctor José Mariano Gálvez (Jefe
del Estado de Guatemala 1831-1838), fundador de la Academia de Estudios y reformador de
la educación guatemalteca, quien promovió importantes innovaciones en todos los órdenes
de la vida del Estado. Luchó por que la enseñanza fuera laica, fue fundador de la Biblioteca y
Museo Nacional, respetó las leyes y garantías individuales, libertad de prensa y emisión del
pensamiento.
De acuerdo con sus principios Institucionales, la Universidad Mariano Gálvez atiende,
esencialmente, a la formación ética, científica, profesional y técnica de los estudiantes,
mediante el ejercicio integrado de la docencia, la investigación y el servicio a la comunidad,
al fomento de la investigación como fuente de conocimiento y de progreso y al estudio de
los problemas con el objeto de contribuir a su solución.
La universidad cuenta con carreras de Pregrado (Licenciaturas), Postgrados (Maestrías y
Doctorados); además dispone de una Escuela de Idiomas y facultades como Administración
de Empresas, Ciencias de la Comunicación, Ciencias Económicas, Ciencias Jurídicas y Sociales,
Ingeniería, Humanidades, Medicina, Psicología, Teología, entre otras.
1
ESTADISTICA
DEFINICION
Es el conjunto de métodos y procedimientos que implican recopilación, presentación, ordenación
y análisis de datos, con el fin que a partir de ellos puedan inferirse conclusiones. Pueden
distinguirse dos ramas diferentes en Estadística: , la cual es la que se utiliza en la c Estadística
Descriptiva descripción y análisis de conjuntos de datos o población. , la cual hace posible la
estimación de una característica de una c Inferencia Estadística población, o la toma de una
decisión con respecto a una población, con base únicamente en resultados muéstrales.
2
3
GRAFICO DE LA HISTORIA DE LA ESTADISTICA
EDAD ANTIGUA
Los comienzos de la estadística pueden
ser hallados en el antiguo Egipto, cuyos
faraones lograron recopilar, hacia el año
3050 antes de Cristo, prolijos datos
relativos a la población y la riqueza del
país. En Egipto, Ramsés II hizo un censo
de las tierras. También los chinos
efectuaron censos hace más de cuarenta
siglos
EDAD CONTEMPORANEA
El desarrollo del Muestreo y la Inferencia
estadística hacen posible que el estudio
de la población. Hoy en día, se crean
oficinas de estadística como La oficina de
estadística de España es el INE y Además,
la Comisión de Estadística de Naciones
Unidas fija el 20 de octubre de 2010 como
fecha conmemorativa del primer Día
Mundial de la Estadística.
SURGIMIENTO DE LA
ESTADÍSTICA
En antiguas civilizaciones
como Babilonia, Egipto,
China, Roma etc. Incluso
aparece en la Biblia libro
de Numeros
EDAD MEDIA
Durante la Edad Media (aprox. 476 –
1453 d.C.) la estadística no
experimentó grandes avances.
También pueden citarse varios censos
como el de Carlos Magno en 762, al
igual En la América prehispánica
también se elaboraban censos.
EDAD MODERNA
Matemáticos como Pascal y Fermat
sentaron las bases de la Teoría de la
Probabilidad, utilizada para estudiar
fenómenos aleatorios, para utilzarse en
a aplicarse a sucesos demográficos y
económicos. El profesor alemán
Gottfried Achenwall (1719 – 1772) fue
la persona que acuñó el término
estadística.
4
MAPA MENTAL DE DIVISION DE LA ESTADÍSTICA
TIPOS DE VARIABLES
Una variable es una característica que
al ser medida en diferentes individuos
es susceptible de adoptar diferentes
valores.
VARIABLES CUALITATIVA
TIPOS DE CUANTITATIVA
Se ocupa de inferir importantes
conclusiones de una población a
partir de una muestra
representativa. usando tenicas
como la prueba de hipótesis, las
estimaciones, la correlación, el
análisis de regresión, las series
de tiempo, la minería de datos,
grafica de datos etc.
DISCRETA
CONTINUA
ESTADISTICA
INFERENCIAL
POBLACION Y MUESTRA
ESTADÍSTICA
5
ANÁLISIS DE CORRELACIÓN
A menudo nos interesa observar y medir la relación entre 2 variables numéricas
mediante el análisis de correlación. Se trata de una de las técnicas más habituales en
análisis de datos y el primer paso necesario antes de construir cualquier modelo
explicativo o predictivo más complejo.
6
COMO SE INTERPRETA LA
CORRELACIÓN
¿QUÉ ES LA
CORRELACIÓN?
La correlación es un tipo
de asociación entre dos
La correlación nos permite medir el signo y magnitud de la
tendencia entre dos variables. En la figura 1 vemos diferentes
valores del coeficiente de correlación y sus diagramas de dispersión
correspondientes. Podemos ver que:
El signo nos indica la dirección de la relación, como hemos visto
en el diagrama de dispersión.
un valor positivo indica una relación directa o positiva,
un valor negativo indica relación indirecta, inversa o negativa,
un valor nulo indica que no existe una tendencia entre ambas
variables (puede ocurrir que no exista relación o que la relación sea
más compleja que una tendencia, por ejemplo, una relación en
forma de U).
La magnitud nos indica la fuerza de la relación, y toma valores
entre -1 a 1. Cuanto más cercano sea el valor a los extremos del
intervalo (1 o -1) más fuerte será la tendencia de las variables, o
será menor la dispersión que existe en los puntos alrededor de
dicha tendencia. Cuanto más cerca del cero esté el coeficiente de
correlación, más débil será la tendencia, es decir, habrá más
dispersión en la nube de puntos.
Si la correlación vale 1 o -1 diremos que la correlación es
“perfecta”,
variables numéricas,
específicamente evalúa la
tendencia (creciente o
decreciente) en los datos.
Dos variables están
asociadas cuando una
variable nos da
información acerca de la
otra. Por el contrario,
cuando no existe
asociación, el aumento o
disminución de una
variable no nos dice nada
sobre el comportamiento
de la otra variable.
Dos variables se
correlacionan cuando
muestran una tendencia
creciente o
decreciente.
7
TAMAÑO DEL EFECTO.
En estadística, el tamaño del efecto es una medida de la fuerza o
magnitud de un fenómeno. El coeficiente de correlación es una
medida del tamaño del efecto para la relación (lineal) entre dos
variables numéricas.
Para interpretar qué tan fuerte es la correlación podemos utilizar el
criterio de Cohen (1988)3, quien para valores absolutos indica que
valores entre:
.1-.3 representan un efecto pequeño,
.3-.5 un efecto medio y
≥.5 un efecto grande.
Son valores arbitrarios que te pueden servir de guía, pero te
recomiendo interpretar la fuerza (o tamaño) de la correlación
según el contexto de tu investigación. No es lo mismo analizar
datos de un experimento físico controlado donde habrá poco
ruido en los datos, que analizar datos sociales o biológicos
donde se espera encontrar menores valores de correlación
debido a la gran cantidad de dispersión o variabilidad de los
datos.
Cómo se mide la correlación
Veamos ahora los coeficientes de correlación más utilizados.
En estadística, el coeficiente de
correlación de Pearson es una medida
de dependencia lineal entre dos
variables aleatorias cuantitativas. A
diferencia de la covarianza, la
correlación de Pearson es
independiente de la escala de medida
de las variables.
De manera menos formal, podemos
definir el coeficiente de
correlación de Pearson como un
índice que puede utilizarse para
medir el grado de relación de dos
variables siempre y cuando
ambas sean cuantitativas y
continuas.
Tenemos el coeficiente de correlación lineal de Pearson que se
sirve para cuantificar tendencias lineales, y el coeficiente de
correlación de Spearman que se utiliza para tendencias de
aumento o disminución, no necesariamente lineales pero sí
monótonas (las variables tienden a moverse en la misma
dirección relativa, pero no necesariamente a un ritmo
constante; Figura 2).
Relación lineal y relación no lineal (monótona).
Vemos representado con una «r» negra el
coeficiente de Pearson y con una «s» en rojo el de
Spearman. Cuando la relación es lineal, ambos
coeficientes coinciden (valen 1), pero cuando la
relación no es lineal el coeficiente de correlación
de Spearman representa mejor la relación
entre las variables
8
El coeficiente de correlación lineal de Pearson mide una
tendencia lineal entre dos variables numéricas.
Es el método de correlación más utilizado, pero asume que:
la tendencia debe ser de tipo lineal.
no existen valores atípicos (outliers).
Las variables deben ser numé Si las variables son de tipo ordinal
(como las preguntas en escala de likert), no podremos aplicar la
correlación de Pearson.
Tenemos suficientes datos (algunos autores recomiendan tener
más de 30 puntos u observaciones).
Los dos primeros supuestos se pueden evaluar simplemente con
un diagrama de dispersión, mientras que para los últimos basta
con mirar los datos y evaluar el diseño que tenemos.
El coeficiente de correlación de Spearman mide una
tendencia monótona (creciente o decreciente) entre dos
variables. Está basado en los rangos de los valores.
En los casos donde no se cumplen los requisitos del coeficiente
de correlación lineal de Pearson, es conveniente utilizar la
correlación de Spearman. Es una prueba no paramétrica (no
asume una distribución previa de los datos) y es más robusta
frente a la presencia de outliers que la prueba paramétrica de
Pearson
9
ARQUITECTA GENOVEVA LUCAS MAZARIEGOS
EGRESADA DE LA UNIVERSIDAD SAN CARLOS DE GUATEMALA.
DOCENTE DE MATEMATICAS Y ESTADISTICA EN LA
UNIVERSIDAD MARIANO GALVEZ.
TRABAJA ACTUALMENTE EN ASASGUA (Asociación de
azucareros)
Profesional, madre de familia,
digna de admirar, gracias a su
esfuerzo se ha logrado posicionar
en una jerarquía que marca la
diferencia haciéndonos saber que
con metas y objetivos podemos
lograr nuestros sueños.
Como alumnos de Estadística l de
Administración de la UMG
estamos agradecidos por la
enseñanza y motivación en este
nuevo método de aprendizaje
virtual.
10
QUÉ MIDE EL COEFICIENTE DE CORRELACIÓN
El coeficiente de correlación r de Pearson expresa en qué grado los sujetos tienen el mismo orden
en dos variables. Si los sujetos más altos pesan más y los más bajitos pesan menos, entre peso y
altura tendremos una correlación positiva: a mayor altura, mayor peso. Si los de más edad corren
más despacio y los más jóvenes corren más deprisa, entre edad y velocidad tendremos una
correlación negativa; a mayor edad, menor velocidad. Los coeficientes de correlación pueden ser
por lo tanto positivos o negativos. Lo que expresan estos coeficientes se entiende bien mediante
su representación gráfica, los diagramas de dispersión en los que las dos variables están
simbolizadas con las letras X e Y.
Cuando se estudian en forma conjunta dos características (variables estadísticas) de una población
o muestra, se dice que estamos analizando una variable estadística bidimensional. La correlación
es el grado de relación que existe entre ambas características, y la regresión es la forma de
expresar matemáticamente dicha relación.
Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo
el valor de la otra variable.
NOTA: Te recomiendo siempre comenzar a analizar la
Correlación realizando un diagrama de dispersión
entre las variables que quieres analizar.
11
1 VARIABLE CUANTITATIVA 10 DIAGRAMA DE SECTORES
2 MUESTRA 11 MODA
3 HISTOGRAMA 12 CENTRALIZACION
4 POBLACION 13 VARIABLE CUALITATIVA
5 PARAMETROS ESTADISTICOS 14 CONTINUA
6 MEDIA 15 INTERVALOS
7 MEDIANA 16 INDIVIDUO
8 DIAGRAMA DE BARRAS 17 DISCRETA
9 TABLA DE FRECIENCIAS
12
COEFICIENTES DE
CORRELACION
Los coeficientes de correlación son medidas
que indican la situación relativa de los mismos
sucesos respecto a las dos variables, es decir,
son la expresión numérica que nos indica el
grado de relación existente entre las 2
variables y en qué medida se relacionan. Son
números que varían entre los límites +1 y -1.
Su magnitud indica el grado de asociación
entre las variables; el valor r = 0 indica que no
existe relación entre las variables; los valores ±
1 son indicadores de una correlación perfecta
positiva (al crecer o decrecer X, crece o
decrece Y) o negativa (Al crecer o decrecer X,
decrece o crece Y).
Correlación Negativa
Para interpretar el coeficiente de correlación
utilizamos la siguiente escala:
Valor
-1
Significado
Correlación negativa grande y
perfecta
-0,9 a -0,99 Correlación negativa muy alta
-0,7 a -0,89 Correlación negativa alta
-0,4 a -0,69 Correlación negativa moderada
-0,2 a -0,39 Correlación negativa baja
-0,01 a -0,19 Correlación negativa muy baja
0 Correlación nula
No hay correlación
0,01 a 0,19 Correlación positiva muy baja
0,2 a 0,39 Correlación positiva baja
0,4 a 0,69 Correlación positiva moderada
0,7 a 0,89 Correlación positiva alta
0,9 a 0,99 Correlación positiva muy alta
1
Correlación positiva grande y
perfecta
13
COEFICIENTE DE CORRELACIÓN
DE KARL PEARSON
Llamando también coeficiente de
correlación producto-momento.
a) Para datos no agrupados se calcula
aplicando la siguiente ecuación:
Correlación Positiva
r = Coeficiente producto-momento de
correlación lineal
14
Según el
número de
variables.
Gráfico de clasificación
Correlación
Según la relación
entre variables.
Correlación
simple.
Correlación
múltiple.
La variable
dependiente
actúa sobre la
variable
independiente.
Cuando la
variable
dependiente
actúa sobre la
variable
independiente.
Clasificación
de la
corrección
Correlación
lineal.
Se representa
mediante una
línea recta.
Correlación no
lineal.
Se representa
con una línea
curva.
Correlación parcial.
Es cuando la relación
que existe entre una
variable
independiente y
dependiendo los
factores son
cortantes.
Según el valor
cuantitativo.
Según el signo.
Correlación
positiva.
Es cuando
una
disminuye y
la otra
aumenta.
Correlación
perfecta.
El valor de los
coeficientes de
correlación es 1.
Correlación
imperfecta. El
coeficiente de
correlación es menor
a 1. Sea positivo o
negativo
Correlación nula.
El coeficiente de
correlación es 0.
15
Y Exportaciones
Y Exportaciones
TEMA 5
EJEMPLO: Empresa sector citrícola
Gasto Marketing Exportaciones
(miles €) (miles €)
X Y Y*=a+bX Menu insertar, opción función:
Año 1 6 600 a= -99.1810345 función estadística =intersección.eje
Año 2 7.8 760 b= 113.936782 función estadística =pendiente
Año 3 10.2 1080 R 2 = 0.99481355 función estadística =coeficiente.R2
Año 4 12 1265
1300
1100
900
700
500
4 6 8 10 12 14
X Gasto Marketing
Gráfico XY (dispersión)
1300
Y* = -99,181+113,94X
R 2 = 0,9948
1100
900
700
500
4 6 8 10 12 14
X Gasto Marketing
16
Instrucciones para representar la recta de regresión en el gráfico:
1) Pinchar el gráfico XY(dispersión) con el ratón,
2) Elegir el menú "Gráfico"
3) Elegir la opción "Agregar línea de tenencia",
4) Elegir "Tipo de tendencia o regresión": Lineal,
5) En la solapa "Opciones", marcar las opciones "Presentar ecuación el gráfico"
y "Presentar el valor de R cuadrado en el gráfico".
X Y Y*=a+bX e=Y-Y*
6 600 584.4398 15.5602
7.8 760 789.52604 -29.5260
10.2 1080 1062.97436 17.0256
12 1265 1268.0606 -3.0606
3705 3705 0
Obtención de los parámetros de la recta de regresión con el menú "Herramientas", opción "Análisis de Datos",
función de análisis: "Regresión" de Excel.
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.997403402
Coeficiente de determinación R^2 0.994813546
R^2 ajustado 0.992220319
Error típico 26.58144608
Observaciones 4
Coeficientes
Intercepción -99.18103448
X 113.9367816
Análisis de los residuales
Observación Pronóstico Y Residuos
1 584.4396552 15.56034483
2 789.5258621 -29.52586207
3 1062.974138 17.02586207
4 1268.060345 -3.060344828
17
i
18
Ejemplo ilustrativo:
Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el
tipo de correlación que existe entre ellas mediante el coeficiente de PEARSON.
X 18 17 15 16 14 12 9 15 16 14 16 18
Y 13 15 14 13 9 10 8 13 12 13 10 8
SX
=180
SY=
138
Solución:
Se calcula la media aritmética
Se llena la siguiente tabla:
19
Se aplica la fórmula:
Existe una correlación moderada
En Excel se calcula de la siguiente manera:
a) Se inserta la función COEF.DE.CORREL y pulsar en Aceptar.
20
b) En el cuadro de argumentos de la función, en el recuadro de la Matriz 1 seleccionar las
celdas de X, y en el recuadro de la Matriz 2 seleccionar las celdas de Y.
c) Pulsar en Aceptar.
21
DIAGRAMA DE DISPERSIÓN
Los diagramas de dispersión son planos cartesianos en los que se marcan los puntos
correspondientes a los pares ordenados (X,Y) de los valores de las variables.
El diagrama de dispersión en Excel se realiza de la siguiente manera:
a) Seleccionar los datos e insertar diagrama de dispersión.
22
b) En diagrama dispersión, escoger el primero.
c) Para que ver las coordenadas escoger el diseño N° 7.
23
d) Borrar Serie 1, las líneas horizontales y verticales (haciendo clic y suprimir en cada
objeto).
e) En título del gráfico escribir Diagrama de dispersión.
f) Clic en el eje x, y luego clic derecho para dar formato al eje.
24
g) Poner 2 en la casilla unidad mayor para ver los números de 2 en 2 en el eje x.
25
h) Clic en Cerrar para culminar la elaboración del diagrama de dispersión, aunque se le
puede seguir haciendo más mejoras.
26
Para realizar el diagrama de dispersión en el programa Graph se procede de la siguiente
manera:
a) Clic en Función.
b) Clic en Insertar serie de puntos.
27
RESPUESTA
28
29
INFORMATE DEL
COVID-19
Los adultos mayores y las personas con
ciertas afecciones subyacentes, como
enfermedades cardiacas o pulmonares o
diabetes, corren mayor riesgo de enfermarse
gravemente a causa del COVID-19. Encuentre
más información en la página ¿Tiene usted
un mayor riesgo de presentar un caso grave
de enfermedad.
Cómo se propaga
En estos momentos no existe una vacuna
para prevenir la enfermedad del coronavirus
2019 (COVID-19).
La mejor manera de prevenir la enfermedad
es evitar la exposición a este virus.
Se cree que el virus se propaga
principalmente de persona a persona..
Entre personas que están en contacto
cercano (a una distancia de hasta
aproximadamente 6 pies).
A través de gotitas respiratorias que se
producen cuando una persona infectada
tose, estornuda o habla.
30
DEPORTES
NUEVA
CONCEPCIÓN
El Club Deportivo Nueva Concepción
usualmente conocido como Deportivo Nueva
Concepción es un equipo de fútbol con sede
en la localidad de Nueva Concepción
(Escuintla), participa en la Primera División de
Guatemala.
Futbolista destacada internacional de Nva.
Concepción
JENIFER ORTIZ Gracias por poner ese ha destacado por su
increíble talento futbolístico, se desarrolló en el club deportivo
Nueva Concepción, ahora se va a las competiciones más grandes.
Poniendo en alto en Guatemala.
Nueva Concepción hay talento! Solo debemos apoyar... dejemos
un mensaje de motivación a
JENIFER! Seguramente
Jennifer los responderá
desde España
31
Universidad Mariano Gálvez
Nueva Concepción
Y CONOCEREIS LA VERDAD, Y LA
VERDAD OS HARA LIBRE
32