11.07.2015 Views

Programa Análisis Exploratorio de Datos 2011.pdf - Departamento ...

Programa Análisis Exploratorio de Datos 2011.pdf - Departamento ...

Programa Análisis Exploratorio de Datos 2011.pdf - Departamento ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

PROGRAMA OFICIAL DE POSTGRADO EN ESTADÍSTICA E INVESTIGACIÓN OPERATIVA DATOS IDENTIFICATIVOS DE LA MATERIA Código <strong>de</strong> la materia: --Nombre <strong>de</strong> la materia: <strong>Análisis</strong> <strong>Exploratorio</strong> <strong>de</strong> <strong>Datos</strong>Número <strong>de</strong> créditos ECTS: 6 Curso académico: 2011/2012 Profesorado: Javier Roca Pardiñas (UVigo): 1.5 ECTS (Coordinador <strong>de</strong> la materia) M. Carmen Iglesias Pérez (UVigo): 1.5 ECTS Ana Pérez González (UVigo): 3 ECTS OBJETIVOS Y COMPETENCIAS DE LA MATERIA 1. Compren<strong>de</strong>r la finalidad, resultados y beneficios <strong>de</strong>l análisis <strong>de</strong> un conjunto<strong>de</strong> datos, así como <strong>de</strong> sus requerimientos, con el fin <strong>de</strong> permitir una mejormo<strong>de</strong>lización <strong>de</strong> problemas y experimentos.2. Adquirir una visión general <strong>de</strong> los gran<strong>de</strong>s grupos <strong>de</strong> problemas en laminería <strong>de</strong> datos y <strong>de</strong> los grupos <strong>de</strong> técnicas más apropiadas pararesolverlos.3. Conocer la metodología genérica <strong>de</strong> un proyecto <strong>de</strong> minería <strong>de</strong> datos en elque se encuadran las diferentes técnicas estadísticas que se tratan en elmáster.4. Conocer los conceptos, y técnicas numéricas y gráficas, esenciales para el<strong>de</strong>scubrimiento y entendimiento <strong>de</strong> las estructuras y relaciones contenidasen un conjunto <strong>de</strong> datos.


5. Descubrir la problemática <strong>de</strong>l análisis <strong>de</strong> un conjunto <strong>de</strong> datos, con el fin <strong>de</strong>motivar conceptos y técnicas <strong>de</strong> la teoría <strong>de</strong> la probabilidad y <strong>de</strong> laestadística matemática.6. Conocer el panorama <strong>de</strong> software disponible para la minería <strong>de</strong> datos, asícomo saber aplicar cada técnica estudiada mediante alguna herramientainformática.CONTENIDOS DE LA MATERIA 1. Introducción al análisis exploratorio <strong>de</strong> datos: conceptos <strong>de</strong>población, muestra, tipos <strong>de</strong> variables. Manejo <strong>de</strong>l softwareestadístico r.2. <strong>Análisis</strong> <strong>de</strong>scriptivo unidimensional: medidas <strong>de</strong>scriptivas numéricas,creación <strong>de</strong> gráficos, <strong>de</strong>tección <strong>de</strong> datos atípicos, estudio <strong>de</strong> lanormalidad <strong>de</strong> los datos.3. <strong>Análisis</strong> <strong>de</strong> dos o más variables: tablas <strong>de</strong> correlación y <strong>de</strong>contingencia. Gráficos para dos variables. <strong>Análisis</strong> <strong>de</strong> variablescualitativas. Medidas <strong>de</strong> asociación y <strong>de</strong> correlación. Comparación <strong>de</strong>distribuciones: test paramétricos y no paramétricos.4. Estudio <strong>de</strong> las distribuciones condicionadas; análisis <strong>de</strong> lavarianza, mo<strong>de</strong>lo <strong>de</strong> regresión lineal simple y múltiple, mo<strong>de</strong>lo <strong>de</strong>regresión paramétricos no lineales, regresión logística. Mo<strong>de</strong>los <strong>de</strong>regresión no paramétricos.5. Introducción al análisis <strong>de</strong> datos multivariantes análisis <strong>de</strong>componentes principales, análisis factorial, análisis <strong>de</strong> conglomeradosy análisis discriminante.6. Estimación en situaciones especiales: datos faltantes, datosatípicos y datos censurados.7. Introducción al análisis exploratorio <strong>de</strong> datos <strong>de</strong>pendientes: seriestemporales y <strong>de</strong>pen<strong>de</strong>ncia espacial.BIBLIOGRAFÍA BÁSICA Y COMPLEMENTARIABIBLIOGRAFÍA BÁSICA• Abraira Santos, V. y Pérez <strong>de</strong> Vargas, A. (1996). Métodos Multivariantes enBioestadística. Centro <strong>de</strong> Estudios Ramón Areces.• Crawley , M. J. (2005) Statistics: anintroduction using R. Ed. John Wiley and Sons.• Everitt, B. S. (2005) An R and S-PLUS Companion to Multivariate Analysis. Ed.Springer• Guisan<strong>de</strong> González, C. y Vaamon<strong>de</strong> Liste A. (2011). Tratamiento <strong>de</strong> datos con R,Statistica y SPSS. Ed. Diaz <strong>de</strong> Santos Editores.


• Hair J. F., An<strong>de</strong>rson, Tatham and Black (1996). <strong>Análisis</strong> multivariante. 5ª Edición.Prentice Hall.• Martinez Almécija, Alfredo y otros (1993). Inferencia Estadística. Un enfoque clásico.Pirámi<strong>de</strong>.• Peña Sánchez <strong>de</strong> Rivera, D. (1994). Estadística. Mo<strong>de</strong>los y Métodos. 1. Fundamentos.Alianza Universidad Textos.• Peña Sánchez <strong>de</strong> Rivera, D. (1999). Estadística. Mo<strong>de</strong>los y Métodos. 2. Mo<strong>de</strong>losLineales y Series Temporales. Alianza Universidad Textos.• TUKEY, J.W. (1977). Exploratory Data Analysis. Addison-Wesley• Zuur, Alain F.( 2009) A Beginner's gui<strong>de</strong> to R. New York . Springer.BIBLIOGRAFÍA COMPLEMENTARIA• AGRESTI, A. (1996): An Introduction to Categorical Data Analysis, John Wiley, NuevaYork.• Cowpertwait, P.S.P. and Metcalfe, A. V. (2009). Introductory Time Series with R. Ed.Springer.• Maindonald, J. H. (2007) Data analysis and graphics using R : an example-basedapproach. Cambridge University Press.• Rousseeuw P.J., Leroy A.M. (2003) Robust regression and outlier <strong>de</strong>tection JohnWiley and Sons.• Sheather, S. J . (2009) A mo<strong>de</strong>rn approach to regression with R. New York ; London: Springer.METODOLOGÍA DOCENTE: ACTIVIDADES DE APRENDIZAJE Y SUVALORACIÓN EN CRÉDITOS ECTSSesión magistral La docencia se <strong>de</strong>sarrollará mediante la exposición por parte <strong>de</strong>lprofesor <strong>de</strong> las diferentes técnicas <strong>de</strong> <strong>Análisis</strong> <strong>Exploratorio</strong> <strong>de</strong> <strong>Datos</strong> Para ello, losalumnos dispondrán <strong>de</strong> apuntes elaborados que servirán <strong>de</strong> material básico para elestudio y en su <strong>de</strong>fecto <strong>de</strong> material e información sobre bibliografía específicadisponible en la biblioteca o en internet.Prácticas <strong>de</strong> laboratorio La docencia se <strong>de</strong>sarrollará mediante la resolución <strong>de</strong>problemas reales o simulados utilizando los mo<strong>de</strong>los tratados en las sesionesmagistrales. Se utilizará principalmente software R.Tutoría en grupoSe mantendrá un servicio <strong>de</strong> tutoría en grupo a los alumnos.


CRITERIOS Y MÉTODOS DE EVALUACIÓNLos criterios <strong>de</strong> evaluación abarcarán el conocimiento teórico y la competenciapráctica sobre los contenidos <strong>de</strong> la asignatura.• Pruebas prácticas, <strong>de</strong> ejecución <strong>de</strong> tareas reales y/o simuladas.Realización <strong>de</strong> un examen final teórico práctico. 60 %• Resolución <strong>de</strong> problemas y/o ejerciciosRealización <strong>de</strong> cuestionarios y activida<strong>de</strong>s que sean planteadas duranteel periodo <strong>de</strong> docencia da materia. 40%TIEMPO DE ESTUDIO Y DE TRABAJO PERSONAL QUE DEBE DEDICARUN ESTUDIANTE PARA SUPERAR LA MATERIA5 horas semanales. RECOMENDACIONES PARA EL ESTUDIO DE LA MATERIANo se necesita haber cursado ninguna otra asignatura <strong>de</strong>l máster.Una <strong>de</strong> las recomendaciones fundamentales para la superación <strong>de</strong> esta materia es laasistencia regular a las clases.Es muy importante el seguimiento <strong>de</strong>l trabajo realizado en el aula. Los requisitosbásicos <strong>de</strong> esta materia sólo son un uso a nivel usuario <strong>de</strong> Windows y un conocimientobásico <strong>de</strong> Estadística. El software utilizado será el software libre R. En algunas sesionesse realizarán cuestionarios y ejercicios sobre temas impartidos para la valoración <strong>de</strong> laevolución y comprensión <strong>de</strong> los alumnos sobre la materia.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!