Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
UNIVERSIDAD DE CARABOBO FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA INDUSTRIAL MODELACIÓN ESTADÍSTICA DEL TIEMPO DE BÚSQUEDA DEL PRIMER EMPLEO CASO: INGENIEROS INDUSTRIALES DE LA UNIVERSIDAD DE CARABOBO Tutor: Autores: Dr. Carlos Martínez - Br. Asdrúbal Freites C. - Br. José Guerrero Valencia, Junio 2014 UNIVERSIDAD DE CARABOBO FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA INDUSTRIAL MODELACIÓN ESTADÍSTICA DEL TIEMPO DE BÚSQUEDA DEL PRIMER EMPLEO CASO: INGENIEROS INDUSTRIALES DE LA UNIVERSIDAD DE CARABOBO Trabajo Especial de Grado presentado ante la ilustre Universidad de Carabobo para optar al Título de Ingeniero Industrial Tutor: Autores: Dr. Carlos Martínez - Br. Asdrúbal Freites C. - Br. José Guerrero Línea de Investigación: Probabilidades y Estadística Valencia, Junio 2014 UNIVERSIDAD DE CARABOBO FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA INDUSTRIAL CERTIFICADO DE APROBACIÓN Quienes suscriben, Miembros del Jurado designado por el Consejo de Escuela de la Facultad de Ingeniería de la Universidad de Carabobo, para examinar el Trabajo Especial de Grado titulado “MODELACIÓN ESTADÍSTICA DEL TIEMPO DE BÚSQUEDA DEL PRIMER EMPLEO. CASO: INGENIEROS INDUSTRIALES DE LA UNIVERSIDAD DE CARABOBO”, el cual está adscrito a la Línea de Investigación “Probabilidades y Estadística” del Departamento de Investigación Operativa, presentado por los bachilleres Asdrúbal Freites Corona, C.I. 08.836.853 y José Antonio Guerrero Campos, C.I. 11.220.330, a los fines de cumplir con el requisito académico exigido para optar al Título de Ingeniero Industrial, dejan constancia de lo siguiente: 1. Leído como fue dicho Trabajo Especial de Grado, por cada uno de los Miembros del Jurado, éste fijó el día miércoles 04 de junio de 2014, a las 09:30 am., para que los autores lo defendieran en forma pública, lo que éstos hicieron, en la Sala de Conferencias de la Escuela, mediante un resumen oral de su contenido, luego de lo cual respondieron satisfactoriamente a las preguntas que le fueron formuladas por el Jurado, todo ello conforme a lo dispuesto en el Reglamento del Trabajo Especial de Grado de la Universidad de Carabobo y a las Normas de elaboración de Trabajo Especial de Grado de la Facultad de Ingeniería de la misma Universidad. 2. Finalizada la defensa pública del Trabajo Especial de Grado, el Jurado decidió aprobarlo por considerar que se ajusta a lo dispuesto y exigido en el precitado Reglamento. En fe de lo cual se levanta la presente acta, el 04 de junio de 2014, dejándose también constancia de que actuó como Coordinador del Jurado el Tutor, Prof. Carlos Martínez Firma del Jurado Examinador. Prof. Carlos Martínez Presidente del Jurado Prof. Ruth Illada Prof. Eduardo Vargas Miembro del Jurado Miembro del Jurado iv AGRADECIMIENTOS Después de una larga travesía y llegar a la culminación de mi carrera como Ingeniero Industrial, aún cuando el mismo se traduce en un logro personal, resulta injusto pensar en no agradecer a aquellas personas e instituciones que hicieron posible el feliz término de este sueño: Primeramente al Dios creador de lo tangible e intangible, a la Virgen Santísima y al Dr. José Gregorio Hernández, por permitirme vivir una segunda oportunidad en este mundo. Al Prof. Carlos Martínez, quien más que un tutor, gran amigo y excelente guía. A los Profesores Yamile Delgado de Smith, Zaida Osto y Andrés Giménez, por sus invaluables aportes como validadores expertos del instrumento aplicado en esta investigación. A los Profesores Ninoska Maneiro (+) , Ruth Illada, Karelys Osta, Florángel Ortíz, Manuel Jiménez, Agustín Mejías y Carmen Guédez, por su constante estímulo y preocupación en la prosecución de mi carrera. A la Prof. Maritza Gudiño, sus palabras y ayuda me motivaron a retomar los estudios. A Nico Matson (Dirección General de Asuntos Estudiantiles de la UC), Raúl Martínez (Dirección de Asuntos Estudiantiles de Ingeniería), María Eugenia Troconis (Egreamigos UC) y al Ing. Franklin López, Presidente del Centro de Ingenieros del Edo. Carabobo, por la colaboración prestada para ubicar la data necesaria en la realización del estudio. A mi compañero de tesis, José Guerrero, amigo de tantos años. A todos mis profesores y compañeros de clase. A la centenaria Universidad de Carabobo y su Escuela de Ingeniería Industrial. A todos... Infinitas gracias. ASDRÚBAL FREITES CORONA "Señor que tanto me has dado, sé misericordioso y concédeme algo más: Un corazón agradecido" / Apóstol Pablo v Mi especial agradecimiento al Ing. Carlos Martínez, por habernos proporcionado el tema y su posterior tutoría. Agradezco también a los profesores Carmen Guédez, Manuel Jiménez y Andrés Giménez, por dedicar de su tiempo en la asesoría metodológica. A mi querido compañero tesista, Asdrúbal Freites; mi sincero agradecimiento por la armonía desarrollada durante la realización del Proyecto de Grado. En fin, a todos los que de alguna manera directa o indirectamente fueron parte de este trabajo, eternamente agradecidos. JOSÉ GUERRERO vi DEDICATORIAS A mis queridos Padres Jacoba y César, forjadores de una familia no abundante de bienes materiales, pero sí de valores y buenos principios. A mi fiel y amada esposa Tibisay, mi eterna novia y compañera de tantos años, brindando siempre una palabra de aliento en momentos de incertidumbre en la carrera, te amo. A mis dos grandes tesoros Ariana y Adrián, los cuales son la razón de mi existencia y a quienes trato de enseñarles siempre con acciones, el mejor de los ejemplos. A mis hermanos Yajaira y César, a veces cercanos, otras distantes, pero siempre conmigo. Asdrúbal Freites Corona A Dios, por ser la fuerza; el impulso que nos lleva, al logro de toda meta. A mis Padres, por el cariñoso apoyo siempre incondicional; este Título también les pertenece. A todos mis profesores y amigos de aula, por la paciencia prestada hacia mí. José Guerrero vii ÍNDICE GENERAL Pág. ÍNDICE DE FIGURAS .............................................................................................. ix ÍNDICE DE TABLAS ............................................................................................... xv RESUMEN ............................................................................................................... xvi INTRODUCCIÓN ...................................................................................................... 1 CAPÍTULO I: EL PROBLEMA 1.1.- Planteamiento del problema ................................................................................. 3 1.2.- Objetivos ............................................................................................................. 6 1.2.1.- Objetivo General .................................................................................... 6 1.2.2.- Objetivos Específicos ............................................................................. 6 1.3.- Justificación ......................................................................................................... 7 1.4.- Alcances y Limitaciones ...................................................................................... 7 CAPÍTULO II: MARCO TEÓRICO 2.1.- Antecedentes........................................................................................................ 8 2.2.- Marco Teórico ................................................................................................... 10 2.2.1.- AnálisisDescriptivo de Variables ......................................................... 10 2.2.2.- Análisis de Supervivencia .................................................................... 14 2.2.3.- Estimador de Kaplan-Meier .................................................................. 17 2.2.4.- Comparación de Funciones de Supervivencia ....................................... 23 2.2.5.- Modelo de Regresión de Cox................................................................ 25 2.2.6.- Estimación de parámetros del modelo de Cox....................................... 28 2.2.7.- Técnicas de Discriminación Estadística ................................................ 35 CAPÍTULO III: MARCO METODOLÓGICO 3.1.- Nivel y Diseño de la Investigación ..................................................................... 37 3.2.- Población y Muestra .......................................................................................... 38 3.3.- Fuentes y Técnicas para la Recolección de la Información ................................. 40 viii 3.4.- Técnicas de Procesamiento y Análisis de la Información .................................... 40 3.5.- Fases de la Investigación .................................................................................... 41 CAPÍTULO IV: ANÁLISIS E INTERPRETACIÓN DE LOS RESULTADOS 4.1.- Análisis Descriptivo de la Muestra ..................................................................... 44 4.1.1.- Datos Personales y Familiares .............................................................. 45 4.1.2.- Datos Académicos ............................................................................... 59 4.1.3.- Datos Laborales.................................................................................... 67 4.1.4.- Características de la Búsqueda del Primer Empleo como Ingeniero(a) Industrial ................................................................ 69 4.1.5.- Percepción de su Formación Profesional .............................................. 78 4.2.- Modelación Estadística del Tiempo de Búsqueda del Primer Empleo de los Egresados de la Escuela de Ingeniería Industrial de la Universidad de Carabobo ........................................................................... 82 4.2.1.- Covariables Utilizadas .......................................................................... 84 4.2.2.- Modelo de Kaplan-Meier...................................................................... 86 4.2.3.- Modelo de Riesgos Proporcionales de Cox ........................................... 88 CAPÍTULO V: CONCLUSIONES Y RECOMENDACIONES 5.1.- Conclusiones...................................................................................................... 96 5.2.- Recomendaciones ............................................................................................ 100 REFERENCIAS BILIOGRÁFICAS ...................................................................... 101 ANEXOS Anexo 1: Cuestionario Virtual .................................................................................. 107 Anexo 2: Formatos de Validación de Expertos del Instrumento de Recolección de Datos ........................................................................... 121 Anexo 3: Funciones de Supervivencia de las Covariables Estudiadas ....................... 138 Anexo 4: Test Estadísticos de las Covariables No Significativas en el Análisis de Kaplan-Meier ................................................................. 157 ix ÍNDICE DE FIGURAS Pág. Figura 1. Frecuencia de respuestas obtenidas durante el estudio .......................... 44 Figura 2. Género de la muestra ............................................................................ 45 Figura 3. Histograma de frecuencia y distribución de la edad de la muestra al momento de graduarse ...................................................................... 46 Figura 4. Nacionalidad ........................................................................................ 46 Figura 5. Poseer licencia de conducir al graduarse ............................................... 47 Figura 6. Poseer vehículo propio al graduarse...................................................... 47 Figura 7. Estar inscrito en el Servicio Militar o tener algún tipo de instrucción militar al momento de graduarse ......................................... 48 Figura 8. Estado Civil al momento de graduarse .................................................. 48 Figura 9. Número de hijos que tenía al momento de graduarse ............................ 49 Figura 10. Rasgos físicos....................................................................................... 49 Figura 11. Índice de Masa Corporal al momento de graduarse ............................... 50 Figura 12. Color de los ojos .................................................................................. 51 Figura 13. Temperamento ..................................................................................... 51 Figura 14. Presentar alguna discapacidad al momento de graduarse ....................... 52 Figura 15. Presentar alguna señal particular visible cuando egresó ........................ 52 Figura 16. Religión ............................................................................................... 53 Figura 17. Casa donde vivía al momento de graduarse .......................................... 53 Figura 18. Lugar donde vivía al momento de graduarse ......................................... 54 Figura 19. Sostenimiento económico durante la carrera ......................................... 54 Figura 20. Grado de instrucción de la madre ......................................................... 55 Figura 21. Ocupación de la madre ......................................................................... 55 Figura 22. Grado de instrucción del padre ............................................................. 56 Figura 23. Ocupación del padre ............................................................................. 56 Figura 24. Histograma de frecuencia y distribución de la relación Ingreso Familiar / Salario Mínimo .................................................................... 57 Figura 25. Histograma de frecuencia y distribución del Grupo Familiar ................ 58 x Figura 26. Motivación recibida del grupo familiar ................................................. 59 Figura 27. Ser egresado en otra carrera al momento de graduarse .......................... 59 Figura 28. Histograma de frecuencia y distribución de los semestres cursados durante la carrera .................................................................................. 60 Figura 29. Histograma de frecuencia y distribución del promedio de notas ............ 61 Figura 30. Histograma de frecuencia y distribución del puesto de promoción ........ 62 Figura 31. Tener dominio del idioma Inglés al momento de graduarse .................. 63 Figura 32. Tener dominio básico de computación .................................................. 63 Figura 33. Horas aprobadas en Congresos, Foros, Seminarios o similares durante la carrera .................................................................................. 64 Figura 34. Publicar artículos, resúmenes de ponencias, guías, problemarios o similares durante la carrera ................................................................... 65 Figura 35. Obtener menciones honoríficas o premiaciones al estudio durante la carrera .............................................................................................. 65 Figura 36. Áreas del conocimiento donde fue sobresaliente durante la carrera ....... 66 Figura 37. Trabajar en Áreas Relacionadas con la carrera durante la carrera ..........67 Figura 38. Realizar pasantías durante la carrera ..................................................... 67 Figura 39. Tener experiencia docente durante la carrera ........................................ 68 Figura 40. Tener experiencia como líder social durante la carrera .......................... 68 Figura 41. ¿Buscó trabajo inmediatamente después de graduarse? ......................... 69 Figura 42. Principal motivo para no buscar trabajo al momento de graduarse ........ 69 Figura 43. Histograma de los meses que tardó el egresado, desde el mismo momento en el que realmente comenzó a buscar su primer empleo como Ingeniero Industrial hasta conseguirlo ......................................... 70 Figura 44. Causas por las cuáles cree que ha buscado y todavía no ha encontrado su primer empleo ................................................................ 71 Figura 45. Estrategias utilizadas para la búsqueda de su primer empleo como Ingeniero Industrial .............................................................................. 71 Figura 46. Estrategia más efectiva para la búsqueda de su primer empleo como Ingeniero Industrial ..................................................................... 72 Figura 47. Ubicación de la empresa donde consiguió su primer empleo ................. 72 xi Figura 48. Conocimientos, habilidades y competencias que fueron determinantes para conseguir su primer empleo como Ingeniero Industrial .............................................................................................. 73 Figura 49. Haber trabajado como pasante en la empresa donde consiguió su primer empleo como Ingeniero Industrial ............................................. 74 Figura 50. Cargo inicial al conseguir su primer empleo como Ingeniero Industrial .............................................................................................. 75 Figura 51. Relación Sueldo Inicial / Salario Mínimo al momento de conseguir el primer empleo .................................................................. 76 Figura 52. Principales actividades que desempeña o desempeñó el egresado en su primer empleo como Ingeniero Industrial .................................... 77 Figura 53. Fortalezas presentes en la Escuela de Ingeniería Industrial de la Universidad de Carabobo ..................................................................... 78 Figura 54. Debilidades presentes en la Escuela de Ingeniería Industrial de la Universidad de Carabobo ..................................................................... 79 Figura 55. Modificaciones sugeridas al plan de estudio cursado en la Escuela de Ingeniería Industrial de la Universidad de Carabobo ........................ 80 Figura 56. Áreas del conocimiento que le gustaría reforzar en el caso de querer realizar o estar realizando su Postgrado en Ingeniería Industrial de la Universidad de Carabobo ............................................. 81 Figura 57. Tiempo de duración de la carrera .......................................................... 82 Figura 58. Función de Supervivencia global del Tiempo de Búsqueda del Primer Empleo de los encuestados ........................................................ 87 Figura 59. Función de Supervivencia de las Covariables obtenidas en el Modelo de Riesgos Proporcionales de Cox ........................................... 90 Figura 60. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la covariable Número de Hijos al momento de graduarse ......................... 91 Figura 61. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la covariable Estado Civil al momento de graduarse ................................. 92 Figura 62. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la covariable Color de los Ojos ................................................................. 93 xii Figura 63. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la covariable Edad al momento de graduarse ............................................ 94 Figura 64. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la covariable Edad al momento de graduarse ............................................ 95 Figura A3.1. Función de Supervivencia de la Covariable Género ............................ 139 Figura A3.2. Función de Supervivencia de la Covariable Edad al momento de graduarse ............................................................................................ 139 Figura A3.3. Función de Supervivencia de la Covariable Nacionalidad ................... 140 Figura A3.4. Función de Supervivencia de la Covariable Poseer Licencia de Conducir al momento de graduarse ..................................................... 140 Figura A3.5. Función de Supervivencia de la Covariable Estar inscrito en el Servicio Militar o tener algún tipo de instrucción militar al graduarse ............................................................................................ 141 Figura A3.6. Función de Supervivencia de la Covariable Estado Civil al momento de graduarse ........................................................................ 141 Figura A3.7. Función de Supervivencia de la Covariable Números de hijos al momento de graduarse ........................................................................ 142 Figura A3.8. Función de Supervivencia de la Covariable Rasgo Físico ................... 142 Figura A3.9. Función de Supervivencia de la Covariable Índice de Masa Corporal ............................................................................................. 143 Figura A3.10. Función de Supervivencia de la Covariable Color de los Ojos ............ 143 Figura A3.11. Función de Supervivencia de la Covariable Temperamento ................ 144 Figura A3.12. Función de Supervivencia de la Covariable Presentar alguna discapacidad al momento de graduarse ............................................... 144 Figura A3.13. Función de Supervivencia de la Covariable Presentar alguna señal particular visible al momento de graduarse ......................................... 145 Figura A3.14. Función de Supervivencia de la Covariable Religión a la que pertenece ............................................................................................ 145 Figura A3.15. Función de Supervivencia de la Covariable Casa donde vivía al momento de graduarse ........................................................................ 146 xiii Figura A3.16. Función de Supervivencia de la Covariable Lugar donde vivía al graduarse ............................................................................................ 146 Figura A3.17. Función de Supervivencia de la Covariable Sostenimiento económico durante su carrera ............................................................. 147 Figura A3.18. Función de Supervivencia de la Covariable Grado de Instrucción de la Madre ........................................................................................ 147 Figura A3.19. Función de Supervivencia de la Covariable Ocupación de la Madre ................................................................................................. 148 Figura A3.20. Función de Supervivencia de la Covariable Grado de Instrucción del Padre ............................................................................................ 148 Figura A3.21. Función de Supervivencia de la Covariable Ocupación del Padre ....... 149 Figura A3.22. Función de Supervivencia de la Covariable Relación Ingreso Familiar / Salario Mínimo al graduarse ............................................... 149 Figura A3.23. Función de Supervivencia de la Covariable Grupo Familiar del egresado ............................................................................................. 150 Figura A3.24. Función deSupervivencia de la Covariable Motivación recibida del grupo familiar ............................................................................... 150 Figura A3.25. Función de Supervivencia de la Covariable Ser egresado en otra carrera al momento de graduarse ........................................................ 151 Figura A3.26. Función de Supervivencia de la Covariable Semestres cursados en la carrera ............................................................................................ 151 Figura A3.27. Función de Supervivencia de la Covariable Promedio de Notas obtenido en la carrera ......................................................................... 152 Figura A3.28. Función de Supervivencia de la Covariable Puesto ocupado en la Promoción .......................................................................................... 152 Figura A3.29. Función de Supervivencia de la Covariable Tener dominio del Idioma Inglés ..................................................................................... 153 Figura A3.30. Función de Supervivencia de la Covariable Trabajar en Áreas Relacionadas con la carrera durante sus estudios ................................ 153 Figura A3.31. Función de Supervivencia de la Covariable Realizar Pasantías durante la carrera ................................................................................ 154 xiv Figura A3.32. Función de Supervivencia de la Covariable Horas aprobadas en Congresos, Foros, Seminarios o similares durante la carrera ............... 154 Figura A3.33. Función de Supervivencia de la Covariable Haber publicado artículos, resúmenes de ponencias, guías, problemarios o similares durante la carrera ................................................................. 155 Figura A3.34. Función de Supervivencia de la Covariable Haber obtenido menciones honoríficas o premiaciones al estudio durante la carrera ................................................................................................ 155 Figura A3.35. Función de Supervivencia de la Covariable Tener experiencia docente durante la carrera ................................................................... 156 Figura A3.36. Función de Supervivencia de la Covariable Tener experiencia como líder social durante la carrera .................................................... 156 xv ÍNDICE DE TABLAS Pág. Tabla 1. Prueba de igualdad de la función de supervivencia de dos grupos en el tiempo de observación ti...................................................................... 23 Tabla 2. Prueba de igualdad de la función de supervivencia de M grupos en el tiempo de observación ti...................................................................... 24 Tabla 3. Graduandos en la Carrera de Ingeniería Industrial. Universidad de Carabobo. Julio de 2007 a julio de 2012 ................................................. 38 Tabla 4. Estadísticos descriptivos de la edad de la muestra al momento de graduarse ................................................................................................ 46 Tabla 5. Estadísticos descriptivos de la relación Ingreso Familiar / Salario Mínimo .................................................................................................. 57 Tabla 6. Estadísticos descriptivos del grupo familiar del encuestado .................... 58 Tabla 7. Estadísticos descriptivos de los semestres cursados durante la carrera .................................................................................................... 60 Tabla 8. Estadísticos descriptivos del promedio de notas ...................................... 61 Tabla 9. Estadísticos descriptivos del puesto de promoción .................................. 62 Tabla 10. Estadísticos descriptivos de Horas Aprobadas en Congresos, Foros, Seminarios o Similares durante la Carrera .............................................. 64 Tabla 11. Estadísticos descriptivos de los meses que tardó el egresado, desde el mismo momento en el que realmente comenzó a buscar su primer empleo como Ingeniero Industrial hasta conseguirlo .................... 70 Tabla 12. Estadísticos descriptivos de la relación entre el Sueldo Inicial y el Salario Mínimo al momento de conseguir su primer empleo ................... 76 Tabla 13. Media del Tiempo de Supervivencia de las covariables (en meses) ......... 84 Tabla 14. Media del Tiempo de Supervivencia de la muestra global de Ingenieros Industriales de la UC (en meses)............................................ 87 Tabla 15. Covariables Significativas Analizadas y Test Estadísticos....................... 88 Tabla 16. Covariables Resultantes en el Modelo de Riesgos Proporcionales de Cox .................................................................................................... 89 Tabla A4.1. Covariables No-Significativas Analizadas y Test Estadísticos............... 158 xvi UNIVERSIDAD DE CARABOBO FACULTAD DE INGENIERÍA ESCUELA DE INGENIERÍA INDUSTRIAL TRABAJO ESPECIAL DE GRADO: MODELACIÓN ESTADÍSTICA DEL TIEMPO DE BÚSQUEDA DEL PRIMER EMPLEO CASO: INGENIEROS INDUSTRIALES DE LA UNIVERSIDAD DE CARABOBO Tutor: Autores: Dr. Carlos Martínez - Br. Asdrúbal Freites C. C.I. 08.836.853 - Br. José Guerrero Dr. Carlos Martínez C.I. 11.220.330 RESUMEN En este Trabajo Especial de Grado se diseñó una metodología estadística para Modelar el Tiempo de Búsqueda del Primer Empleo significativo de los Ingenieros Industriales de la Universidad de Carabobo desde el momento que efectivamente lo comienza a buscar, hasta que lo consigue. Por las características de los datos, se aplicó la metodología de Análisis de Supervivencia. La población la conformaron los graduandos entre los meses de julio del año 2007 hasta julio de 2012. Se aplicó el Método de Estimación de Kaplan-Meier a la muestra como un conjunto homogéneo, para construir funciones de supervivencia individuales de cada una de las covariables estudiadas. Luego, utilizando el método para poblaciones heterogéneas denominado Modelo de Riesgo Proporcionales de Cox, se introducen al mismo, las covariables externas que resultaron estadísticamente significativas al aplicarles el test estadístico de Log-rank. Estas covariables muestran ciertas características de los egresados, de forma tal que se pueda estimar su posible efecto sobre el tiempo de supervivencia y obtener así el modelo definitivo. Para el análisis de datos y la modelación estadística se utilizó el Lenguaje R. Finalmente, se hicieron las recomendaciones tendientes al mejoramiento de la calidad del perfil del egresado en Ingeniería Industrial de la Universidad de Carabobo. Palabras clave: Primer Empleo, Análisis de Supervivencia, Estimador de Kaplan-Meier, Modelo de Riesgos Proporcionales de Cox. 1 INTRODUCCIÓN Cuando un estudiante culmina sus estudios y finalmente egresa como Ingeniero Industrial de la Universidad de Carabobo, al momento de iniciar la búsqueda de su primer empleo, comienza un proceso en el cual interrelacionan un conjunto de variables que influyen para acortar o alargar el tiempo del mismo. El objetivo de este estudio es construir un modelo estadístico que permita determinar cuáles son estas variables. Por la naturaleza del mismo, se utilizará la técnica de Análisis de Supervivencia, ya que interpreta el análisis de los datos desde un punto de partida hasta el momento que acontece un evento en particular. Otra característica asociada a este tipo de datos es la censura, la cual se refiere a que durante el período que dura el estudio, no se observa el evento en algún individuo en particular. A partir de Análisis de Kaplan-Meier se estudiará cada una de las variables para determinar aquellas que realmente influyen en el tiempo de búsquedadel primer empleo, aplicando el Modelo de Riesgos Proporcionales de Cox. Aunque fundamentalmente este modelo se ha aplicado en el sector salud (modelos de supervivencia) y en el industrial (modelos de fiabilidad), en este estudio se aplicará, como se ha dicho, para modelizar el tiempo que tarda un egresado en Ingeniería Industrial de la Universidad de Carabobo en conseguir su primer empleo significativo, desde el momento que comienza a buscarlo hasta que lo obtiene. Con base en lo anterior, se ha estructurado esta investigación en cinco Capítulos de la siguiente manera: Capítulo I: Se hace una breve descripción y el planteamiento del problema de la Tesis, se demarcan los objetivos, la justificación, el alcance y las limitaciones de la misma. 2 Capítulo II: Esboza lo referente a las bases teóricas, se desarrollan cada una de las investigaciones que dan soporte conceptual y que permite el adecuado abordaje a la metodología de estudio, como son los antecedentes y las bases teóricas. Capítulo III: Desarrolla el marco metodológico, mostrando el nivel y el diseño de la investigación, población y muestra, las fuentes y técnicas utilizadas para recolectar la información, las técnicas de procesamiento y análisis de la información. También detalla las distintas Fases a cumplir durante el estudio. Capítulo IV: Analiza e interpreta los resultados obtenidos mediante un análisis descriptivo de las respuestas obtenidas a través del instrumento. Además se aplica el Análisis de Supervivencia (Kaplan-Meier y Cox) y se presenta el Modelo Estadístico del Tiempo de Búsqueda del Primer Empleo de los egresados de la Escuela de Ingeniería Industrial de la Universidad de Carabobo. Por último, en el Capítulo V: Se presentan las Conclusiones y Recomendaciones obtenidas en este trabajo de investigación. 3 CAPÍTULO I EL PROBLEMA 1.1.- PLANTEAMIENTO DEL PROBLEMA La Ingeniería Industrial es la rama de la ingeniería que se ocupa del diseño, mejoramiento e instalación de los sistemas integrados por personas, materiales, información, equipo y energía. Requiere de conocimientos especializados y habilidades en ciencias matemáticas, físicas y sociales, conjuntamente con los principios y métodos de análisis y diseño de ingeniería para especificar, predecir y evaluar los resultados que se obtendrán de tales sistemas (Salvendy, 1991). Su rol es el de facilitar la generación de productos de calidad, ya sean bienes o servicios, optimizando la utilización de los insumos y recursos teniendo siempre un enfoque integral de las organizaciones para el beneficio de la humanidad. Los orígenes de esta disciplina, se remontan a mediados del siglo XVIII, en los tiempos de la revolución industrial en Inglaterra. Entre los pioneros se encuentran Arkwright, creador en 1771 de un sistema para regularizar la producción y las tareas en las fábricas (López, 2004); Watt y Robinson, quienes establecen en 1794 un método de mejoramiento de la productividad a partir de la disminución de desperdicios y control de costos (Sábato y Mackensie, 2009). A comienzos del siglo XX, los esposos Gilbreth introducen la técnica moderna del estudio de movimientos (Claude, 2005) y Taylor establece las bases para maximizar la producción (Barba, 2010). Maynard, Stegemerten y Lowry desarrollaron en 1948 el sistema de tiempos predeterminados MTM 1 (Meyers, 2003); en 1917 Gantt hizo trabajos relacionados con problemas de programación, creando los gráficos que llevan su nombre, los cuales dieron paso al desarrollo de las técnicas CPM 2 y PERT 3 (Krajewski y Ritzman, 2000). Actualmente, las técnicas de la Ingeniería Industrial se han propagado a casi todo el mundo, contribuyendo a mejorar el nivel de vida y el aumento de la productividad y competitividad de los pueblos. 1 Methods Time Measurement. 2 Critical Path Method. 3 Program Evaluation and Review Technique. 4 En 1958 comienza sus actividades en la Universidad de Carabobo 4 , la primera Escuela de Ingeniería Industrial de Venezuela. Posteriormente, la oferta de esta carrera se va ampliando, cubriendo actualmente casi todo el territorio nacional, debido a la creación de nuevas instituciones tanto públicas como privadas (Illada, 2007). Según un documento publicado por la Asociación Iberoamericana de Instituciones de la Enseñanza de la Ingeniería (ASIBEI, 2005, citado en Illada, 2007) titulado Directrices Curriculares para Carreras de Ingeniería en Iberoamérica, compilado por el Ing. Albina, y usando como una de las fuentes de información al Núcleo de Decanos de Ingeniería de Venezuela, a través del Ing. Fernando Miralles y del Ing. Mario Herrera, en el país se dictan 379 carreras largas de cinco años de duración, las cuales confieren 35 títulos diferentes de Ingeniero, así como también 453 carreras cortas de tres años, que otorgan títulos de Técnico Superior con 97 diferentes denominaciones. Las cinco carreras de Ingeniería más ofrecidas son: Industrial, Sistemas, Civil, Eléctrica y Electrónica, las cuales representan el 64,9% del total de las que se dictan en el país, destacándose la Ingeniería Industrial como la de mayor oferta con 22,4%, seguida por la de Sistemas con 20,6. El Ingeniero Industrial de la Universidad de Carabobo es un profesional cuya formación lo capacita principalmente, para el análisis de problemas, la implementación de soluciones y el modelado de sistemas, en relación con los siguientes campos fundamentales de acción profesional: 1) Planificación, programación, organización, evaluación y control de las operaciones en la producción de bienes y servicios; 2) Gerencia de sistemas, procesos de formulación y ejecución de proyectos en organizaciones de diversa índole, principalmente las de carácter productivo, con énfasis en el manejo de los problemas y generación de alternativas en las áreas de administración y desarrollo de la organización y 3) Formulación y aplicación de modelos cuantitativos para el estudio de fenómenos inherentes a sistemas productivos y sistemas sociales, con énfasis en los objetivos de mejoramiento y optimización 5 . 4 El 21 de marzo de 1958 se crea la Universidad de Carabobo con el funcionamiento de tres facultades: Derecho, con la Escuela de Derecho Miguel José Sanz; Medicina, con la Escuela de Medicina e Ingeniería, con la Escuela de Ingeniería Industrial (Burgos, 1998). 5 Página web de la Facultad de Ingeniería de la Universidad de Carabobo (www.ing.uc.edu.ve). 5 Cañas y Marchán (2003) indican que para el año 2003, el 43% de las empresas de la Zona Industrial de Valencia reconocen a la Universidad de Carabobo como líder en cuanto a las competencias de sus egresados en esa carrera, cifra aunque aceptable, resulta preocupante tomando en cuenta que el resto está conformado mayormente por graduados de universidades cuyas sedes se encuentran fuera de la región. Por otra parte, Maneiro y Mejías (2007) destacan que este profesional se enfrenta, en sus primeras experiencias laborales, a un mundo empresarial con necesidades y exigencias aparentemente distintas a las percibidas desde el ambiente académico; sugiriendo una brecha con respecto a la formación impartida en la Escuela, lo cual no le permite a sus egresados mantener su competitividad ante dichos cambios. Actualmente las empresas consideran al capital humano como el recurso más valioso con el que cuentan, por esto, las exigencias del mercado laboral están caracterizadas por una sólida formación profesional y personal. Si a esto se le suman las cambiantes características del mismo debido a aspectos políticos, sociales y económicos del país, el papel de las universidades en Venezuela, es todavía más significativo. La Escuelade Ingeniería Industrial de la Universidad de Carabobo debe garantizar a sus estudiantes, implementar una formación académica acorde con las exigencias de este mercado. Para lograrlo, necesita retroalimentarse constantemente con sus nuevos requerimientos. Su desconocimiento traerá como consecuencia la desventaja competitiva de sus egresados frente a los de otras instituciones de educación superior del país. Tan importante como conocer y adaptarse al constante cambio del mercado, es igualmente entender la condición actual del mismo. Tradicionalmente la edad, el promedio de notas obtenidas durante la carrera, el dominio de otros idiomas y los estudios extracurriculares como diplomados y cursos de especialización, entre otros, han sido los requisitos demandados por las empresas a la hora de solicitar profesionales recién graduados. Por la escasa información existente, los autores aplicaron un estudio 6 exploratorio a una muestra de ingenieros industriales 6 , con el fin de obtener una primera aproximación del caso en estudio; en la misma se pudo determinar que el 50% de la muestra de egresados antes de 1998 obtuvo su primer empleo entre los 2 y 4 meses de haberse graduado; mientras los egresados entre 1999 y 2010, el 40% lo consiguió entre 6 y 9 meses. El perfil que exigieron las empresas para ambos grupos indicaban: sexo, edad, conocimientos de idiomas extranjeros, cursos de especialización, lugar de residencia, manejo de software, experiencia previa, entre otros. Como estos factores representan elementos críticos de la presente investigación, se diseñará una metodología estadística para modelar la influencia de los mismos en el tiempo de búsqueda del primer empleo. Tomando en consideración lo antes expuesto, se plantean los problemas de la investigación: ¿Cuál es el modelo estadístico que mejor describe el tiempo de búsqueda del primer empleo de los egresados de la Escuela de Ingeniería Industrial de la Universidad de Carabobo? ¿Cuáles son los factores que influyen en la búsqueda del primer empleo de los ingenieros industriales de la Universidad de Carabobo? 1.2.- OBJETIVOS Objetivo General Modelar estadísticamente el tiempo de búsqueda del primer empleo de los egresados de la Escuela de Ingeniería Industrial de la Universidad de Carabobo. Objetivos Específicos Identificar los factores que históricamente han influido en la búsqueda del primer empleo de los ingenieros industriales. Diseñar un estudio estadístico para modelar el tiempo de búsqueda del primer empleo de los ingenieros industriales de la Universidad de Carabobo. 6 Este estudio exploratorio se basó en una encuesta realizada vía telefónica, a una muestra de 40 Ingenieros Industriales: 20 egresados antes del año 1998 y 20 egresados entre 1999 y 2010, independientemente de la universidad de procedencia. 7 Aplicar un instrumento de recolección de datos, para obtener la información necesaria en el estudio. Identificar los factores influyentes en el tiempo de búsqueda del primer empleo de los ingenieros industriales de la Universidad de Carabobo, a través del análisis estadístico de los resultados. 1.3.- JUSTIFICACIÓN La investigación aquí planteada es importante en dos sentidos, uno académico y uno institucional. En lo académico, la investigación proporciona una metodología estadística que permita modelar los factores influyentes en el tiempo de búsqueda del primer empleo de los Ingenieros Industriales de la Universidad de Carabobo durante un período de tiempo bien definido, para lo cual se analizarán las técnicas estadísticas estudiadas durante el desarrollo de la carrera. También permitirá a los investigadores cumplir con los requerimientos necesarios para optar al título de Ingeniero Industrial. A nivel institucional, la investigación será de suma importancia ya que con el cálculo de la probabilidad del tiempo de búsqueda del primer empleo anteriormente descrito y de los factores influyentes en el mismo, se podrán diseñar estrategias, maximizando así el uso de los recursos disponibles, mejorando la calidad del perfil de estos profesionales. 1.4.- ALCANCE Y LIMITACIONES La presente investigación pretende realizar una modelación estadística del tiempo de búsqueda del primer empleo de los egresados en la Escuela de Ingeniería Industrial de la Universidad de Carabobo entre julio de 2007 y julio de 2012, período de tiempo para el cual se cuenta con información disponible y necesaria para el estudio. La recolección de datos se hará a través de una encuesta telefónica o por correo electrónico, dependiendo de la información obtenida del graduado, aplicada a una muestra representativa de los 815 egresados que forman el total de la población. Como limitante se tiene, la obsolescencia de algunos datos (teléfono y e-mail), dificultando que el instrumento no pueda llegar a los egresados en estudio. 8 CAPÍTULO II MARCO TEÓRICO 2.1.- ANTECEDENTES Los antecedentes son todos los hechos anteriores a la formulación del problema útiles para aclarar, juzgar o interpretar el problema planteado (Tamayo, 2003). Partiendo de esta definición, no existe ningún tipo de investigación en la Universidad de Carabobo ni en las otras universidades del país donde se imparte la carrera de Ingeniería Industrial, que sirva como base para el análisis propuesto en esta investigación. Sin embargo, se cuenta con importantes trabajos realizados en Argentina, Colombia y España que, aunque analizan el problema para otras profesiones, se basan en metodología estadísticas aplicables al caso en estudio, los cuales se convierten en una fuente importante de información para la realización de este trabajo. Todas estas referencias fueron consultadas a través de Internet, debido a la difícil obtención de información por otros medios. En el estudio realizado por Córdova y Bermúdez (2002), se plantea un modelo para el estudio de tiempos de desempleo utilizando técnicas de análisis de supervivencia. Esta investigación sirve de apoyo porque presenta los pasos para realizar el análisis estadístico cuando existen datos censurados, situación que se plantea en la presente investigación, ya que el tiempo de desempleo de alguno de los individuos puede ser desconocido si permanecen en esa situación al final del período de estudio. González, Dávila y Gil (2004) estudiaron la longitud del primer episodio de desempleo, entre los titulados de ciclos formativos de la isla de Gran Canaria, mediante la estimación de modelos de duración no paramétricos (Kaplan-Meier y Cox). Este estudio es de gran contribución, porque establece cómo se debe realizar una metodología estadística cuando existe una relación entre la ocurrencia de un evento y un intervalo de tiempo dado, situación que se hace presente en esta investigación. 9 En una investigación presentada por Borra, Gómez y Salas (2007) se examinaron los determinantes de la duración del primer desempleo de una cohorte de jóvenes graduados en las carreras del área económica de la Universidad de Sevilla. Este estudio es de gran utilidad en este proyecto, ya que presentan una metodología para identificar algunos factores que afectan la duración del primer período de desempleo, los cuales sirven de punto de referencia para diseñar el instrumento de recolección de datos y adaptarlo a los Ingenieros Industriales de la Universidad de Carabobo. García, García, Gómez y Fuentes (2008) aplicaron la metodología del Análisis de Supervivencia a una cohorte de egresados de la Diplomatura en Enfermería de la Universidad Católica San Antonio de Murcia, España, con el objetivo de modelar el tiempo invertido por los egresados universitarios en encontrar el primer empleo significativo. Este estudio presenta una metodología muy interesanteque podría ser aplicado a los Ingenieros Industriales de la Universidad de Carabobo, ya que utilizan el método Kaplan-Meier y una aplicación del modelo de Cox que toman en cuenta factores de ciertas características de los egresados, estimando su posible efecto sobre el tiempo de supervivencia, el cual es uno de los objetivos de este estudio. Castillo, Castro y Osorio (2011) analizaron información primaria de los egresados de cuatro universidades de Cali, identificando los principales determinantes de la duración del desempleo de los profesionales en las ciencias económicas y administrativas e ingeniería, y su relación con estudios en Colombia, durante el periodo 2001-2006. Este trabajo servirá de gran apoyo, ya que muestra diferentes metodologías estadísticas que pueden ser aplicables a este tipo de estudio, entre las cuales se puede seleccionar, la que mejor se adapte al tiempo de búsqueda del primer empleo de los ingenieros industriales egresados de la Universidad de Carabobo. 10 2.2.- MARCO TEÓRICO 2.2.1.- Análisis Descriptivo de Variables La Estadística es la ciencia y arte de planificar un estudio, registrar, recolectar, elaborar, presentar y publicar los datos, para efectuar análisis válidos y coherentes; predecir según los resultados y llegar a decisiones razonables (Martínez, 2008). Tiene un sentido ilimitado de aplicaciones, ya que todas las ciencias y el quehacer diario de nuestra existencia, están sujetos a ella. Se encuentra dividida en dos grandes grupos: 1) Estadística Inferencial y 2) Estadística Descriptiva. La Estadística Inferencial: proporciona métodos para estimar las características de un grupo total o población, basándose en datos de un subconjunto de la población o muestra de observaciones. Realiza inferencias objetivas basadas en los datos obtenidos. Utiliza la estadística descriptiva como el primer paso antes de la realización de inferencias. La mente humana no puede extraer fácilmente toda la importancia de una serie de datos desorganizados, sin la ayuda de técnicas especiales. Cuando los conjuntos de datos son muy grandes, deben experimentar un proceso de organización y resumen que sean entendibles por personas no familiarizadas con la investigación. Por ello es que la Estadística Descriptiva proporciona herramientas para organizar, simplificar y resumir información básica a partir de un conjunto de datos que de otra forma sería poco manejable. Incluye la tabulación, representación y descripción de conjuntos de datos tanto de variables numéricas como de variables categóricas. Es la primera tarea a realizar en el análisis de los datos, ya que su misión es describir los datos, valores o puntuaciones obtenidos para cada variable y sirve de base para otros análisis más avanzados. Población: es un conjunto de elementos con ciertas características que pueden ser observadas y medidas. Será finita cuando los elementos que la componen pueden ser contados e infinita cuando son ilimitados y muy difíciles e imposibles de ser contados. 11 Muestra: es un subconjunto de la población, donde los elementos seleccionados son representativos de los demás elementos integrantes de la población. Las observaciones son analizadas y procesadas como si se trataran del total de la población en estudio. Análisis Descriptivo de una Variable Los elementos fundamentales de la descripción de una variable se pueden resumir de esta forma: tipos de variables, las distribuciones de frecuencias, gráficas estadísticas, medidas de centralización, dispersión y posición. Variable: es una característica que se observa en una población o muestra, y la cual se desea estudiar. Puede tomar diferentes valores, dependiendo de cada individuo, clasificándose de la siguiente manera: a) Variable cuantitativa: es aquella que toma valores numéricos. Se subdivide en Continua: cuando son valores reales y pueden tomar cualquier valor dentro de un intervalo. Ejemplo: peso, estatura, sueldos y Discreta: cuando toma valores enteros. Ejemplo: N° de hijos de una familia, N° de alumnos de un curso. b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se subdividen en: Nominal: cuando son cualidades sin orden. Ejemplo: Estado civil, preferencia por una marca, lugar de residencia; Ordinal: cuando denotan cualidades que representan un orden y jerarquía. Ejemplo: nivel educacional, días de la semana, calidad de la atención, nivel socioeconómico y Dicotómicas: cuando tienen sólo dos modalidades posibles. Ejemplo Si y No, Masculino y Femenino. 12 Distribuciones de Frecuencias Sea cual sea el tipo de variable, lo que se tiene como información de una variable en una muestra es un número finito de n datos, es decir, de valores o de anotaciones sobre qué modalidad (cualitativas) o qué valor (cuantitativas) tiene cada elemento de la muestra; a este conjunto de datos se le llama distribución y, salvo cuando el tamaño de muestra n sea muy pequeño, se debe resumir para se pueda comprender bien los resultados. Un primer y obligado paso de ese resumen de datos es el simple recuento de las repeticiones de un mismo valor o modalidad; ello nos conduce al concepto fundamental de frecuencia, con dos enfoques: Frecuencia absoluta es el número de veces que una modalidad o un valor de una variable aparece entre los datos de una muestra y Frecuencia relativa es su frecuencia absoluta dividida entre el tamaño muestral, es decir, la proporción de veces que aparece esa modalidad o valor entre todos los datos de la muestra. Gráficas Estadísticas Las distribuciones de frecuencias se presentan en tablas o bien en gráficas. Estas últimas deben reflejar fielmente lo que tratan de representar, fundamentalmente las frecuencias de cada modalidad o valor. Existen diversos tipos de gráficas, cada uno de ellas adecuado a un cierto tipo de variables, por lo que se pueden clasificar atendiendo a estos tipos. Así, para variables Cualitativas se pueden mencionar: el diagrama de barras o rectángulos y el diagrama de sectores. Hay otras menos frecuentes pero igualmente válidas para variables cualitativas como los pictogramas, los cartogramas y los diagramas de superficie. Por su parte, para variables Cuantitativas los tipos de gráficas más importantes son los siguientes: el Diagrama de segmentos, el polígono de frecuencias y el histograma o histograma de rectángulos. Parámetros de una Distribución Se trata de resumir la información de una tabla o de una gráfica y de encontrar algunos valores lo más simples posible que nos permitan dar información sobre la muestra de n 13 elementos o comparar dos muestras entre sí. Para hacer ese resumen o información de los datos hay tres enfoques fundamentales: 1) Medidas o parámetros de centralización, tendencia central o posición central, 2) Medidas o parámetros de dispersión y 3) Medidas o parámetros de posición (cuantiles). Entre las Medidas de Tendencia Central se definen la Moda: como el valor de la variable con mayor frecuencia en la muestra, el que se repite más (moda se asocia con lo más frecuente); la Mediana es el valor ubicado en el centro de la distribución, es decir, el valor que supera a la mitad de los de la muestra y se ve superado por la otra mitad (salvo empates en ambos casos); se calcula buscando el valor de la muestra que ocupa el lugar [(n+1)/2], con los datos ordenados y la Media o Media Aritmética: es el centro de gravedad de la distribución, o fiel de la balanza entre todos los datos. Se calcula sumando los datos y dividiendo entre el tamaño de la muestra, esto es, entre el número de datos. Existen otras medidas de centralización de uso menos frecuente, como la Media Ponderada (que es una media aritmética con distintos pesos de importancia para los distintos datos), La MediaGeométrica (raíz enésima del producto de los datos) y la Media Armónica (la inversa de la media aritmética de los inversos de los datos). Las Medidas de Dispersión más utilizadas son: la Desviación Absoluta Media que es la media aritmética de los valores absolutos de las desviaciones, se calcula tomando como positivas todas las desviaciones, sumándolas y dividiendo entre n; la Varianza es la media aritmética de los cuadrados de las desviaciones, se obtiene elevando al cuadrado cada desviación, sumando esos cuadrados y dividiendo entre n; la Desviación Standard o Desviación Típica, la cual es la más usada de las medidas de dispersión y es igual a la raíz cuadrada de la varianza. Es útil para describir cuánto se apartan de la media de la distribución los elementos individuales. Una medida de ello se denomina puntuación estándar: es el número de desviaciones a las que determinada observación se encuentra con respecto a la media y el Coeficiente de Variación, a menudo expresado en tanto por ciento, entre la desviación típica y la media de una distribución. Además de las citadas, la más simple de las medidas de dispersión es el Rango, Recorrido ó Amplitud, el cual es la 14 diferencia entre el valor máximo y el mínimo de la muestra, y que indica qué extensión de la recta de los números ocupan los datos de nuestra muestra. Entre las Medidas de Posición (Cuantiles) se tiene: los Cuartiles, que definen las cuartas partes de la muestra mediante tres “cortes”: el primer cuartil deja por debajo al 25% de la distribución, el segundo coincide con la mediana y el tercero deja por debajo al 75% de la distribución; los Deciles, dan nueve cortes para definir de diez en diez por ciento los valores de la distribución; así, el primer decil deja por debajo una décima parte de la distribución, el segundo dos décimas partes, etc., hasta nueve deciles y los Percentiles, que son como los deciles pero de uno en uno por ciento, y por tanto son noventa y nueve; por ejemplo, el percentil 37 deja por debajo al 37% de la distribución. Todos los cuantiles son definibles sobre variables cuantitativas o sobre cualitativas ordinales, porque requieren siempre que los datos estén ordenados. 2.2.2.- Análisis de Supervivencia El Análisis de Supervivencia está formado por un conjunto de técnicas estadísticas apropiadas para estudios de seguimiento, en los que interesa analizar la variable intervalo de tiempo transcurrido entre un evento inicial y uno final perfectamente identificable, que puede presentarse durante el período de observación, así como el efecto que tienen sobre esta variable un conjunto de factores pronósticos utilizando, por ejemplo, el Modelo de Riesgos proporcionales de Cox. El término Supervivencia se debe a que en las primeras aplicaciones de esta técnica, el evento terminal que se estudiaba era el fallo de un elemento o la muerte del sujeto. Entre los objetivos básicos de un Análisis de Supervivencia se pueden establecer: Estimar e interpretar las funciones de supervivencia, comparar las funciones de supervivencia entre determinados grupos e identificar la influencia de variables explicativas sobre los tiempos de supervivencia observados (Kleinbaum, 1997). Cualquier variable puede medirse en forma instantánea, sin embargo, en temas de "supervivencia" la medición de la ocurrencia del evento de interés depende del tiempo de duración hasta que ocurra dicho evento, el cual suele ser bastante grande como para esperar 15 a que el mismo ocurra para todas las unidades experimentales al terminar el estudio. Es este hecho el que hace al análisis de supervivencia una herramienta fundamental y diferente para estudiar este tipo de fenómenos de duración (Hosmer y Lemeshow, 1999). En Análisis de Supervivencia, cuando se tienen casos o individuos a los que no les ha ocurrido el evento que se estudia se dice que estos casos son censurados. Las causas de esta situación pueden ser por ejemplo, cuando el evento (conseguir el primer empleo) no tiene lugar antes de que finalice el estudio; en otros, el investigador puede haber perdido el seguimiento de su estado en algún momento anterior a que finalice el estudio; y existen además casos que no pueden continuar por razones ajenas al estudio. Este tipo de censura es conocido como censura por la derecha, existe también censura por la izquierda en la cual por ejemplo se conoce, al momento de iniciar la investigación, la situación final del individuo pero no puede saberse cuando inició, y por lo tanto, no se tiene completa la información de la duración del evento. Si no existiese información censurada, es decir, si todos los sujetos fuesen seguidos completamente durante el mismo periodo de tiempo hasta que se produjera el evento final, en este caso conseguir el primer empleo, se podrían usar otros métodos estadísticos más sencillos. Ese es uno de los valores agregados para el uso de Análisis de Supervivencia. En Análisis de Supervivencia es de suma importancia la variable aleatoria T, que representa el tiempo de duración hasta la ocurrencia de un evento (muerte 7 , falla de un sistema, entre otros). La variable aleatoria T, posee una función de densidad de probabilidad f(t), y una función de distribución de probabilidad acumulada F(t) = P(T≤ t), que representa la probabilidad de que el evento de interés ocurra en un tiempo menor o igual que t. Para el Análisis de Supervivencia, es de especial interés la función de supervivencia S(t) = 1 - F(t) = P(T > t), la cual expresa la probabilidad de que el evento de interés ocurra en un tiempo mayor a t. 7 Para efectos de esta investigación, “muerte” se refiere al evento que sucede cuando el egresado de Ingeniería Industrial de la Universidad de Carabobo consigue su primer empleo. 16 Barrera (2008), señala que otra función de interés para este análisis es la llamada Función de Riesgo 8 conocida también como de Impacto, h(t), que representa el riesgo instantáneo de que un evento ocurra en un intervalo infinitamente pequeño de tiempo (t, t + Δt), dado que no ha ocurrido hasta el tiempo t, que se puede escribir como: Desarrollando la probabilidad condicional de la expresión anterior se obtiene: Del cálculo de probabilidades y del hecho de que P(T > t) = S(t), se tiene que: De la definición de derivada se tiene que la expresión (3) se convierte en: h(t) = f(t) / S(t) Se tiene entonces una expresión que relaciona la función de supervivencia y la función de riesgo. Si se integra la expresión (4), se obtiene entonces la función de riesgo acumulada: Que se puede escribir como: , haciendo la sustitución , y , se tiene que la expresión (4) se convierte en , de donde resulta que las funciones del análisis quedan expresadas como: 8 La “Función de Riesgo” en este estudio, se refiere a una medida de la probabilidad de que el Ingeniero Industrial consiga su primer empleo, por tal motivo, la interpretación de los resultados se hace a la inversa, ya que para este caso, hablar de “Riesgo” implica un “Beneficio”. (1) (2) (3) (4) (5) 17 Riesgo Acumulado: (5.1) Función de Supervivencia: (5.2) Riesgo Instantáneo: (5.3) Función de Distribución de Probabilidades: (5.4) 2.2.3.- Estimador de Kaplan-Meier El estimador de Kaplan-Meier, de la función de supervivencia, es el estimador más común entre los paquetes estadísticos. El método de construcción del estimadores un método no paramétrico ya que no asume ninguna estructura para la función de distribución de probabilidad del tiempo de vida (Pérez, 1997). Este estimador utiliza toda la información disponible, casos censurados y no censurados, para realizar la estimación de la función de supervivencia. El estimador en cualquier instante de tiempo es obtenido de la multiplicación de una secuencia de probabilidades condicionales de supervivencia estimadas. Cada probabilidad condicional estimada se obtiene del número de casos observados en riesgo y el número de "muertes" en un instante de tiempo y se calcula como (n-d)/n, donde n es el número de casos en riesgo y d es el numero de "muertes" observadas. Supóngase una muestra de n observaciones independientes y sean t1 < t2 <...< tk los tiempo de vida observados y Tl el tiempo de vida de la observación de mayor duración en la muestra. Se define entonces: ni = Número de sujetos en riesgo en el instante ti di = Número de muertes en el instante ti ci = Número de censuras en el intervalo [ti, ti+1) Se puede ver que: n0 = n t0 = 0 d0 = 0 c0 = 0 tk+1 ∞ ni+1 = ni - di - ci i = 1,2,., k - 1 18 El estimador de la función de supervivencia de Kaplan-Meier se calcula de la siguiente manera: De la ecuación (6), resulta que y que si no existen casos censurados. La función de supervivencia estimada se expresa entonces como: Varianza del Estimador Kaplan-Meier Adicional a la estimación de la función de supervivencia es de gran interés construir intervalos de confianza para los estimadores de la función de supervivencia así como de estimaciones puntuales y de intervalo para algunos percentiles. Aunque existen varios enfoques para tratar este problema, en este trabajo se tratará el enfoque del método delta el cual está basado en la expansión en series de Taylor de primer orden (Barrera, 2008). Método Delta La idea básica del método es usar una aproximación en series de Taylor para obtener una función lineal que aproxime una función más complicada como es el caso del estimador de la función de supervivencia. Para aplicar el método delta es necesario que la función pueda ser expresada en series de Taylor. Sea f(x) una función de densidad de probabilidad de una variable aleatoria X. La expansión en series de Taylor de primer orden alrededor de la media es: De la ecuación anterior se tiene que la varianza de la función f(x) es aproximadamente igual a: (6) (7) 19 Donde σ 2 es la varianza de la variable aleatoria X. Como ejemplo se muestra la varianza para la función logaritmo natural y la función exponencial. Con la función logaritmo natural: Con la función exponencial: Varianza función de supervivencia Para calcular el estimador de la varianza a través del método delta del estimador Kaplan-Meier, primero se calcula el estimador delta del logaritmo natural así: Haciendo , se tiene que la ecuación (12) se vuelve: Aplicando el operador varianza a ambos lados de la ecuación (13), se tiene que: (8) (9) (10) (11) (12) (13) (14) 20 Lo anterior debido a la suposición de independencia de las variables . Si además se supone que las se distribuyen como variables aleatorias Bernoulli con probabilidad constante . Se tiene entonces como estimador de a , y como estimador de la varianza la siguiente expresión , ahora utilizando la ecuación (8) y (9) se tiene que: Utilizando el hecho de que , la expresión (15) se convierte en: Reemplazando (16) en (14), se tiene que: La expresión (17) da una estimación de la varianza del logaritmo natural de la función de supervivencia, lo que se debe hacer ahora es aplicar nuevamente el método delta sobre la función exponencial (como se hizo en (10) y (11)) para eliminar el logaritmo natural de la expresión (17). Utilizando las ecuaciones (10) y (11) y el hecho de que , se tiene: Simplificando: La desviación estándar se calcula como la raíz cuadrada de la varianza dada en la expresión (18). (15) (16) (17) (18) (19) 21 Media muestral y varianza Adicionalmente, Barrera (2008) explica que el estimador usado para la media es debido a un resultado de la teoría de la probabilidad sobre variables aleatorias positivas el cual enuncia que la esperanza matemática de una variable aleatoria positiva es igual a la integral definida (área bajo la curva) desde cero hasta infinito de la función de supervivencia como se muestra a continuación: Debido a que la variable T no está definida para valores mayores a , El valor del estimador de la media es entonces el área de la función escalón definida por el estimador de Kaplan-Meier de la función de supervivencia así: Donde es el tiempo observado más grande, ahora si entonces el cálculo de la media se hace con: Cuando no se tienen casos censurados, la varianza de la media muestral se calcula como la varianza muestral dividida sobre el tamaño de la muestra. Cuando se presentan censuras el estimador de la varianza de la media muestral se calcula como: (20) (21) (22) 22 Donde , la cantidad total de muertes. En el caso en el que , la varianza se calcula como: Estimación de percentiles y varianza Hosmer y Lemeshow (1999) destacan adicionalmente que la función de supervivencia estimada puede ser utilizada para la estimación de algunos percentiles. El cálculo de los percentiles se puede hacer en forma gráfica simplemente trazando una línea horizontal desde el eje Y de la gráfica de la función de supervivencia hasta que toque la línea vertical, seguidamente se proyecta ese punto sobre el eje X y se obtiene el valor del percentil deseado, pero el método grafico aunque ilustrativo se queda corto en precisión y en practicidad, por lo cual, se presenta un método más general y analítico que permite realizar cálculos más precisos. La fórmula para el cálculo se muestra a continuación: La varianza del estimador del p-ésimo percentil se estima con: En la anterior expresión el numerador se calcula con la ecuación (18), y el denominador que es la estimación de la función de densidad de la distribución de los tiempos de supervivencia se calcula así: Donde e , aunque se pudieran usar números inferiores al 0,05, éste en la práctica funciona bien. (24) (25) (26) (23) 23 2.2.4.- Comparación de Funciones de Supervivencia Supóngase que se tienen dos grupos de egresados de Ingeniería Industrial de la UC, uno compuesto por egresados que realizaron pasantías durante sus estudios y otro grupo que no las hizo, para lo cual se desea realizar un análisis de supervivencia independientepara cada grupo y se quiere comparar el efecto del hecho de que un egresado haya hecho o no pasantías sobre la función de supervivencia. Barrera (2008) señala que inicialmente una comparación gráfica de las funciones de supervivencia es importante e ilustrativa, sin embargo, a veces esta comparación gráfica se vuelve muy subjetiva y en algunos casos difíciles de hacer. Para solucionar este inconveniente se hace necesario contar con pruebas estadísticas que permitan identificar si las diferencias observadas entre las funciones de supervivencia son significativas. Las pruebas estadísticas están basadas en su mayoría en tablas de contingencia de grupo por estado de cada tiempo de supervivencia observado cómo se muestra en la tabla 1: Tabla 1. Prueba de igualdad de la función de supervivencia de dos grupos en el tiempo de observación ti Evento Grupo 1 Grupo 0 Total Muerte d1i d0i di No muerte n1i – d1i n0i – d0i ni - di En riesgo n1i n0i ni Fuente: Barrera, 2008. El estadístico de prueba se construye con el número esperado de muertes y la varianza del número de muertes para alguno de los dos grupos, por ejemplo para el grupo 1 se tiene que el estimador del número de muertes es: (27) 24 Y la varianza suponiendo una distribución hipergeométrica: Ya con los estimadores del número de muertes y su varianza se construye el estadístico de prueba Q. Bajo la hipótesis nula de que las dos funciones de supervivencia son iguales y que el número observado de eventos es grande se puede demostrar que Q se distribuye como una chi-cuadrado con un grado de libertad (p = P (x 2 (1)) Q). Dependiendo del valor de wi, se tienen diferentes tipos de contrastes como por ejemplo: Mantel y Haenzel Breslow Tarone y Ware El caso de más de dos grupos se trata en forma similar al caso ya visto de sólo dos grupos. Se muestra a continuación la tabla 2, asociada a varias funciones de supervivencia base para el cálculo de los estadísticos de prueba para la igualdad de las funciones: Tabla 2. Prueba de igualdad de la función de supervivencia de M grupos en el tiempo de observación ti Evento 1 2 … m … M Total Muerte d1i d2i … dmi … dMi di No muerte n1i – d1i n2i – d2i … nmi – dmi … nMi – dMi ni - di En riesgo n1i n2i … nmi … nMi ni Fuente: Barrera, 2008. Inicialmente se debe estimar el número esperado de muertes de cada grupo bajo la suposición de igual función de supervivencia, es decir: (28) (29) 25 Ya con varios grupos lo que se calcula ya no es una varianza sino una matriz de covarianzas del vector . La matriz de covarianzas es obtenida suponiendo que el número observado de eventos sigue una distribución hipergeométrica central multivariada. Los términos de la diagonal de la matriz denotada por , se calculan de la siguiente manera: Los elementos fuera de la diagonal se calculan como: Con los estimadores del número de muertes y la varianza se construye el siguiente estadístico: Donde es una matriz diagonal que tiene los pesos , es el vector que contiene la cantidad de muertes para cada grupo en el tiempo , es el vector que contiene el número esperado de muertes para cada grupo en el tiempo . Al igual que en el caso de dos grupos se tiene que para el caso de varios grupos, bajo la hipótesis nula de igualdad de funciones de supervivencia, se distribuye también como una chi-cuadrado con grados de libertad . 2.2.5.- Modelo de Regresión de Cox Continuando con el ejemplo de querer comparar la supervivencia de dos grupos de egresados, el primero hizo pasantías en una empresa y el otro no, pero adicional a las (30) (31) (32) (33) 26 diferencias que puedan tener los dos tipos de estudiantes en cuanto a la participación del programa o no, existen otras diferencias debido a la condición propia de cada estudiante, por ejemplo la edad, el género, promedio de notas en la carrera, entre otras. En la situación anterior el análisis de Kaplan-Meier se queda corto debido a su imposibilidad de tener en cuenta estas otras "covariables" o características diferentes al hecho de haber realizado o no pasantías. Para estos caso, se utiliza el Modelo de Riesgos Proporcionales, presentado por Cox (1972), el cual plantea un modelo para el riesgo h(t), en función del tiempo y de variables explicativas o covariables. La idea básica del mismo es igual a la del análisis de regresión, la diferencia ocurre cuando se presentan casos censurados que hacen que los modelos de regresión clásicos como el análisis de regresión lineal y logística fallen, de hecho si no existiera censura en los datos estos modelos de regresión serían adecuados y suficientes. La presentación inicialmente se realizará sobre el supuesto de una sola covariable y después se generalizará a p variables, tal y como lo presenta Barrera (2008). El modelo de regresión que se trata en este trabajo se puede escribir así: La función de riesgo mostrada en (34), queda expresada por dos funciones. La función que caracteriza como la función de riesgo cambia como una función del tiempo de supervivencia. Por otro lado la función expresa como la función de riesgo cambia como una función de las covariables medidas a los sujetos. La función que es la función de riesgo cuando es llamada la función base. La razón de riesgos de dos sujetos con valor de covariable y respectivamente es: Utilizando (34) y reemplazando en (35) se obtiene: (34) (35) (36) 27 De la expresión anterior se tiene que la razón de funciones de riesgo de dos individuos depende sólo de la función relacionada con la covariable . Si adicionalmente se supone una forma exponencial a la función de la covariable, se está ante el Modelo de Regresión de Cox o Modelo de Riesgos Proporcionales debido a que la razón de riesgos depende solamente del valor que tome la covariable. El modelo de Cox se puede escribir: En otras palabras, el modelo de Cox es un modelo semiparamétrico en el cual se supone una forma conocida para la función de las covariables y una desconocida para la función que depende sólo del tiempo de supervivencia (ver modelo Kaplan-Meier). La razón de funciones de riesgo se escribe como: Por ejemplo, si la variable X indicara el género de un estudiante codificado con X=1 si es hombre y X=0 si es mujer, se tendría que la razón de riesgos entre hombres y mujeres sería igual a: Ahora si de los cálculos resulta que , quiere decir que los hombres tienen un riesgo de no conseguir su primer empleo tres veces mayor que el riesgo de las mujeres. La cuestión ahora será calcular la función de supervivencia para un modelo que parte de la función de riesgo. De la ecuación (34), y con la función de riesgo (37) se obtiene: Donde es la función de riesgo acumulada que se puede calcular como: (37) (38) (39) 28 Sustituyendo (40) en (39) se tiene: De donde se sigue que: Donde es la función de supervivencia base. Ahora bajo la suposición del modelo de Cox (41) se convierte en: 2.2.6.- Estimación de parámetros del modelo de Cox El procedimiento más utilizado para realizar la estimación de los parámetros de un modelo de regresión es el procedimiento relacionado con la verosimilitud, el cual básicamente consiste en estimar los parámetros que maximizan el logaritmo natural de la verosimilitud, en el caso del modelo de Cox este procedimiento no funciona, básicamente debido al desconocimiento de la función de riesgo base que aparece en el modelo. Por este motivo, Cox (1975) desarrolló un método que permite estimar los parámetros sin necesidad de asumir una forma particular para la función de riesgo base, propone entonces
Compartir