Logo Studenta

asfreguejo

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD DE CARABOBO 
FACULTAD DE INGENIERÍA 
ESCUELA DE INGENIERÍA INDUSTRIAL 
 
 
 
 
 
 
 
 
 
 
 
 
MODELACIÓN ESTADÍSTICA DEL TIEMPO 
DE BÚSQUEDA DEL PRIMER EMPLEO 
CASO: INGENIEROS INDUSTRIALES DE LA UNIVERSIDAD DE CARABOBO 
 
 
 
 
 
 
 
 
 
 
 
 
Tutor: Autores: 
Dr. Carlos Martínez - Br. Asdrúbal Freites C. 
 - Br. José Guerrero 
 
 
 
 
 
 
 
 
 
Valencia, Junio 2014 
 
 
 
UNIVERSIDAD DE CARABOBO 
FACULTAD DE INGENIERÍA 
ESCUELA DE INGENIERÍA INDUSTRIAL 
 
 
 
 
 
 
 
 
 
 
 
MODELACIÓN ESTADÍSTICA DEL TIEMPO 
DE BÚSQUEDA DEL PRIMER EMPLEO 
CASO: INGENIEROS INDUSTRIALES DE LA UNIVERSIDAD DE CARABOBO 
 
Trabajo Especial de Grado presentado ante la ilustre Universidad de Carabobo 
para optar al Título de Ingeniero Industrial 
 
 
 
 
 
 
 
 
 
Tutor: Autores: 
Dr. Carlos Martínez - Br. Asdrúbal Freites C. 
 - Br. José Guerrero 
 
Línea de Investigación: 
Probabilidades y Estadística 
 
 
 
 
 
 
 
Valencia, Junio 2014 
 
UNIVERSIDAD DE CARABOBO 
FACULTAD DE INGENIERÍA 
ESCUELA DE INGENIERÍA INDUSTRIAL 
 
 
CERTIFICADO DE APROBACIÓN 
 
Quienes suscriben, Miembros del Jurado designado por el Consejo de Escuela de la 
Facultad de Ingeniería de la Universidad de Carabobo, para examinar el Trabajo Especial 
de Grado titulado “MODELACIÓN ESTADÍSTICA DEL TIEMPO DE BÚSQUEDA 
DEL PRIMER EMPLEO. CASO: INGENIEROS INDUSTRIALES DE LA 
UNIVERSIDAD DE CARABOBO”, el cual está adscrito a la Línea de Investigación 
“Probabilidades y Estadística” del Departamento de Investigación Operativa, presentado 
por los bachilleres Asdrúbal Freites Corona, C.I. 08.836.853 y José Antonio Guerrero 
Campos, C.I. 11.220.330, a los fines de cumplir con el requisito académico exigido para 
optar al Título de Ingeniero Industrial, dejan constancia de lo siguiente: 
 
1. Leído como fue dicho Trabajo Especial de Grado, por cada uno de los Miembros del 
Jurado, éste fijó el día miércoles 04 de junio de 2014, a las 09:30 am., para que los 
autores lo defendieran en forma pública, lo que éstos hicieron, en la Sala de 
Conferencias de la Escuela, mediante un resumen oral de su contenido, luego de lo cual 
respondieron satisfactoriamente a las preguntas que le fueron formuladas por el Jurado, 
todo ello conforme a lo dispuesto en el Reglamento del Trabajo Especial de Grado de 
la Universidad de Carabobo y a las Normas de elaboración de Trabajo Especial de 
Grado de la Facultad de Ingeniería de la misma Universidad. 
2. Finalizada la defensa pública del Trabajo Especial de Grado, el Jurado decidió 
aprobarlo por considerar que se ajusta a lo dispuesto y exigido en el precitado 
Reglamento. 
 
En fe de lo cual se levanta la presente acta, el 04 de junio de 2014, dejándose también 
constancia de que actuó como Coordinador del Jurado el Tutor, Prof. Carlos Martínez 
 
Firma del Jurado Examinador. 
 
 
 
 
Prof. Carlos Martínez 
Presidente del Jurado 
 
 
 
 
 
 Prof. Ruth Illada Prof. Eduardo Vargas 
 Miembro del Jurado Miembro del Jurado 
 
 
iv 
 
AGRADECIMIENTOS 
 
 
 
Después de una larga travesía y llegar a la culminación de mi carrera como Ingeniero 
Industrial, aún cuando el mismo se traduce en un logro personal, resulta injusto pensar en 
no agradecer a aquellas personas e instituciones que hicieron posible el feliz término de 
este sueño: 
Primeramente al Dios creador de lo tangible e intangible, a la Virgen Santísima y al Dr. 
José Gregorio Hernández, por permitirme vivir una segunda oportunidad en este mundo. 
Al Prof. Carlos Martínez, quien más que un tutor, gran amigo y excelente guía. 
A los Profesores Yamile Delgado de Smith, Zaida Osto y Andrés Giménez, por sus 
invaluables aportes como validadores expertos del instrumento aplicado en esta 
investigación. 
A los Profesores Ninoska Maneiro
(+)
, Ruth Illada, Karelys Osta, Florángel Ortíz, Manuel 
Jiménez, Agustín Mejías y Carmen Guédez, por su constante estímulo y preocupación en la 
prosecución de mi carrera. 
A la Prof. Maritza Gudiño, sus palabras y ayuda me motivaron a retomar los estudios. 
A Nico Matson (Dirección General de Asuntos Estudiantiles de la UC), Raúl Martínez 
(Dirección de Asuntos Estudiantiles de Ingeniería), María Eugenia Troconis (Egreamigos 
UC) y al Ing. Franklin López, Presidente del Centro de Ingenieros del Edo. Carabobo, por 
la colaboración prestada para ubicar la data necesaria en la realización del estudio. 
A mi compañero de tesis, José Guerrero, amigo de tantos años. 
A todos mis profesores y compañeros de clase. 
A la centenaria Universidad de Carabobo y su Escuela de Ingeniería Industrial. 
 
A todos... Infinitas gracias. 
 
 
ASDRÚBAL FREITES CORONA 
 
"Señor que tanto me has dado, sé misericordioso 
y concédeme algo más: Un corazón agradecido" / Apóstol Pablo 
 
 
 
v 
 
 
 
 
 
Mi especial agradecimiento al Ing. Carlos Martínez, por habernos proporcionado el tema y 
su posterior tutoría. 
 
Agradezco también a los profesores Carmen Guédez, Manuel Jiménez y Andrés Giménez, 
por dedicar de su tiempo en la asesoría metodológica. 
 
A mi querido compañero tesista, Asdrúbal Freites; mi sincero agradecimiento por la 
armonía desarrollada durante la realización del Proyecto de Grado. 
 
En fin, a todos los que de alguna manera directa o indirectamente fueron parte de este 
trabajo, eternamente agradecidos. 
 
 
 
JOSÉ GUERRERO 
 
 
 
 
vi 
 
DEDICATORIAS 
 
 
 
A mis queridos Padres Jacoba y César, forjadores de una familia no abundante de bienes 
materiales, pero sí de valores y buenos principios. 
 
A mi fiel y amada esposa Tibisay, mi eterna novia y compañera de tantos años, brindando 
siempre una palabra de aliento en momentos de incertidumbre en la carrera, te amo. 
 
A mis dos grandes tesoros Ariana y Adrián, los cuales son la razón de mi existencia y a 
quienes trato de enseñarles siempre con acciones, el mejor de los ejemplos. 
 
A mis hermanos Yajaira y César, a veces cercanos, otras distantes, pero siempre conmigo. 
 
 
Asdrúbal Freites Corona 
 
 
 
 
 
 
 
 
A Dios, por ser la fuerza; el impulso que nos lleva, al logro de toda meta. 
 
A mis Padres, por el cariñoso apoyo siempre incondicional; este Título también les 
pertenece. 
 
A todos mis profesores y amigos de aula, por la paciencia prestada hacia mí. 
 
 
José Guerrero 
 
vii 
 
ÍNDICE GENERAL 
 
 Pág. 
ÍNDICE DE FIGURAS .............................................................................................. ix 
ÍNDICE DE TABLAS ............................................................................................... xv 
RESUMEN ............................................................................................................... xvi 
INTRODUCCIÓN ...................................................................................................... 1 
CAPÍTULO I: EL PROBLEMA 
1.1.- Planteamiento del problema ................................................................................. 3 
1.2.- Objetivos ............................................................................................................. 6 
 1.2.1.- Objetivo General .................................................................................... 6 
 1.2.2.- Objetivos Específicos ............................................................................. 6 
1.3.- Justificación ......................................................................................................... 7 
1.4.- Alcances y Limitaciones ...................................................................................... 7 
 
CAPÍTULO II: MARCO TEÓRICO 
2.1.- Antecedentes........................................................................................................ 8 
2.2.- Marco Teórico ................................................................................................... 10 
2.2.1.- AnálisisDescriptivo de Variables ......................................................... 10 
2.2.2.- Análisis de Supervivencia .................................................................... 14 
2.2.3.- Estimador de Kaplan-Meier .................................................................. 17 
2.2.4.- Comparación de Funciones de Supervivencia ....................................... 23 
2.2.5.- Modelo de Regresión de Cox................................................................ 25 
2.2.6.- Estimación de parámetros del modelo de Cox....................................... 28 
2.2.7.- Técnicas de Discriminación Estadística ................................................ 35 
 
CAPÍTULO III: MARCO METODOLÓGICO 
3.1.- Nivel y Diseño de la Investigación ..................................................................... 37 
3.2.- Población y Muestra .......................................................................................... 38 
3.3.- Fuentes y Técnicas para la Recolección de la Información ................................. 40 
 
viii 
 
3.4.- Técnicas de Procesamiento y Análisis de la Información .................................... 40 
3.5.- Fases de la Investigación .................................................................................... 41 
 
CAPÍTULO IV: ANÁLISIS E INTERPRETACIÓN DE LOS RESULTADOS 
4.1.- Análisis Descriptivo de la Muestra ..................................................................... 44 
 4.1.1.- Datos Personales y Familiares .............................................................. 45 
 4.1.2.- Datos Académicos ............................................................................... 59 
 4.1.3.- Datos Laborales.................................................................................... 67 
 4.1.4.- Características de la Búsqueda del Primer Empleo 
 como Ingeniero(a) Industrial ................................................................ 69 
 4.1.5.- Percepción de su Formación Profesional .............................................. 78 
4.2.- Modelación Estadística del Tiempo de Búsqueda del Primer Empleo 
 de los Egresados de la Escuela de Ingeniería Industrial 
 de la Universidad de Carabobo ........................................................................... 82 
 4.2.1.- Covariables Utilizadas .......................................................................... 84 
 4.2.2.- Modelo de Kaplan-Meier...................................................................... 86 
4.2.3.- Modelo de Riesgos Proporcionales de Cox ........................................... 88 
 
CAPÍTULO V: CONCLUSIONES Y RECOMENDACIONES 
5.1.- Conclusiones...................................................................................................... 96 
5.2.- Recomendaciones ............................................................................................ 100 
 
REFERENCIAS BILIOGRÁFICAS ...................................................................... 101 
ANEXOS 
Anexo 1: Cuestionario Virtual .................................................................................. 107 
Anexo 2: Formatos de Validación de Expertos del Instrumento 
 de Recolección de Datos ........................................................................... 121 
Anexo 3: Funciones de Supervivencia de las Covariables Estudiadas ....................... 138 
Anexo 4: Test Estadísticos de las Covariables No Significativas 
 en el Análisis de Kaplan-Meier ................................................................. 157 
 
 
ix 
 
ÍNDICE DE FIGURAS 
 
 Pág. 
Figura 1. Frecuencia de respuestas obtenidas durante el estudio .......................... 44 
Figura 2. Género de la muestra ............................................................................ 45 
Figura 3. Histograma de frecuencia y distribución de la edad de la muestra 
al momento de graduarse ...................................................................... 46 
Figura 4. Nacionalidad ........................................................................................ 46 
Figura 5. Poseer licencia de conducir al graduarse ............................................... 47 
Figura 6. Poseer vehículo propio al graduarse...................................................... 47 
Figura 7. Estar inscrito en el Servicio Militar o tener algún tipo de 
instrucción militar al momento de graduarse ......................................... 48 
Figura 8. Estado Civil al momento de graduarse .................................................. 48 
Figura 9. Número de hijos que tenía al momento de graduarse ............................ 49 
Figura 10. Rasgos físicos....................................................................................... 49 
Figura 11. Índice de Masa Corporal al momento de graduarse ............................... 50 
Figura 12. Color de los ojos .................................................................................. 51 
Figura 13. Temperamento ..................................................................................... 51 
Figura 14. Presentar alguna discapacidad al momento de graduarse ....................... 52 
Figura 15. Presentar alguna señal particular visible cuando egresó ........................ 52 
Figura 16. Religión ............................................................................................... 53 
Figura 17. Casa donde vivía al momento de graduarse .......................................... 53 
Figura 18. Lugar donde vivía al momento de graduarse ......................................... 54 
Figura 19. Sostenimiento económico durante la carrera ......................................... 54 
Figura 20. Grado de instrucción de la madre ......................................................... 55 
Figura 21. Ocupación de la madre ......................................................................... 55 
Figura 22. Grado de instrucción del padre ............................................................. 56 
Figura 23. Ocupación del padre ............................................................................. 56 
Figura 24. Histograma de frecuencia y distribución de la relación Ingreso 
Familiar / Salario Mínimo .................................................................... 57 
Figura 25. Histograma de frecuencia y distribución del Grupo Familiar ................ 58 
 
x 
 
Figura 26. Motivación recibida del grupo familiar ................................................. 59 
Figura 27. Ser egresado en otra carrera al momento de graduarse .......................... 59 
Figura 28. Histograma de frecuencia y distribución de los semestres cursados 
durante la carrera .................................................................................. 60 
Figura 29. Histograma de frecuencia y distribución del promedio de notas ............ 61 
Figura 30. Histograma de frecuencia y distribución del puesto de promoción ........ 62 
Figura 31. Tener dominio del idioma Inglés al momento de graduarse .................. 63 
Figura 32. Tener dominio básico de computación .................................................. 63 
Figura 33. Horas aprobadas en Congresos, Foros, Seminarios o similares 
durante la carrera .................................................................................. 64 
Figura 34. Publicar artículos, resúmenes de ponencias, guías, problemarios o 
similares durante la carrera ................................................................... 65 
Figura 35. Obtener menciones honoríficas o premiaciones al estudio durante 
la carrera .............................................................................................. 65 
Figura 36. Áreas del conocimiento donde fue sobresaliente durante la carrera ....... 66 
Figura 37. Trabajar en Áreas Relacionadas con la carrera durante la carrera ..........67 
Figura 38. Realizar pasantías durante la carrera ..................................................... 67 
Figura 39. Tener experiencia docente durante la carrera ........................................ 68 
Figura 40. Tener experiencia como líder social durante la carrera .......................... 68 
Figura 41. ¿Buscó trabajo inmediatamente después de graduarse? ......................... 69 
Figura 42. Principal motivo para no buscar trabajo al momento de graduarse ........ 69 
Figura 43. Histograma de los meses que tardó el egresado, desde el mismo 
momento en el que realmente comenzó a buscar su primer empleo 
como Ingeniero Industrial hasta conseguirlo ......................................... 70 
Figura 44. Causas por las cuáles cree que ha buscado y todavía no ha 
encontrado su primer empleo ................................................................ 71 
Figura 45. Estrategias utilizadas para la búsqueda de su primer empleo como 
Ingeniero Industrial .............................................................................. 71 
Figura 46. Estrategia más efectiva para la búsqueda de su primer empleo 
como Ingeniero Industrial ..................................................................... 72 
Figura 47. Ubicación de la empresa donde consiguió su primer empleo ................. 72 
 
xi 
 
Figura 48. Conocimientos, habilidades y competencias que fueron 
determinantes para conseguir su primer empleo como Ingeniero 
Industrial .............................................................................................. 73 
Figura 49. Haber trabajado como pasante en la empresa donde consiguió su 
primer empleo como Ingeniero Industrial ............................................. 74 
Figura 50. Cargo inicial al conseguir su primer empleo como Ingeniero 
Industrial .............................................................................................. 75 
Figura 51. Relación Sueldo Inicial / Salario Mínimo al momento de 
conseguir el primer empleo .................................................................. 76 
Figura 52. Principales actividades que desempeña o desempeñó el egresado 
en su primer empleo como Ingeniero Industrial .................................... 77 
Figura 53. Fortalezas presentes en la Escuela de Ingeniería Industrial de la 
Universidad de Carabobo ..................................................................... 78 
Figura 54. Debilidades presentes en la Escuela de Ingeniería Industrial de la 
Universidad de Carabobo ..................................................................... 79 
Figura 55. Modificaciones sugeridas al plan de estudio cursado en la Escuela 
de Ingeniería Industrial de la Universidad de Carabobo ........................ 80 
Figura 56. Áreas del conocimiento que le gustaría reforzar en el caso de 
querer realizar o estar realizando su Postgrado en Ingeniería 
Industrial de la Universidad de Carabobo ............................................. 81 
Figura 57. Tiempo de duración de la carrera .......................................................... 82 
Figura 58. Función de Supervivencia global del Tiempo de Búsqueda del 
Primer Empleo de los encuestados ........................................................ 87 
Figura 59. Función de Supervivencia de las Covariables obtenidas en el 
Modelo de Riesgos Proporcionales de Cox ........................................... 90 
Figura 60. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la 
covariable Número de Hijos al momento de graduarse ......................... 91 
Figura 61. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la 
covariable Estado Civil al momento de graduarse ................................. 92 
Figura 62. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la 
covariable Color de los Ojos ................................................................. 93 
 
xii 
 
Figura 63. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la 
covariable Edad al momento de graduarse ............................................ 94 
Figura 64. Probabilidad del Tiempo de Búsqueda del Primer Empleo de la 
covariable Edad al momento de graduarse ............................................ 95 
Figura A3.1. Función de Supervivencia de la Covariable Género ............................ 139 
Figura A3.2. Función de Supervivencia de la Covariable Edad al momento de 
graduarse ............................................................................................ 139 
Figura A3.3. Función de Supervivencia de la Covariable Nacionalidad ................... 140 
Figura A3.4. Función de Supervivencia de la Covariable Poseer Licencia de 
Conducir al momento de graduarse ..................................................... 140 
Figura A3.5. Función de Supervivencia de la Covariable Estar inscrito en el 
Servicio Militar o tener algún tipo de instrucción militar al 
graduarse ............................................................................................ 141 
Figura A3.6. Función de Supervivencia de la Covariable Estado Civil al 
momento de graduarse ........................................................................ 141 
Figura A3.7. Función de Supervivencia de la Covariable Números de hijos al 
momento de graduarse ........................................................................ 142 
Figura A3.8. Función de Supervivencia de la Covariable Rasgo Físico ................... 142 
Figura A3.9. Función de Supervivencia de la Covariable Índice de Masa 
Corporal ............................................................................................. 143 
Figura A3.10. Función de Supervivencia de la Covariable Color de los Ojos ............ 143 
Figura A3.11. Función de Supervivencia de la Covariable Temperamento ................ 144 
Figura A3.12. Función de Supervivencia de la Covariable Presentar alguna 
discapacidad al momento de graduarse ............................................... 144 
Figura A3.13. Función de Supervivencia de la Covariable Presentar alguna señal 
particular visible al momento de graduarse ......................................... 145 
Figura A3.14. Función de Supervivencia de la Covariable Religión a la que 
pertenece ............................................................................................ 145 
Figura A3.15. Función de Supervivencia de la Covariable Casa donde vivía al 
momento de graduarse ........................................................................ 146 
 
xiii 
 
Figura A3.16. Función de Supervivencia de la Covariable Lugar donde vivía al 
graduarse ............................................................................................ 146 
Figura A3.17. Función de Supervivencia de la Covariable Sostenimiento 
económico durante su carrera ............................................................. 147 
Figura A3.18. Función de Supervivencia de la Covariable Grado de Instrucción 
de la Madre ........................................................................................ 147 
Figura A3.19. Función de Supervivencia de la Covariable Ocupación de la 
Madre ................................................................................................. 148 
Figura A3.20. Función de Supervivencia de la Covariable Grado de Instrucción 
del Padre ............................................................................................ 148 
Figura A3.21. Función de Supervivencia de la Covariable Ocupación del Padre ....... 149 
Figura A3.22. Función de Supervivencia de la Covariable Relación Ingreso 
Familiar / Salario Mínimo al graduarse ............................................... 149 
Figura A3.23. Función de Supervivencia de la Covariable Grupo Familiar del 
egresado ............................................................................................. 150 
Figura A3.24. Función deSupervivencia de la Covariable Motivación recibida 
del grupo familiar ............................................................................... 150 
Figura A3.25. Función de Supervivencia de la Covariable Ser egresado en otra 
carrera al momento de graduarse ........................................................ 151 
Figura A3.26. Función de Supervivencia de la Covariable Semestres cursados en 
la carrera ............................................................................................ 151 
Figura A3.27. Función de Supervivencia de la Covariable Promedio de Notas 
obtenido en la carrera ......................................................................... 152 
Figura A3.28. Función de Supervivencia de la Covariable Puesto ocupado en la 
Promoción .......................................................................................... 152 
Figura A3.29. Función de Supervivencia de la Covariable Tener dominio del 
Idioma Inglés ..................................................................................... 153 
Figura A3.30. Función de Supervivencia de la Covariable Trabajar en Áreas 
Relacionadas con la carrera durante sus estudios ................................ 153 
Figura A3.31. Función de Supervivencia de la Covariable Realizar Pasantías 
durante la carrera ................................................................................ 154 
 
xiv 
 
Figura A3.32. Función de Supervivencia de la Covariable Horas aprobadas en 
Congresos, Foros, Seminarios o similares durante la carrera ............... 154 
Figura A3.33. Función de Supervivencia de la Covariable Haber publicado 
artículos, resúmenes de ponencias, guías, problemarios o 
similares durante la carrera ................................................................. 155 
Figura A3.34. Función de Supervivencia de la Covariable Haber obtenido 
menciones honoríficas o premiaciones al estudio durante la 
carrera ................................................................................................ 155 
Figura A3.35. Función de Supervivencia de la Covariable Tener experiencia 
docente durante la carrera ................................................................... 156 
Figura A3.36. Función de Supervivencia de la Covariable Tener experiencia 
como líder social durante la carrera .................................................... 156 
 
 
 
xv 
 
ÍNDICE DE TABLAS 
 Pág. 
Tabla 1. Prueba de igualdad de la función de supervivencia de dos grupos en 
el tiempo de observación ti...................................................................... 23 
Tabla 2. Prueba de igualdad de la función de supervivencia de M grupos en 
el tiempo de observación ti...................................................................... 24 
Tabla 3. Graduandos en la Carrera de Ingeniería Industrial. Universidad de 
Carabobo. Julio de 2007 a julio de 2012 ................................................. 38 
Tabla 4. Estadísticos descriptivos de la edad de la muestra al momento de 
graduarse ................................................................................................ 46 
Tabla 5. Estadísticos descriptivos de la relación Ingreso Familiar / Salario 
Mínimo .................................................................................................. 57 
Tabla 6. Estadísticos descriptivos del grupo familiar del encuestado .................... 58 
Tabla 7. Estadísticos descriptivos de los semestres cursados durante la 
carrera .................................................................................................... 60 
Tabla 8. Estadísticos descriptivos del promedio de notas ...................................... 61 
Tabla 9. Estadísticos descriptivos del puesto de promoción .................................. 62 
Tabla 10. Estadísticos descriptivos de Horas Aprobadas en Congresos, Foros, 
Seminarios o Similares durante la Carrera .............................................. 64 
Tabla 11. Estadísticos descriptivos de los meses que tardó el egresado, desde 
el mismo momento en el que realmente comenzó a buscar su 
primer empleo como Ingeniero Industrial hasta conseguirlo .................... 70 
Tabla 12. Estadísticos descriptivos de la relación entre el Sueldo Inicial y el 
Salario Mínimo al momento de conseguir su primer empleo ................... 76 
Tabla 13. Media del Tiempo de Supervivencia de las covariables (en meses) ......... 84 
Tabla 14. Media del Tiempo de Supervivencia de la muestra global de 
Ingenieros Industriales de la UC (en meses)............................................ 87 
Tabla 15. Covariables Significativas Analizadas y Test Estadísticos....................... 88 
Tabla 16. Covariables Resultantes en el Modelo de Riesgos Proporcionales 
de Cox .................................................................................................... 89 
Tabla A4.1. Covariables No-Significativas Analizadas y Test Estadísticos............... 158 
 
xvi 
 
 
 
UNIVERSIDAD DE CARABOBO 
FACULTAD DE INGENIERÍA 
ESCUELA DE INGENIERÍA INDUSTRIAL 
 
 
TRABAJO ESPECIAL DE GRADO: 
MODELACIÓN ESTADÍSTICA DEL TIEMPO 
DE BÚSQUEDA DEL PRIMER EMPLEO 
CASO: INGENIEROS INDUSTRIALES DE LA UNIVERSIDAD DE CARABOBO 
 
 
Tutor: Autores: 
Dr. Carlos Martínez - Br. Asdrúbal Freites C. 
 C.I. 08.836.853 
 - Br. José Guerrero 
Dr. Carlos Martínez C.I. 11.220.330 
 
 
RESUMEN 
 
En este Trabajo Especial de Grado se diseñó una metodología estadística para Modelar el 
Tiempo de Búsqueda del Primer Empleo significativo de los Ingenieros Industriales de la 
Universidad de Carabobo desde el momento que efectivamente lo comienza a buscar, hasta 
que lo consigue. Por las características de los datos, se aplicó la metodología de Análisis de 
Supervivencia. La población la conformaron los graduandos entre los meses de julio del 
año 2007 hasta julio de 2012. Se aplicó el Método de Estimación de Kaplan-Meier a la 
muestra como un conjunto homogéneo, para construir funciones de supervivencia 
individuales de cada una de las covariables estudiadas. Luego, utilizando el método para 
poblaciones heterogéneas denominado Modelo de Riesgo Proporcionales de Cox, se 
introducen al mismo, las covariables externas que resultaron estadísticamente significativas 
al aplicarles el test estadístico de Log-rank. Estas covariables muestran ciertas 
características de los egresados, de forma tal que se pueda estimar su posible efecto sobre el 
tiempo de supervivencia y obtener así el modelo definitivo. Para el análisis de datos y la 
modelación estadística se utilizó el Lenguaje R. Finalmente, se hicieron las 
recomendaciones tendientes al mejoramiento de la calidad del perfil del egresado en 
Ingeniería Industrial de la Universidad de Carabobo. 
 
Palabras clave: Primer Empleo, Análisis de Supervivencia, Estimador de Kaplan-Meier, 
Modelo de Riesgos Proporcionales de Cox. 
 
1 
 
INTRODUCCIÓN 
 
Cuando un estudiante culmina sus estudios y finalmente egresa como Ingeniero 
Industrial de la Universidad de Carabobo, al momento de iniciar la búsqueda de su primer 
empleo, comienza un proceso en el cual interrelacionan un conjunto de variables que 
influyen para acortar o alargar el tiempo del mismo. 
 
El objetivo de este estudio es construir un modelo estadístico que permita determinar 
cuáles son estas variables. Por la naturaleza del mismo, se utilizará la técnica de Análisis de 
Supervivencia, ya que interpreta el análisis de los datos desde un punto de partida hasta el 
momento que acontece un evento en particular. Otra característica asociada a este tipo de 
datos es la censura, la cual se refiere a que durante el período que dura el estudio, no se 
observa el evento en algún individuo en particular. 
 
A partir de Análisis de Kaplan-Meier se estudiará cada una de las variables para 
determinar aquellas que realmente influyen en el tiempo de búsquedadel primer empleo, 
aplicando el Modelo de Riesgos Proporcionales de Cox. Aunque fundamentalmente este 
modelo se ha aplicado en el sector salud (modelos de supervivencia) y en el industrial 
(modelos de fiabilidad), en este estudio se aplicará, como se ha dicho, para modelizar el 
tiempo que tarda un egresado en Ingeniería Industrial de la Universidad de Carabobo en 
conseguir su primer empleo significativo, desde el momento que comienza a buscarlo hasta 
que lo obtiene. 
 
Con base en lo anterior, se ha estructurado esta investigación en cinco Capítulos de la 
siguiente manera: 
 
Capítulo I: Se hace una breve descripción y el planteamiento del problema de la Tesis, 
se demarcan los objetivos, la justificación, el alcance y las limitaciones de la misma. 
 
 
2 
 
Capítulo II: Esboza lo referente a las bases teóricas, se desarrollan cada una de las 
investigaciones que dan soporte conceptual y que permite el adecuado abordaje a la 
metodología de estudio, como son los antecedentes y las bases teóricas. 
 
Capítulo III: Desarrolla el marco metodológico, mostrando el nivel y el diseño de la 
investigación, población y muestra, las fuentes y técnicas utilizadas para recolectar la 
información, las técnicas de procesamiento y análisis de la información. También detalla 
las distintas Fases a cumplir durante el estudio. 
 
Capítulo IV: Analiza e interpreta los resultados obtenidos mediante un análisis 
descriptivo de las respuestas obtenidas a través del instrumento. Además se aplica el 
Análisis de Supervivencia (Kaplan-Meier y Cox) y se presenta el Modelo Estadístico del 
Tiempo de Búsqueda del Primer Empleo de los egresados de la Escuela de Ingeniería 
Industrial de la Universidad de Carabobo. 
 
Por último, en el Capítulo V: Se presentan las Conclusiones y Recomendaciones 
obtenidas en este trabajo de investigación. 
 
 
 
 
 
 
 
3 
 
CAPÍTULO I 
EL PROBLEMA 
 
1.1.- PLANTEAMIENTO DEL PROBLEMA 
 
La Ingeniería Industrial es la rama de la ingeniería que se ocupa del diseño, 
mejoramiento e instalación de los sistemas integrados por personas, materiales, 
información, equipo y energía. Requiere de conocimientos especializados y habilidades en 
ciencias matemáticas, físicas y sociales, conjuntamente con los principios y métodos de 
análisis y diseño de ingeniería para especificar, predecir y evaluar los resultados que se 
obtendrán de tales sistemas (Salvendy, 1991). Su rol es el de facilitar la generación de 
productos de calidad, ya sean bienes o servicios, optimizando la utilización de los insumos 
y recursos teniendo siempre un enfoque integral de las organizaciones para el beneficio de 
la humanidad. 
 
Los orígenes de esta disciplina, se remontan a mediados del siglo XVIII, en los tiempos 
de la revolución industrial en Inglaterra. Entre los pioneros se encuentran Arkwright, 
creador en 1771 de un sistema para regularizar la producción y las tareas en las fábricas 
(López, 2004); Watt y Robinson, quienes establecen en 1794 un método de mejoramiento 
de la productividad a partir de la disminución de desperdicios y control de costos (Sábato y 
Mackensie, 2009). A comienzos del siglo XX, los esposos Gilbreth introducen la técnica 
moderna del estudio de movimientos (Claude, 2005) y Taylor establece las bases para 
maximizar la producción (Barba, 2010). Maynard, Stegemerten y Lowry desarrollaron en 
1948 el sistema de tiempos predeterminados MTM
1
 (Meyers, 2003); en 1917 Gantt hizo 
trabajos relacionados con problemas de programación, creando los gráficos que llevan su 
nombre, los cuales dieron paso al desarrollo de las técnicas CPM
2
 y PERT
3
 (Krajewski y 
Ritzman, 2000). Actualmente, las técnicas de la Ingeniería Industrial se han propagado a 
casi todo el mundo, contribuyendo a mejorar el nivel de vida y el aumento de la 
productividad y competitividad de los pueblos. 
 
1 Methods Time Measurement. 
2 Critical Path Method. 
3 Program Evaluation and Review Technique. 
 
4 
 
 
En 1958 comienza sus actividades en la Universidad de Carabobo
4
, la primera Escuela 
de Ingeniería Industrial de Venezuela. Posteriormente, la oferta de esta carrera se va 
ampliando, cubriendo actualmente casi todo el territorio nacional, debido a la creación de 
nuevas instituciones tanto públicas como privadas (Illada, 2007). Según un documento 
publicado por la Asociación Iberoamericana de Instituciones de la Enseñanza de la 
Ingeniería (ASIBEI, 2005, citado en Illada, 2007) titulado Directrices Curriculares para 
Carreras de Ingeniería en Iberoamérica, compilado por el Ing. Albina, y usando como una 
de las fuentes de información al Núcleo de Decanos de Ingeniería de Venezuela, a través 
del Ing. Fernando Miralles y del Ing. Mario Herrera, en el país se dictan 379 carreras largas 
de cinco años de duración, las cuales confieren 35 títulos diferentes de Ingeniero, así como 
también 453 carreras cortas de tres años, que otorgan títulos de Técnico Superior con 97 
diferentes denominaciones. Las cinco carreras de Ingeniería más ofrecidas son: Industrial, 
Sistemas, Civil, Eléctrica y Electrónica, las cuales representan el 64,9% del total de las que 
se dictan en el país, destacándose la Ingeniería Industrial como la de mayor oferta con 
22,4%, seguida por la de Sistemas con 20,6. 
 
El Ingeniero Industrial de la Universidad de Carabobo es un profesional cuya 
formación lo capacita principalmente, para el análisis de problemas, la implementación de 
soluciones y el modelado de sistemas, en relación con los siguientes campos fundamentales 
de acción profesional: 1) Planificación, programación, organización, evaluación y control 
de las operaciones en la producción de bienes y servicios; 2) Gerencia de sistemas, 
procesos de formulación y ejecución de proyectos en organizaciones de diversa índole, 
principalmente las de carácter productivo, con énfasis en el manejo de los problemas y 
generación de alternativas en las áreas de administración y desarrollo de la organización y 
3) Formulación y aplicación de modelos cuantitativos para el estudio de fenómenos 
inherentes a sistemas productivos y sistemas sociales, con énfasis en los objetivos de 
mejoramiento y optimización
5
. 
 
4 El 21 de marzo de 1958 se crea la Universidad de Carabobo con el funcionamiento de tres facultades: 
Derecho, con la Escuela de Derecho Miguel José Sanz; Medicina, con la Escuela de Medicina e Ingeniería, 
con la Escuela de Ingeniería Industrial (Burgos, 1998). 
5 Página web de la Facultad de Ingeniería de la Universidad de Carabobo (www.ing.uc.edu.ve). 
 
5 
 
 
Cañas y Marchán (2003) indican que para el año 2003, el 43% de las empresas de la 
Zona Industrial de Valencia reconocen a la Universidad de Carabobo como líder en cuanto 
a las competencias de sus egresados en esa carrera, cifra aunque aceptable, resulta 
preocupante tomando en cuenta que el resto está conformado mayormente por graduados de 
universidades cuyas sedes se encuentran fuera de la región. Por otra parte, Maneiro y 
Mejías (2007) destacan que este profesional se enfrenta, en sus primeras experiencias 
laborales, a un mundo empresarial con necesidades y exigencias aparentemente distintas a 
las percibidas desde el ambiente académico; sugiriendo una brecha con respecto a la 
formación impartida en la Escuela, lo cual no le permite a sus egresados mantener su 
competitividad ante dichos cambios. 
 
Actualmente las empresas consideran al capital humano como el recurso más valioso 
con el que cuentan, por esto, las exigencias del mercado laboral están caracterizadas por 
una sólida formación profesional y personal. Si a esto se le suman las cambiantes 
características del mismo debido a aspectos políticos, sociales y económicos del país, el 
papel de las universidades en Venezuela, es todavía más significativo. La Escuelade 
Ingeniería Industrial de la Universidad de Carabobo debe garantizar a sus estudiantes, 
implementar una formación académica acorde con las exigencias de este mercado. Para 
lograrlo, necesita retroalimentarse constantemente con sus nuevos requerimientos. Su 
desconocimiento traerá como consecuencia la desventaja competitiva de sus egresados 
frente a los de otras instituciones de educación superior del país. 
 
Tan importante como conocer y adaptarse al constante cambio del mercado, es 
igualmente entender la condición actual del mismo. Tradicionalmente la edad, el promedio 
de notas obtenidas durante la carrera, el dominio de otros idiomas y los estudios 
extracurriculares como diplomados y cursos de especialización, entre otros, han sido los 
requisitos demandados por las empresas a la hora de solicitar profesionales recién 
graduados. Por la escasa información existente, los autores aplicaron un estudio 
 
6 
 
exploratorio a una muestra de ingenieros industriales
6
, con el fin de obtener una primera 
aproximación del caso en estudio; en la misma se pudo determinar que el 50% de la 
muestra de egresados antes de 1998 obtuvo su primer empleo entre los 2 y 4 meses de 
haberse graduado; mientras los egresados entre 1999 y 2010, el 40% lo consiguió entre 6 y 
9 meses. El perfil que exigieron las empresas para ambos grupos indicaban: sexo, edad, 
conocimientos de idiomas extranjeros, cursos de especialización, lugar de residencia, 
manejo de software, experiencia previa, entre otros. Como estos factores representan 
elementos críticos de la presente investigación, se diseñará una metodología estadística para 
modelar la influencia de los mismos en el tiempo de búsqueda del primer empleo. 
 
Tomando en consideración lo antes expuesto, se plantean los problemas de la 
investigación: ¿Cuál es el modelo estadístico que mejor describe el tiempo de búsqueda del 
primer empleo de los egresados de la Escuela de Ingeniería Industrial de la Universidad de 
Carabobo? ¿Cuáles son los factores que influyen en la búsqueda del primer empleo de los 
ingenieros industriales de la Universidad de Carabobo? 
 
1.2.- OBJETIVOS 
 
Objetivo General 
Modelar estadísticamente el tiempo de búsqueda del primer empleo de los egresados de 
la Escuela de Ingeniería Industrial de la Universidad de Carabobo. 
 
Objetivos Específicos 
 Identificar los factores que históricamente han influido en la búsqueda del primer 
empleo de los ingenieros industriales. 
 Diseñar un estudio estadístico para modelar el tiempo de búsqueda del primer 
empleo de los ingenieros industriales de la Universidad de Carabobo. 
 
6 Este estudio exploratorio se basó en una encuesta realizada vía telefónica, a una muestra de 40 Ingenieros 
Industriales: 20 egresados antes del año 1998 y 20 egresados entre 1999 y 2010, independientemente de la 
universidad de procedencia. 
 
7 
 
 Aplicar un instrumento de recolección de datos, para obtener la información 
necesaria en el estudio. 
 Identificar los factores influyentes en el tiempo de búsqueda del primer empleo de 
los ingenieros industriales de la Universidad de Carabobo, a través del análisis 
estadístico de los resultados. 
1.3.- JUSTIFICACIÓN 
 
La investigación aquí planteada es importante en dos sentidos, uno académico y uno 
institucional. En lo académico, la investigación proporciona una metodología estadística 
que permita modelar los factores influyentes en el tiempo de búsqueda del primer empleo 
de los Ingenieros Industriales de la Universidad de Carabobo durante un período de tiempo 
bien definido, para lo cual se analizarán las técnicas estadísticas estudiadas durante el 
desarrollo de la carrera. También permitirá a los investigadores cumplir con los 
requerimientos necesarios para optar al título de Ingeniero Industrial. A nivel institucional, 
la investigación será de suma importancia ya que con el cálculo de la probabilidad del 
tiempo de búsqueda del primer empleo anteriormente descrito y de los factores influyentes 
en el mismo, se podrán diseñar estrategias, maximizando así el uso de los recursos 
disponibles, mejorando la calidad del perfil de estos profesionales. 
 
1.4.- ALCANCE Y LIMITACIONES 
 
La presente investigación pretende realizar una modelación estadística del tiempo de 
búsqueda del primer empleo de los egresados en la Escuela de Ingeniería Industrial de la 
Universidad de Carabobo entre julio de 2007 y julio de 2012, período de tiempo para el 
cual se cuenta con información disponible y necesaria para el estudio. La recolección de 
datos se hará a través de una encuesta telefónica o por correo electrónico, dependiendo de 
la información obtenida del graduado, aplicada a una muestra representativa de los 815 
egresados que forman el total de la población. Como limitante se tiene, la obsolescencia de 
algunos datos (teléfono y e-mail), dificultando que el instrumento no pueda llegar a los 
egresados en estudio. 
 
8 
 
CAPÍTULO II 
MARCO TEÓRICO 
 
2.1.- ANTECEDENTES 
 
Los antecedentes son todos los hechos anteriores a la formulación del problema útiles 
para aclarar, juzgar o interpretar el problema planteado (Tamayo, 2003). Partiendo de esta 
definición, no existe ningún tipo de investigación en la Universidad de Carabobo ni en las 
otras universidades del país donde se imparte la carrera de Ingeniería Industrial, que sirva 
como base para el análisis propuesto en esta investigación. Sin embargo, se cuenta con 
importantes trabajos realizados en Argentina, Colombia y España que, aunque analizan el 
problema para otras profesiones, se basan en metodología estadísticas aplicables al caso en 
estudio, los cuales se convierten en una fuente importante de información para la 
realización de este trabajo. Todas estas referencias fueron consultadas a través de Internet, 
debido a la difícil obtención de información por otros medios. 
 
En el estudio realizado por Córdova y Bermúdez (2002), se plantea un modelo para el 
estudio de tiempos de desempleo utilizando técnicas de análisis de supervivencia. Esta 
investigación sirve de apoyo porque presenta los pasos para realizar el análisis estadístico 
cuando existen datos censurados, situación que se plantea en la presente investigación, ya 
que el tiempo de desempleo de alguno de los individuos puede ser desconocido si 
permanecen en esa situación al final del período de estudio. 
 
González, Dávila y Gil (2004) estudiaron la longitud del primer episodio de 
desempleo, entre los titulados de ciclos formativos de la isla de Gran Canaria, mediante la 
estimación de modelos de duración no paramétricos (Kaplan-Meier y Cox). Este estudio es 
de gran contribución, porque establece cómo se debe realizar una metodología estadística 
cuando existe una relación entre la ocurrencia de un evento y un intervalo de tiempo dado, 
situación que se hace presente en esta investigación. 
 
 
9 
 
En una investigación presentada por Borra, Gómez y Salas (2007) se examinaron los 
determinantes de la duración del primer desempleo de una cohorte de jóvenes graduados en 
las carreras del área económica de la Universidad de Sevilla. Este estudio es de gran 
utilidad en este proyecto, ya que presentan una metodología para identificar algunos 
factores que afectan la duración del primer período de desempleo, los cuales sirven de 
punto de referencia para diseñar el instrumento de recolección de datos y adaptarlo a los 
Ingenieros Industriales de la Universidad de Carabobo. 
 
García, García, Gómez y Fuentes (2008) aplicaron la metodología del Análisis de 
Supervivencia a una cohorte de egresados de la Diplomatura en Enfermería de la 
Universidad Católica San Antonio de Murcia, España, con el objetivo de modelar el tiempo 
invertido por los egresados universitarios en encontrar el primer empleo significativo. Este 
estudio presenta una metodología muy interesanteque podría ser aplicado a los Ingenieros 
Industriales de la Universidad de Carabobo, ya que utilizan el método Kaplan-Meier y una 
aplicación del modelo de Cox que toman en cuenta factores de ciertas características de los 
egresados, estimando su posible efecto sobre el tiempo de supervivencia, el cual es uno de 
los objetivos de este estudio. 
 
Castillo, Castro y Osorio (2011) analizaron información primaria de los egresados de 
cuatro universidades de Cali, identificando los principales determinantes de la duración del 
desempleo de los profesionales en las ciencias económicas y administrativas e ingeniería, y 
su relación con estudios en Colombia, durante el periodo 2001-2006. Este trabajo servirá de 
gran apoyo, ya que muestra diferentes metodologías estadísticas que pueden ser aplicables 
a este tipo de estudio, entre las cuales se puede seleccionar, la que mejor se adapte al 
tiempo de búsqueda del primer empleo de los ingenieros industriales egresados de la 
Universidad de Carabobo. 
 
 
 
 
 
 
10 
 
2.2.- MARCO TEÓRICO 
 
2.2.1.- Análisis Descriptivo de Variables 
 
La Estadística es la ciencia y arte de planificar un estudio, registrar, recolectar, 
elaborar, presentar y publicar los datos, para efectuar análisis válidos y coherentes; predecir 
según los resultados y llegar a decisiones razonables (Martínez, 2008). Tiene un sentido 
ilimitado de aplicaciones, ya que todas las ciencias y el quehacer diario de nuestra 
existencia, están sujetos a ella. Se encuentra dividida en dos grandes grupos: 1) Estadística 
Inferencial y 2) Estadística Descriptiva. 
 
La Estadística Inferencial: proporciona métodos para estimar las características de un 
grupo total o población, basándose en datos de un subconjunto de la población o muestra de 
observaciones. Realiza inferencias objetivas basadas en los datos obtenidos. Utiliza la 
estadística descriptiva como el primer paso antes de la realización de inferencias. 
 
La mente humana no puede extraer fácilmente toda la importancia de una serie de 
datos desorganizados, sin la ayuda de técnicas especiales. Cuando los conjuntos de datos 
son muy grandes, deben experimentar un proceso de organización y resumen que sean 
entendibles por personas no familiarizadas con la investigación. Por ello es que la 
Estadística Descriptiva proporciona herramientas para organizar, simplificar y resumir 
información básica a partir de un conjunto de datos que de otra forma sería poco manejable. 
Incluye la tabulación, representación y descripción de conjuntos de datos tanto de variables 
numéricas como de variables categóricas. Es la primera tarea a realizar en el análisis de los 
datos, ya que su misión es describir los datos, valores o puntuaciones obtenidos para cada 
variable y sirve de base para otros análisis más avanzados. 
 
Población: es un conjunto de elementos con ciertas características que pueden ser 
observadas y medidas. Será finita cuando los elementos que la componen pueden ser 
contados e infinita cuando son ilimitados y muy difíciles e imposibles de ser contados. 
 
 
11 
 
Muestra: es un subconjunto de la población, donde los elementos seleccionados son 
representativos de los demás elementos integrantes de la población. Las observaciones son 
analizadas y procesadas como si se trataran del total de la población en estudio. 
 
Análisis Descriptivo de una Variable 
 
Los elementos fundamentales de la descripción de una variable se pueden resumir de 
esta forma: tipos de variables, las distribuciones de frecuencias, gráficas estadísticas, 
medidas de centralización, dispersión y posición. 
 
Variable: es una característica que se observa en una población o muestra, y la cual se 
desea estudiar. Puede tomar diferentes valores, dependiendo de cada individuo, 
clasificándose de la siguiente manera: 
 
a) Variable cuantitativa: es aquella que toma valores numéricos. Se subdivide en 
Continua: cuando son valores reales y pueden tomar cualquier valor dentro de un 
intervalo. Ejemplo: peso, estatura, sueldos y Discreta: cuando toma valores 
enteros. Ejemplo: N° de hijos de una familia, N° de alumnos de un curso. 
 
b) Variable cualitativa: es aquella que describe cualidades. No son numéricas y se 
subdividen en: Nominal: cuando son cualidades sin orden. Ejemplo: Estado civil, 
preferencia por una marca, lugar de residencia; Ordinal: cuando denotan 
cualidades que representan un orden y jerarquía. Ejemplo: nivel educacional, días 
de la semana, calidad de la atención, nivel socioeconómico y Dicotómicas: 
cuando tienen sólo dos modalidades posibles. Ejemplo Si y No, Masculino y 
Femenino. 
 
 
 
 
 
 
12 
 
Distribuciones de Frecuencias 
 
Sea cual sea el tipo de variable, lo que se tiene como información de una variable en 
una muestra es un número finito de n datos, es decir, de valores o de anotaciones sobre qué 
modalidad (cualitativas) o qué valor (cuantitativas) tiene cada elemento de la muestra; a 
este conjunto de datos se le llama distribución y, salvo cuando el tamaño de muestra n sea 
muy pequeño, se debe resumir para se pueda comprender bien los resultados. Un primer y 
obligado paso de ese resumen de datos es el simple recuento de las repeticiones de un 
mismo valor o modalidad; ello nos conduce al concepto fundamental de frecuencia, con dos 
enfoques: Frecuencia absoluta es el número de veces que una modalidad o un valor de una 
variable aparece entre los datos de una muestra y Frecuencia relativa es su frecuencia 
absoluta dividida entre el tamaño muestral, es decir, la proporción de veces que aparece esa 
modalidad o valor entre todos los datos de la muestra. 
 
Gráficas Estadísticas 
 
Las distribuciones de frecuencias se presentan en tablas o bien en gráficas. Estas 
últimas deben reflejar fielmente lo que tratan de representar, fundamentalmente las 
frecuencias de cada modalidad o valor. Existen diversos tipos de gráficas, cada uno de ellas 
adecuado a un cierto tipo de variables, por lo que se pueden clasificar atendiendo a estos 
tipos. Así, para variables Cualitativas se pueden mencionar: el diagrama de barras o 
rectángulos y el diagrama de sectores. Hay otras menos frecuentes pero igualmente 
válidas para variables cualitativas como los pictogramas, los cartogramas y los 
diagramas de superficie. Por su parte, para variables Cuantitativas los tipos de gráficas 
más importantes son los siguientes: el Diagrama de segmentos, el polígono de 
frecuencias y el histograma o histograma de rectángulos. 
 
Parámetros de una Distribución 
 
Se trata de resumir la información de una tabla o de una gráfica y de encontrar algunos 
valores lo más simples posible que nos permitan dar información sobre la muestra de n 
 
13 
 
elementos o comparar dos muestras entre sí. Para hacer ese resumen o información de los 
datos hay tres enfoques fundamentales: 1) Medidas o parámetros de centralización, 
tendencia central o posición central, 2) Medidas o parámetros de dispersión y 3) Medidas o 
parámetros de posición (cuantiles). 
 
Entre las Medidas de Tendencia Central se definen la Moda: como el valor de la 
variable con mayor frecuencia en la muestra, el que se repite más (moda se asocia con lo 
más frecuente); la Mediana es el valor ubicado en el centro de la distribución, es decir, el 
valor que supera a la mitad de los de la muestra y se ve superado por la otra mitad (salvo 
empates en ambos casos); se calcula buscando el valor de la muestra que ocupa el lugar 
[(n+1)/2], con los datos ordenados y la Media o Media Aritmética: es el centro de 
gravedad de la distribución, o fiel de la balanza entre todos los datos. Se calcula sumando 
los datos y dividiendo entre el tamaño de la muestra, esto es, entre el número de datos. 
Existen otras medidas de centralización de uso menos frecuente, como la Media 
Ponderada (que es una media aritmética con distintos pesos de importancia para los 
distintos datos), La MediaGeométrica (raíz enésima del producto de los datos) y la 
Media Armónica (la inversa de la media aritmética de los inversos de los datos). 
 
Las Medidas de Dispersión más utilizadas son: la Desviación Absoluta Media que es 
la media aritmética de los valores absolutos de las desviaciones, se calcula tomando como 
positivas todas las desviaciones, sumándolas y dividiendo entre n; la Varianza es la media 
aritmética de los cuadrados de las desviaciones, se obtiene elevando al cuadrado cada 
desviación, sumando esos cuadrados y dividiendo entre n; la Desviación Standard o 
Desviación Típica, la cual es la más usada de las medidas de dispersión y es igual a la raíz 
cuadrada de la varianza. Es útil para describir cuánto se apartan de la media de la 
distribución los elementos individuales. Una medida de ello se denomina puntuación 
estándar: es el número de desviaciones a las que determinada observación se encuentra con 
respecto a la media y el Coeficiente de Variación, a menudo expresado en tanto por 
ciento, entre la desviación típica y la media de una distribución. Además de las citadas, la 
más simple de las medidas de dispersión es el Rango, Recorrido ó Amplitud, el cual es la 
 
14 
 
diferencia entre el valor máximo y el mínimo de la muestra, y que indica qué extensión de 
la recta de los números ocupan los datos de nuestra muestra. 
 
Entre las Medidas de Posición (Cuantiles) se tiene: los Cuartiles, que definen las 
cuartas partes de la muestra mediante tres “cortes”: el primer cuartil deja por debajo al 25% 
de la distribución, el segundo coincide con la mediana y el tercero deja por debajo al 75% 
de la distribución; los Deciles, dan nueve cortes para definir de diez en diez por ciento los 
valores de la distribución; así, el primer decil deja por debajo una décima parte de la 
distribución, el segundo dos décimas partes, etc., hasta nueve deciles y los Percentiles, que 
son como los deciles pero de uno en uno por ciento, y por tanto son noventa y nueve; por 
ejemplo, el percentil 37 deja por debajo al 37% de la distribución. Todos los cuantiles son 
definibles sobre variables cuantitativas o sobre cualitativas ordinales, porque requieren 
siempre que los datos estén ordenados. 
 
2.2.2.- Análisis de Supervivencia 
 
El Análisis de Supervivencia está formado por un conjunto de técnicas estadísticas 
apropiadas para estudios de seguimiento, en los que interesa analizar la variable intervalo 
de tiempo transcurrido entre un evento inicial y uno final perfectamente identificable, que 
puede presentarse durante el período de observación, así como el efecto que tienen sobre 
esta variable un conjunto de factores pronósticos utilizando, por ejemplo, el Modelo de 
Riesgos proporcionales de Cox. El término Supervivencia se debe a que en las primeras 
aplicaciones de esta técnica, el evento terminal que se estudiaba era el fallo de un elemento 
o la muerte del sujeto. Entre los objetivos básicos de un Análisis de Supervivencia se 
pueden establecer: Estimar e interpretar las funciones de supervivencia, comparar las 
funciones de supervivencia entre determinados grupos e identificar la influencia de 
variables explicativas sobre los tiempos de supervivencia observados (Kleinbaum, 1997). 
 
Cualquier variable puede medirse en forma instantánea, sin embargo, en temas de 
"supervivencia" la medición de la ocurrencia del evento de interés depende del tiempo de 
duración hasta que ocurra dicho evento, el cual suele ser bastante grande como para esperar 
 
15 
 
a que el mismo ocurra para todas las unidades experimentales al terminar el estudio. Es este 
hecho el que hace al análisis de supervivencia una herramienta fundamental y diferente 
para estudiar este tipo de fenómenos de duración (Hosmer y Lemeshow, 1999). 
 
En Análisis de Supervivencia, cuando se tienen casos o individuos a los que no les ha 
ocurrido el evento que se estudia se dice que estos casos son censurados. Las causas de esta 
situación pueden ser por ejemplo, cuando el evento (conseguir el primer empleo) no tiene 
lugar antes de que finalice el estudio; en otros, el investigador puede haber perdido el 
seguimiento de su estado en algún momento anterior a que finalice el estudio; y existen 
además casos que no pueden continuar por razones ajenas al estudio. Este tipo de censura 
es conocido como censura por la derecha, existe también censura por la izquierda en la cual 
por ejemplo se conoce, al momento de iniciar la investigación, la situación final del 
individuo pero no puede saberse cuando inició, y por lo tanto, no se tiene completa la 
información de la duración del evento. 
 
Si no existiese información censurada, es decir, si todos los sujetos fuesen seguidos 
completamente durante el mismo periodo de tiempo hasta que se produjera el evento final, 
en este caso conseguir el primer empleo, se podrían usar otros métodos estadísticos más 
sencillos. Ese es uno de los valores agregados para el uso de Análisis de Supervivencia. 
 
En Análisis de Supervivencia es de suma importancia la variable aleatoria T, que 
representa el tiempo de duración hasta la ocurrencia de un evento (muerte
7
, falla de un 
sistema, entre otros). La variable aleatoria T, posee una función de densidad de 
probabilidad f(t), y una función de distribución de probabilidad acumulada F(t) = P(T≤ t), 
que representa la probabilidad de que el evento de interés ocurra en un tiempo menor o 
igual que t. Para el Análisis de Supervivencia, es de especial interés la función de 
supervivencia S(t) = 1 - F(t) = P(T > t), la cual expresa la probabilidad de que el evento de 
interés ocurra en un tiempo mayor a t. 
 
 
7 Para efectos de esta investigación, “muerte” se refiere al evento que sucede cuando el egresado de Ingeniería 
Industrial de la Universidad de Carabobo consigue su primer empleo. 
 
16 
 
Barrera (2008), señala que otra función de interés para este análisis es la llamada 
Función de Riesgo
8
 conocida también como de Impacto, h(t), que representa el riesgo 
instantáneo de que un evento ocurra en un intervalo infinitamente pequeño de tiempo 
(t, t + Δt), dado que no ha ocurrido hasta el tiempo t, que se puede escribir como: 
 
 
 
 
 
 
Desarrollando la probabilidad condicional de la expresión anterior se obtiene: 
 
 
 
 
 
 
 
 
 
 
Del cálculo de probabilidades y del hecho de que P(T > t) = S(t), se tiene que: 
 
 
 
 
 
 
 
 
 
 
De la definición de derivada se tiene que la expresión (3) se convierte en: 
h(t) = f(t) / S(t) 
 
Se tiene entonces una expresión que relaciona la función de supervivencia y la función 
de riesgo. Si se integra la expresión (4), se obtiene entonces la función de riesgo 
acumulada: 
 
 
 
 
 
 
 
 
 
 
Que se puede escribir como: 
 
 
 
 
 , haciendo la sustitución 
 , y , se tiene que la expresión (4) se convierte en 
 
 
 
 , de donde resulta que las funciones del análisis quedan expresadas como: 
 
 
8 La “Función de Riesgo” en este estudio, se refiere a una medida de la probabilidad de que el Ingeniero 
Industrial consiga su primer empleo, por tal motivo, la interpretación de los resultados se hace a la inversa, ya 
que para este caso, hablar de “Riesgo” implica un “Beneficio”. 
(1) 
(2) 
(3) 
(4) 
(5) 
 
17 
 
Riesgo Acumulado: (5.1) 
Función de Supervivencia: (5.2) 
Riesgo Instantáneo: (5.3) 
Función de Distribución de Probabilidades: (5.4) 
 
2.2.3.- Estimador de Kaplan-Meier 
 
El estimador de Kaplan-Meier, de la función de supervivencia, es el estimador más 
común entre los paquetes estadísticos. El método de construcción del estimadores un 
método no paramétrico ya que no asume ninguna estructura para la función de distribución 
de probabilidad del tiempo de vida (Pérez, 1997). Este estimador utiliza toda la información 
disponible, casos censurados y no censurados, para realizar la estimación de la función de 
supervivencia. El estimador en cualquier instante de tiempo es obtenido de la 
multiplicación de una secuencia de probabilidades condicionales de supervivencia 
estimadas. Cada probabilidad condicional estimada se obtiene del número de casos 
observados en riesgo y el número de "muertes" en un instante de tiempo y se calcula como 
(n-d)/n, donde n es el número de casos en riesgo y d es el numero de "muertes" observadas. 
 
Supóngase una muestra de n observaciones independientes y sean t1 < t2 <...< tk los 
tiempo de vida observados y Tl el tiempo de vida de la observación de mayor duración en la 
muestra. Se define entonces: 
ni = Número de sujetos en riesgo en el instante ti 
di = Número de muertes en el instante ti 
ci = Número de censuras en el intervalo [ti, ti+1) 
Se puede ver que: n0 = n 
 t0 = 0 
 d0 = 0 
 c0 = 0 
 tk+1 ∞ 
 ni+1 = ni - di - ci 
 i = 1,2,., k - 1 
 
18 
 
 
El estimador de la función de supervivencia de Kaplan-Meier se calcula de la 
siguiente manera: 
 
 
 
 
 
 
De la ecuación (6), resulta que y que si no existen casos 
censurados. La función de supervivencia estimada se expresa entonces como: 
 
 
Varianza del Estimador Kaplan-Meier 
 
Adicional a la estimación de la función de supervivencia es de gran interés construir 
intervalos de confianza para los estimadores de la función de supervivencia así como de 
estimaciones puntuales y de intervalo para algunos percentiles. Aunque existen varios 
enfoques para tratar este problema, en este trabajo se tratará el enfoque del método delta el 
cual está basado en la expansión en series de Taylor de primer orden (Barrera, 2008). 
 
Método Delta 
 
La idea básica del método es usar una aproximación en series de Taylor para obtener 
una función lineal que aproxime una función más complicada como es el caso del 
estimador de la función de supervivencia. Para aplicar el método delta es necesario que la 
función pueda ser expresada en series de Taylor. 
 
Sea f(x) una función de densidad de probabilidad de una variable aleatoria X. La 
expansión en series de Taylor de primer orden alrededor de la media es: 
 
 
De la ecuación anterior se tiene que la varianza de la función f(x) es aproximadamente 
igual a: 
(6) 
(7) 
 
19 
 
 
 
 
Donde σ
2
 es la varianza de la variable aleatoria X. Como ejemplo se muestra la 
varianza para la función logaritmo natural y la función exponencial. 
 
Con la función logaritmo natural: 
 
 
 
 
 
 
 
 
 
Con la función exponencial: 
 
 
 
Varianza función de supervivencia 
 
Para calcular el estimador de la varianza a través del método delta del estimador 
Kaplan-Meier, primero se calcula el estimador delta del logaritmo natural así: 
 
 
 
 
 
 
 
 
 
 
 
Haciendo 
 
 
 , se tiene que la ecuación (12) se vuelve: 
 
 
 
 
Aplicando el operador varianza a ambos lados de la ecuación (13), se tiene que: 
 
 
 
(8) 
(9) 
(10) 
(11) 
(12) 
(13) 
(14) 
 
20 
 
 
Lo anterior debido a la suposición de independencia de las variables . Si además se 
supone que las se distribuyen como variables aleatorias Bernoulli con probabilidad 
constante . Se tiene entonces como estimador de a , y como estimador de la 
varianza la siguiente expresión 
 
 
 , ahora utilizando la ecuación (8) y (9) se tiene que: 
 
 
 
 
 
 
 
 
Utilizando el hecho de que 
 
 
 , la expresión (15) se convierte en: 
 
 
 
 
 
Reemplazando (16) en (14), se tiene que: 
 
 
 
 
 
 
La expresión (17) da una estimación de la varianza del logaritmo natural de la función 
de supervivencia, lo que se debe hacer ahora es aplicar nuevamente el método delta sobre la 
función exponencial (como se hizo en (10) y (11)) para eliminar el logaritmo natural de la 
expresión (17). 
 
Utilizando las ecuaciones (10) y (11) y el hecho de que , se 
tiene: 
 
 
 
 
 
 
 
 
Simplificando: 
 
 
 
 
 
 
 
 
La desviación estándar se calcula como la raíz cuadrada de la varianza dada en la 
expresión (18). 
(15) 
(16) 
(17) 
(18) 
(19) 
 
21 
 
 
Media muestral y varianza 
 
Adicionalmente, Barrera (2008) explica que el estimador usado para la media es 
debido a un resultado de la teoría de la probabilidad sobre variables aleatorias positivas el 
cual enuncia que la esperanza matemática de una variable aleatoria positiva es igual a la 
integral definida (área bajo la curva) desde cero hasta infinito de la función de 
supervivencia como se muestra a continuación: 
 
 
 
 
 
 
 
Debido a que la variable T no está definida para valores mayores a , 
 
 
 
 
 
El valor del estimador de la media es entonces el área de la función escalón definida 
por el estimador de Kaplan-Meier de la función de supervivencia así: 
 
 
 
 
 
Donde es el tiempo observado más grande, ahora si entonces el cálculo de 
la media se hace con: 
 
 
 
 
 
Cuando no se tienen casos censurados, la varianza de la media muestral se calcula 
como la varianza muestral dividida sobre el tamaño de la muestra. Cuando se presentan 
censuras el estimador de la varianza de la media muestral se calcula como: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
(20) 
(21) 
(22) 
 
22 
 
Donde , la cantidad total de muertes. En el caso en el que , la 
varianza se calcula como: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Estimación de percentiles y varianza 
 
Hosmer y Lemeshow (1999) destacan adicionalmente que la función de supervivencia 
estimada puede ser utilizada para la estimación de algunos percentiles. El cálculo de los 
percentiles se puede hacer en forma gráfica simplemente trazando una línea horizontal 
desde el eje Y de la gráfica de la función de supervivencia hasta que toque la línea vertical, 
seguidamente se proyecta ese punto sobre el eje X y se obtiene el valor del percentil 
deseado, pero el método grafico aunque ilustrativo se queda corto en precisión y en 
practicidad, por lo cual, se presenta un método más general y analítico que permite realizar 
cálculos más precisos. La fórmula para el cálculo se muestra a continuación: 
 
 
La varianza del estimador del p-ésimo percentil se estima con: 
 
 
En la anterior expresión el numerador se calcula con la ecuación (18), y el 
denominador que es la estimación de la función de densidad de la distribución de los 
tiempos de supervivencia se calcula así: 
 
 
Donde e , aunque se 
pudieran usar números inferiores al 0,05, éste en la práctica funciona bien. 
(24) 
(25) 
(26) 
(23) 
 
23 
 
 
2.2.4.- Comparación de Funciones de Supervivencia 
 
Supóngase que se tienen dos grupos de egresados de Ingeniería Industrial de la UC, 
uno compuesto por egresados que realizaron pasantías durante sus estudios y otro grupo 
que no las hizo, para lo cual se desea realizar un análisis de supervivencia independientepara cada grupo y se quiere comparar el efecto del hecho de que un egresado haya hecho o 
no pasantías sobre la función de supervivencia. Barrera (2008) señala que inicialmente una 
comparación gráfica de las funciones de supervivencia es importante e ilustrativa, sin 
embargo, a veces esta comparación gráfica se vuelve muy subjetiva y en algunos casos 
difíciles de hacer. Para solucionar este inconveniente se hace necesario contar con pruebas 
estadísticas que permitan identificar si las diferencias observadas entre las funciones de 
supervivencia son significativas. 
 
Las pruebas estadísticas están basadas en su mayoría en tablas de contingencia de 
grupo por estado de cada tiempo de supervivencia observado cómo se muestra en la tabla 1: 
 
Tabla 1. Prueba de igualdad de la función de supervivencia de dos grupos en el tiempo de observación ti 
Evento Grupo 1 Grupo 0 Total 
Muerte d1i d0i di 
No muerte n1i – d1i n0i – d0i ni - di 
En riesgo n1i n0i ni 
Fuente: Barrera, 2008. 
 
El estadístico de prueba se construye con el número esperado de muertes y la varianza 
del número de muertes para alguno de los dos grupos, por ejemplo para el grupo 1 se tiene 
que el estimador del número de muertes es: 
 
 
 
 
(27) 
 
24 
 
Y la varianza suponiendo una distribución hipergeométrica: 
 
Ya con los estimadores del número de muertes y su varianza se construye el estadístico 
de prueba Q. 
 
 
Bajo la hipótesis nula de que las dos funciones de supervivencia son iguales y que el 
número observado de eventos es grande se puede demostrar que Q se distribuye como una 
chi-cuadrado con un grado de libertad (p = P (x
2
 (1)) Q). Dependiendo del valor de wi, se 
tienen diferentes tipos de contrastes como por ejemplo: 
 
 Mantel y Haenzel 
 Breslow 
 Tarone y Ware 
 
El caso de más de dos grupos se trata en forma similar al caso ya visto de sólo dos 
grupos. Se muestra a continuación la tabla 2, asociada a varias funciones de supervivencia 
base para el cálculo de los estadísticos de prueba para la igualdad de las funciones: 
 
Tabla 2. Prueba de igualdad de la función de supervivencia de M grupos en el tiempo de observación ti 
Evento 1 2 … m … M Total 
Muerte d1i d2i … dmi … dMi di 
No muerte n1i – d1i n2i – d2i … nmi – dmi … nMi – dMi ni - di 
En riesgo n1i n2i … nmi … nMi ni 
Fuente: Barrera, 2008. 
 
Inicialmente se debe estimar el número esperado de muertes de cada grupo bajo la 
suposición de igual función de supervivencia, es decir: 
(28) 
(29) 
 
25 
 
 
 
Ya con varios grupos lo que se calcula ya no es una varianza sino una matriz de 
covarianzas del vector . La matriz de covarianzas es obtenida suponiendo que el número 
observado de eventos sigue una distribución hipergeométrica central multivariada. Los 
términos de la diagonal de la matriz denotada por , se calculan de la siguiente manera: 
 
 
Los elementos fuera de la diagonal se calculan como: 
 
 
Con los estimadores del número de muertes y la varianza se construye el siguiente 
estadístico: 
 
 
Donde es una matriz diagonal que tiene los pesos , es el vector que contiene 
la cantidad de muertes para cada grupo en el tiempo , es el vector que contiene el 
número esperado de muertes para cada grupo en el tiempo . Al igual que en el caso de dos 
grupos se tiene que para el caso de varios grupos, bajo la hipótesis nula de igualdad de 
funciones de supervivencia, se distribuye también como una chi-cuadrado con 
grados de libertad . 
 
2.2.5.- Modelo de Regresión de Cox 
 
Continuando con el ejemplo de querer comparar la supervivencia de dos grupos de 
egresados, el primero hizo pasantías en una empresa y el otro no, pero adicional a las 
(30) 
(31) 
(32) 
(33) 
 
26 
 
diferencias que puedan tener los dos tipos de estudiantes en cuanto a la participación del 
programa o no, existen otras diferencias debido a la condición propia de cada estudiante, 
por ejemplo la edad, el género, promedio de notas en la carrera, entre otras. En la situación 
anterior el análisis de Kaplan-Meier se queda corto debido a su imposibilidad de tener en 
cuenta estas otras "covariables" o características diferentes al hecho de haber realizado o no 
pasantías. Para estos caso, se utiliza el Modelo de Riesgos Proporcionales, presentado por 
Cox (1972), el cual plantea un modelo para el riesgo h(t), en función del tiempo y de 
variables explicativas o covariables. La idea básica del mismo es igual a la del análisis de 
regresión, la diferencia ocurre cuando se presentan casos censurados que hacen que los 
modelos de regresión clásicos como el análisis de regresión lineal y logística fallen, de 
hecho si no existiera censura en los datos estos modelos de regresión serían adecuados y 
suficientes. La presentación inicialmente se realizará sobre el supuesto de una sola 
covariable y después se generalizará a p variables, tal y como lo presenta Barrera (2008). El 
modelo de regresión que se trata en este trabajo se puede escribir así: 
 
 
La función de riesgo mostrada en (34), queda expresada por dos funciones. La función 
 que caracteriza como la función de riesgo cambia como una función del tiempo de 
supervivencia. Por otro lado la función expresa como la función de riesgo cambia 
como una función de las covariables medidas a los sujetos. La función que es la 
función de riesgo cuando es llamada la función base. 
 
La razón de riesgos de dos sujetos con valor de covariable y respectivamente es: 
 
 
Utilizando (34) y reemplazando en (35) se obtiene: 
 
 
(34) 
(35) 
(36) 
 
27 
 
De la expresión anterior se tiene que la razón de funciones de riesgo de dos individuos 
depende sólo de la función relacionada con la covariable . Si adicionalmente se 
supone una forma exponencial a la función de la covariable, se está ante el Modelo de 
Regresión de Cox o Modelo de Riesgos Proporcionales debido a que la razón de riesgos 
depende solamente del valor que tome la covariable. El modelo de Cox se puede escribir: 
 
 
En otras palabras, el modelo de Cox es un modelo semiparamétrico en el cual se 
supone una forma conocida para la función de las covariables y una desconocida para la 
función que depende sólo del tiempo de supervivencia (ver modelo Kaplan-Meier). La 
razón de funciones de riesgo se escribe como: 
 
 
Por ejemplo, si la variable X indicara el género de un estudiante codificado con X=1 si 
es hombre y X=0 si es mujer, se tendría que la razón de riesgos entre hombres y mujeres 
sería igual a: 
 
 
Ahora si de los cálculos resulta que , quiere decir que los hombres tienen un 
riesgo de no conseguir su primer empleo tres veces mayor que el riesgo de las mujeres. 
 
La cuestión ahora será calcular la función de supervivencia para un modelo que parte 
de la función de riesgo. De la ecuación (34), y con la función de riesgo (37) se obtiene: 
 
 
Donde es la función de riesgo acumulada que se puede calcular como: 
(37) 
(38) 
(39) 
 
28 
 
 
 
 
Sustituyendo (40) en (39) se tiene: 
 
 
De donde se sigue que: 
 
Donde es la función de supervivencia base. Ahora bajo la suposición del modelo 
de Cox (41) se convierte en: 
 
 
2.2.6.- Estimación de parámetros del modelo de Cox 
 
El procedimiento más utilizado para realizar la estimación de los parámetros de un 
modelo de regresión es el procedimiento relacionado con la verosimilitud, el cual 
básicamente consiste en estimar los parámetros que maximizan el logaritmo natural de la 
verosimilitud, en el caso del modelo de Cox este procedimiento no funciona, básicamente 
debido al desconocimiento de la función de riesgo base que aparece en el modelo. 
 
Por este motivo, Cox (1975) desarrolló un método que permite estimar los parámetros 
sin necesidad de asumir una forma particular para la función de riesgo base, propone 
entonces

Continuar navegando

Materiales relacionados

49 pag.
Introdução à Bioestatística

User badge image

Todo para que Aprendas

31 pag.
198 pag.
TGT-1284

User badge image

Estudia Aquí