Análisis Econometría - Empleo EEUU
Enviado por Ensa05 • 28 de Abril de 2018 • 3.465 Palabras (14 Páginas) • 368 Visitas
...
Entonces, se puede comenzar a realizar una regresión para saber cuáles son los determinantes del empleo en Estados Unidos. Una vez que se conozcamos, evaluemos y ocupemos los datos útiles a usar en el estudio.
Datos
La fuente utilizada para hacer nuestro trabajo fueron los datos recopilados desde EE.UU. en el mes de abril del año 2007 tomando elementos como el salario semanal de los trabajadores, edad, raza, género, estado civil, lugar de donde proviene, nivel de educación y tipo de trabajo. Estas variables que vamos a utilizar, son debido a que nos otorga información suficiente para realizar nuestro modelo. Pero nos basamos en los contenidos vistos en clase durante el semestre para saber cuáles deberíamos mantener y sacar del modelo. Acá hay algunas razones del porque sacamos y mantuvimos algunas variables del modelo original:
- ¿Existen variables que no sean estadísticamente significativas?
- Si, estas son las variables: age, race, union, so_states, ce_states, we_states, y government.
Estas variables no son estadísticamente significativas, se sabe gracias a que mediante un test - T en base a una distribución normal ninguna de estas variables independientes supera el 5% de significancia igual a un T tabulado de 1,96. Pero no son excluidas del modelo por esta razón, ya que dependemos mucho de estos datos.
- ¿Porque hay variables cuya desviación estándar dice “Omitted”?
- Las variables en las que sale esa afirmación en el programa Stata son: ne_states, private, self y educ_lths.
- La gran mayoría de las variables de este modelo son “Dummys”, nuestra hipótesis es que algunas están ocupando espacio de más en el modelo. ¿Por qué?, pues hablemos de un caso hipotético de un modelo cualquiera en que sólo se trate de dos categorías, Hombre y Mujer, y luego se añade una variable dummy por cada categoría ¿Qué ocurrirá?, pues el programa Stata (que es el utilizado para hacer las regresiones lineales) va a omitir las variables agregadas, es decir, el agregar más variables de la misma categoría hará que sean perfectamente correlacionadas (por el principio de multicolinealidad perfecta para una misma categoria). Entonces se debe estimar el modelo sólo con una de las dos variables, ya sea la dummy para mujer o la dummy para hombre, pero no ambas, porque son excluyentes. Dicho esto, habrá algunas variables que deberán salir del modelo, las identificamos gracias a stata porque nos dirá que esos datos deben omitirse de nuestro modelo. Recordar que no es lo mismo omitir datos que eliminar datos, pues los datos que sacaremos de este modelo van a estar representado en las otras variables de la categoría y podrían interpretarse dentro de B0.
- ¿Porque la variable “race” tiene 3 resultados?
- Porque se refiere a tres tipos de resultado según el estudio que recopilaba los datos. Pero no podemos tener una variable dummy que tenga tres resultados, tendremos que dividirla en más variables, es decir, el resultado será 1 si es de raza blanca y 0 de no ser de raza blanca, así que en este caso decidimos que reemplazaremos la variable race usando el comando gen White=race, de esa forma si el individuo resulta ser de raza blanca el resultado de la variable White será 1, y en caso de que simplemente no sea de raza blanca el valor será cero.
Según el país estudiado (EE.UU.) esta podría presentar datos relevantes en la investigación, por ejemplo, el sólo hecho de que alguien que no sea de raza blanca solicite un puesto laboral en Estados Unidos reduce las probabilidades de encontrarlo, y si lo encuentra probablemente no sea contratado sólo por no ser de raza blanca, dado que la discriminación laboral en ese país es común para este sector de la población que solicita empleo. De todas formas analizaremos los resultados en el siguiente cuadro extraído de los datos en el mes de abril del año 2007.
---------------------------------------------------------------
Cuadro 1: Estadísticas descriptivas
A partir de nuestro modelo de regresión lineal y tomando en cuenta la variable explicada Employed hemos relacionado nuestras variables independientes como:
Variable
Mediana
Media
Std. Dev.
Min
Max
Employed
1
.8977011
.3030699
0
1
Earnwke
640
786.7278
570.4494
0
2884.61
Age
43
42.34751
11.44868
18
63
White
1
.8597701
.3472586
0
1
female
0
.4762452
.4994832
0
1
married
1
.6542146
.4756692
0
1
Unión
0
.1137931
.3175902
0
1
...