“DISEÑO DE UN MODELO DE REGRESIÓN LINEAL PARA LOS SALARIOS DE JUGADORES DE BASEBALL DE LA MLB EN 1992 SEGÚN SU PERFORMANCE Y OTROS.”.
Enviado por Mikki • 31 de Enero de 2018 • 5.024 Palabras (21 Páginas) • 715 Visitas
...
La base de datos fue obtenida por un artículo de Watnik, (1998) , profesor de estadística y bioestadística de la Universidad de California, además cabe mencionar que la base original corresponde a 337 observaciones y 18 variables explicativas.
Se decidió acotar la muestra a 71 observaciones, pues la muestra era muy grande, esto no generará problemas en el modelo ya que los datos son tomados en un mismo año y de una misma clase de jugadores. Se tomó una muestra aplicando la técnica de muestreo aleatorio simple utilizando el software estadístico Minitab 16. Por otro lado el modelo cuenta con 7 variables exógenas porque muchas de ellas eran la sumatoria de otras variables o se encontró que no insidian en el modelo. Además en base a los nombres de cada jugador (incluido en la base de datos original), se investigó la raza de los mismos, para agregarla al análisis.
Las hipótesis planteadas como equipo fueron las siguientes:
- : Los parámetros estimados (coeficientes) asociados a variables de rendimiento son positivos, pues todas las variables exógenas por lo que se sabe del béisbol debieran influir de manera directamente proporcional con el sueldo de los jugadores de la liga mayor. A medida que la variable X aumenta Y también debiese aumentar.
- Se considera que la raza del jugador podría generar un efecto en el sueldo final de los jugadores, pues podría influir en el rendimiento deportivo, el cual se ve reflejado a lo largo de la historia del béisbol. Además se podría considerar un efecto de discriminación que pueda influir en la variable endógena, lo cual ha sido estudiado por varios autores del tema (Pascal & Rapping, 1970; Christiano , 1986).
- El índice de libre elegibilidad de agencia, corresponde a cuando el jugador es capaz de elegir su equipo a elección propia, al igual que representa la independización de su manager, se consideró que esta podría generar un efecto favorable en el sueldo, pues de esta forma casi el 100% del sueldo podría ser del jugador. Además esto nos dice que el jugador tiene experiencia, lo cual debería verse reflejado en el salario. Esta hipótesis también ha sido propuesta por otros autores (Hadley & Gustafson, 1991).
.
-
Definición de las variables
Se consideró que la población de interés es el conjunto de la Liga Mayor Jugadores (MLB) de béisbol que jugó al menos un partido, tanto en las temporadas de 1991 y 1992, con exclusión de los lanzadores. Este conjunto de datos contiene los salarios para la población del año 1992, junto con las medidas de rendimiento para cada jugador desde 1991 a 1992. Cuatro variables categóricas indican cómo cada jugador libre iba a pasar a otros equipos.
Los datos se obtuvieron del artículo publicado en:
http://www.amstat.org/publications/jse/v6n2/datasets.watnik.html
Cuyo origen primario de los datos corresponden a:
- CNN/Sports Illustrated (1992)
- The Society for American Baseball Research (SABR) (1992)
Variable endógena
- Y: Sueldo de los Jugadores de la Liga mayor de béisbol, medida en miles de dólares.
Es importante mencionar que en todos los estudios realizados para modelar el salario de los jugadores de baseball utilizan el logaritmo del salario en vez del salario como variable endógena en sí. Según Hoaglin & Velleman (1995) hay varias razones del por que se hace esto, por ejemplo el hacer que la distribución de la variable sea más simétrica, estabilizar la varianza, obtener un mejor ajuste, etc. Se seguirá el ejemplo de los autores estudiosos del área (Christiano , 1986; Hadley & Gustafson, 1991; Watnik, 1998) y se tomará como variable endógena al log(Y).
Variables exógenas:
- X1: Promedio de bateo
El promedio de bateo, también llamado porcentaje de bateo o media de bateo, es un número que se utiliza en el béisbol que representa la cantidad media de golpes (hits) que realiza un bateador por turno al bate. Este indicador se utiliza como medida de la habilidad de un bateador y se encuentra en el rango de 0 a 1, una buena marca se considera 0,30.
- X2: Número de carreras impulsadas
Una carrera impulsada se otorga a un bateador cuando su equipo anota una carrera como resultado de la aparición al plato de ese bateador. Es una medida de desempeño de un bateador, que depende tanto del jugador como de su equipo.
- X3: Número de dobles
Un doble se produce cuando un bateador logra llegar a segunda base sin ser puesto out y sin que haya error alguno de la defensiva.
- X4: Número de jonrones
Jugada en que el bateador golpea la pelota de tal manera que le permite hacer un circuito completo entre las bases y ganar una carrera.
- X5: Número de paseos
Walk o paseos, se le concede al bateador después que el pitcher le lanza 4 bolas. Si el bateador recibe 4 bolas, automáticamente avanza a primera base. Los corredores de bases que están forzados también avanzan.
- X6: Número de bases robadas
Se entiende como robo de base a una jugada efectuada por el equipo a la ofensiva, en la que, si el resultado es exitoso, el jugador que la llevó a cabo mejora su posición de juego (sin que el bateador le haya pegado a la bola).
- X7: [pic 4]
Corresponde a que el jugador es capaz de elegir su equipo, tendrá derecho a negociar y ser contratados por cualquier club sin ninguna restricción o calificaciones, por otra parte si la experiencia es suficiente el jugador también tiene elección a independizarse del Manager. Desde un punto de vista económico, parece razonable que si un jugador no es capaz de comercializar a sí mismo al mejor postor, su salario no será tan alto.
- X8: [pic 5]
Investigando sobre los jugadores más importantes en la historia del béisbol, se determinó que la mayor parte de ellos correspondía jugadores de raza blanca, por lo que se supuso que esta condición influiría
...