El profesor asistente de estadísticas, Paul Parker, está desarrollando métodos de aprendizaje automático y estadísticos para mejorar el análisis de encuestas complejas, gracias a una subvención de la National Science Foundation.
Actualmente, nos encontramos en plena revolución de la ciencia de datos y el aprendizaje automático. Estos avances han permitido analizar grandes volúmenes de datos de manera muy eficiente. Sin embargo, los métodos actuales no están diseñados específicamente para lidiar con las encuestas que utilizan métodos de muestreo complejos. Con el apoyo de una subvención de tres años y $337,000 otorgada por la National Science Foundation, el profesor asistente de estadísticas Paul Parker desarrollará métodos estadísticos y de aprendizaje automático para analizar de manera óptima las encuestas complejas producidas por agencias federales de estadísticas.
El proyecto de Parker se centrará en un grupo de encuestas producidas por el National Center for Science and Engineering Statistics (NCSES), como la Encuesta Nacional de Graduados Universitarios y la Encuesta de Doctorados Obtenidos. Estas encuestas ayudan a informar sobre importantes estimaciones oficiales de población. En lugar de tomar muestras de la población con igual probabilidad, estas encuestas y otras encuestas federales suelen sobremuestrear o submuestrear a grupos particulares. Parker creará métodos estadísticos para modelos de aprendizaje automático que estén diseñados específicamente para tener en cuenta el diseño de las encuestas y la forma única en que se recopilan los datos.
Aunque la tecnología de aprendizaje automático permite crear modelos de datos flexibles que a menudo mejoran la precisión de las estimaciones de población, muchos modelos no están equipados para proporcionar estimaciones importantes de incertidumbre en los conjuntos de datos. Parker abordará esta limitación a través de los marcos que desarrolla. Finalmente, se espera que estos métodos tengan una aplicabilidad más amplia para otras agencias federales de estadísticas y campos como la economía y la sociología que tratan con conjuntos de datos de encuestas dependientes.