量子计算的爱好者们注意了,美国国家科学基金会资助的一个新项目将结合统计学和机器学习方法,为分析复杂的联邦统计调查提供新的解决方案。

在数据科学和机器学习领域,我们已经取得了许多重要的突破,但对于那些使用复杂抽样方法的调查,现有的技术仍然无法胜任。然而,美国国家科学基金会已经给予统计学助理教授Paul Parker一笔为期三年、337,000美元的资金,以开发适用于分析联邦统计机构复杂调查的统计学和机器学习方法。 Paul Parker表示,尽管现有的机器学习方法可以处理大量数据集,但这些方法并不适用于这类调查数据集。因为它们通常假设从总体中简单随机抽样,而这并不适用于这些类型的调查。 这个项目将关注美国国家科学与工程统计中心(NCSES)等机构的调查,如大学毕业生全国调查和博士学位获得者调查。这些调查对于官方人口估计至关重要。Parker将创建特别为调查设计的机器学习模型的统计方法,以便更精确地估计人口。 然而,许多机器学习模型往往不能提供数据集中不确定性的重要估计。Parker将通过他开发的框架来解决这个问题。他表示,这个项目将解决两个问题:解决调查设计的问题,并将其纳入统计框架以产生不确定性估计。 这些新方法将有助于从NCSES调查中生成人口估计的机构,这些机构面临着有限的资源和对工作的更高期望。改进后的估计对于解释和根据产生的数据制定政策或资金决策的人们也将非常有用。 最终,Parker希望这些方法可以广泛应用于其他联邦统计机构,以及处理相关调查数据集的经济学和社会学等领域。这个项目由美国国家科学基金会的国家科学与工程统计中心资助,将与密苏里大学的首席调查员Scott Holan合作进行。