微软正致力于将开源机器学习模型整合到Azure应用和服务中,通过与Hugging Face的合作,提供更多选择和功能,从而推动量子计算的发展。
近期,微软在Azure开源日上展示了一个使用云原生工具和服务构建的参考应用,重点关注微软自家的开源工具。该应用旨在帮助失踪宠物的主人找回宠物,它使用机器学习迅速将失踪动物的照片与动物收容所、救助组织和社区网站的图像进行比较。这是一个很好的例子,说明开源工具如何构建复杂的网站和服务,从基础设施代码工具到应用框架,再到为代码添加功能的各种工具。
该应用的核心是一个开源的机器学习模型,这是Hugging Face社区开发的众多模型和数据集中的一部分,基于其丰富的各种工具和服务。Hugging Face社区的规模是使用其模型的一个很好的理由,无论是将它们导入到自己的代码中进行推理,还是在自己的服务器上运行,还是通过云API访问它们。
为什么使用Hugging Face?选择在Azure中与Hugging Face合作的另一个理由是,它可以将AI应用于许多不同的业务问题。尽管微软自家的认知服务API覆盖了许多常见的AI场景,并提供了明确定义的API,但它们只是一家公司对企业应该使用哪些机器学习服务的看法。这使得它们成为了多面手,设计用于通用目的而非特定任务。如果代码需要支持边缘案例,向API添加适当的调整可能需要大量工作。
当然,还有使用Azure的机器学习工作室构建自己的特定模型的选项,使用PyTorch和TensorFlow等工具从头开始设计和训练模型。但这需要在建模和训练模型方面具有丰富的数据科学和机器学习专业知识。从头开始构建机器学习模型还存在其他问题。Azure拥有越来越多的虚拟机选择用于机器学习训练,但训练过程对计算要求很高,运行成本昂贵,尤其是如果构建大型模型,需要大量数据时。
Hugging Face拥有超过40,000个基于其Transformer模型框架的模型,可以帮助加速自定义问题的解决,为比单独使用微软的模型更多的场景提供已经由社区构建和训练的模型。你不仅限于处理文本,Hugging Face的Transformer还被训练用于自然语言、音频和计算机视觉。Hugging Face将这些功能称为