从开发到部署：自动化机器学习

构建机器学习 (ml) 模型既引人入胜又复杂，需要仔细完成一系列步骤。从机器学习模型开发到部署，是人工智能落地的关键阶段。一个基于正确算法和相关数据、经过良好训练的模型，能够涵盖开发阶段，之后的重点将转向部署。

部署机器学习模型可能是一个繁琐的过程：构建 API、容器化、管理依赖项、配置云环境以及设置服务器和集群通常需要付出巨大的努力，但想象一下，如果整个工作流程可以自动化会怎样？在本文中，我们将讨论机器学习部署自动化如何统一和简化所有这些流程。使用通用工具、预配置模块和易于集成的自动化脚本可以简化部署过程。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

从开发到部署：自动化机器学习 - php中文网

在本文中，我将向您介绍如何训练 ML 模型、使用 Docker 对其进行容器化以及如何使用 Terraform 将其部署到云端，所有这些都使用自动化脚本，使流程可重用且适合 CI/CD。

自动化机器学习部署带来的好处

自动化 ML 部署彻底改变了游戏规则：

使机器学习模型能够有效扩展
几分钟内将模型投入生产
消除耗时的重复步骤
减少人为错误

使用的工具

要配置 ML 模型部署，我们需要一些基本工具和库：

Python 3.4+：用于训练和托管模型以及编写脚本来填补空白的核心编程语言
scikit-learn：用于机器学习的 Python 库
FastAPI：将 ML 模型作为 Web API 托管的 Python 库
Docker：运行 Terraform 和 ML 模型
Cloud CLI：需要安装才能与 Azure、AWS 和 GCP 等云平台交互
Terraform：基础设施即代码（IaC）用于配置云资源

项目设置

现在，让我们设置项目并回顾每个步骤。该项目主要分为三个部分：

机器学习模型训练
机器学习工作流程自动化
使用 Terraform 的 IaC

该项目的结构如下：

机器学习模型训练

该流程的第一步是模型开发、训练模型并构建 API 来为其提供服务：

在上面的示例中，我们使用 scikit-learn在传统的鸢尾花物种数据集上训练了一个逻辑回归模型。我们使用Pickle 库对模型进行序列化，将所有依赖项封装到一个文件中。然后，FastAPI 服务器加载model.pkl该模型和端点以生成预测：/predictapp.py

机器学习工作流自动化

经过训练的机器学习模型可以转化为一种服务，在可靠部署和访问的情况下，能够实时、大规模地交付。手动训练模型、通过构建 Docker 镜像部署模型以及更新配置文件可能是一个繁琐且容易出错的过程。自动化不仅可以提高效率，还可以简化工作流程。

我们使用两个 Python 脚本自动执行这些步骤：

build_model_and_image.py：此 Python 脚本可自动执行模型训练、Docker 镜像构建、推送到 DockerHub 以及更新.tfvarsTerraform 文件并将其组合到单个工作流中。build_model_and_image.py在 GitHub 上查看代码：https://github.com/yraj1457/MLOps/blob/main/scripts/build_model_and_image.py

install_terraform.py：此 Python 自动化脚本通过在 Docker 容器中运行 Terraform 来负责配置基础设施，从而确保无需单独安装 Terraform。install_terraform.py在 GitHub 上查看代码：https://github.com/yraj1457/MLOps/blob/main/scripts/install_terraform.py

这些自动化脚本填补了空白，并使工作流程在插入管道时可重复使用。

使用 Terraform 进行基础设施即代码

生产就绪服务需要部署。我们使用 Terraform 的 IaC，它允许我们定义整个云设置——包括运行模型的容器。它确保部署不仅自动化且一致，而且可跨环境移植。

基础设施由四个 Terraform 配置文件配置：main.tf、、和。Python 脚本使用官方 hashicorp/terraform Docker 镜像来运行 Terraform 命令（、、和），从而无需维护 Terraform 安装或版本，并在开发和部署之间提供了明确的划分variables.tf。outputs.tfterraform.tfvarsinitplanapply

下面的 Terraform 代码片段可以作为一个例子。它提供了一个 Azure 资源组和一个容器实例来托管机器学习 API。

该方法的完整代码库（包括所有脚本和配置文件）可在 GitHub 上找到：https://github.com/yraj1457/MLOps

为什么这种方法更有效

自动化脚本将各个流程整合在一起，从而实现更高效的方法，最大限度地减少人工干预，并优雅地记录错误。此外，通过在 Docker 容器中运行工具，我们最大限度地减少了依赖关系，并保证了跨环境的一致性。该架构融合了基础设施自动化、DevOps 和 MLOps 的最佳实践。

结论

本文展示了如何利用最少的工具、更少的依赖和最大程度的自动化，从机器学习模型训练到部署，为数据科学家和 MLOps 工程师节省大量重复性工作。我们利用 Python 编写的自动化脚本，并使用 Docker 封装模型和 Terraform，构建了一个可重用、自动化且可扩展的环境。

这种方法具有高度可移植性，可以插入任何 CI/CD 工具，例如 GitHub Actions 或 Azure DevOps。基础已从这里设置，您可以根据自己的需求进行修改。