Dockerfile全面指南:从基础到进阶,掌握容器化构建的核心工具

云掣YunChe1个月前技术文章166

引言

        Dockerfile 是构建 Docker 镜像的核心文件。它定义了如何将应用程序及其依赖打包成一个可以跨平台运行的容器。本篇博客将从基础概念出发,逐步介绍 Dockerfile 的常见配置、使用注意事项,以及如何编写高效的 Dockerfile。




一、什么是 Dockerfile

        Dockerfile 是一组指令的集合,用于定义如何创建一个 Docker 镜像。每条指令对应于镜像构建中的一个步骤,

这些步骤被逐个执行,最终生成一个可用的容器镜像。它不仅提升了应用的可移植性,还简化了部署和管理的流程。


        Dockerfile是一个没有后缀名的文件!Dockerfile是一个没有后缀名的文件!Dockerfile是一个没有后缀名的文件!

放到用来执行cmd命令的文件夹中即可。



二、Dockerfile 的基本结构



        Dockerfile 中的每一行是一个命令,这些命令定义了镜像的构建流程。以下是 Dockerfile 常见指令的基础介绍:


FROM:定义基础镜像


格式:FROM <image>[:tag]

说明:Dockerfile 中每一个镜像必须从某个基础镜像开始,比如 FROM node:14,表示基于 Node.js 14 构建镜像。

RUN:执行命令


格式:RUN <command>

说明:用于在镜像构建过程中执行命令,如安装软件包等。

COPY 和 ADD:复制文件


格式:COPY <src> <dest> 或 ADD <src> <dest>

说明:将文件从主机复制到镜像中。ADD 可以处理 URL 和压缩文件,而 COPY 更为简单,通常推荐使用。

WORKDIR:设置工作目录


格式:WORKDIR <path>

说明:定义命令的执行路径,如果该路径不存在,Docker 会自动创建。

CMD 和 ENTRYPOINT:定义容器启动时的默认行为


格式:CMD ["executable", "param1", "param2"]

说明:CMD 提供了容器的默认运行命令,但可以被覆盖。ENTRYPOINT 则定义了固定的启动命令,通常配合 CMD 来设置参数。

EXPOSE:暴露端口


格式:EXPOSE <port>

说明:声明容器内部应用监听的端口,不过需要在运行容器时明确暴露该端口。

ENV:设置环境变量


格式:ENV <key> <value>

说明:用于定义在构建和运行时可用的环境变量。

三、Dockerfile 的常见配置项

        首先我们要知道,Dockerfile中的指令分为两大类,一部分为声明式指令,比如“FROM”、

“WORKDIR”、“EXPOSE”、“ENV”、“VOLUME”、“USER”、“LABEL”,它们只是声明一个基础,

一个规则或者一个关系,另一部分为创建式指令,如“RUN”、“COPY”、“ADD”、“CMD”、

“ENTRYPOINT”,它们往往是增加部分文件或内容、预设部分命令等,都会创建一个镜像层,

若干个镜像层合并起来就是你要生成的新镜像。比如:


FROM node:14              # 基础镜像,不创建新层

WORKDIR /app              # 设置工作目录,不创建新层

COPY package.json /app    # 复制文件,创建新层

RUN npm install           # 安装依赖,创建新层

COPY . /app               # 复制代码,创建新层

CMD ["npm", "start"]      # 设置容器启动命令,创建新层

        为了让 Dockerfile 更高效和可维护,以下是一些常见的优化配置:


1、多阶段构建 (Multi-stage Builds)

        在开发过程中可能会遇到需要在镜像内编译源代码,但编译后的产物才是最终的镜像内容。

多阶段构建可以将编译和最终镜像的制作分离出来,减少镜像体积。


FROM golang:1.16 AS builder

WORKDIR /app

COPY . .

RUN go build -o myapp

 

FROM alpine:latest

WORKDIR /app

COPY --from=builder /app/myapp .

CMD ["./myapp"]

2、缓存优化

        Dockerfile 中的命令是逐行缓存的。当构建镜像时,如果 Docker 发现某个指令之前

已经执行过,并且输入没有发生变化,它会直接使用缓存的结果,而不重新执行。这能显著提升构建速度。


        如果文件结构频繁变化,可以通过合理安排 COPY 和 RUN 来减少不必要的重新构建。


        例如,假设你在 Dockerfile 中执行如下指令:


COPY . /app

RUN npm install

        如果你的项目代码发生了变化,COPY . /app 会被重新执行,那么 RUN npm install 

也会重新执行,即使 package.json 没有变化。重新安装依赖往往非常耗时,这是不必要的。


         解决办法是将 package.json 先单独复制并安装依赖,再复制其余代码:


# Step 1: 复制 package.json 并安装依赖

COPY package.json /app

RUN npm install

 

# Step 2: 复制项目的其他文件

COPY . /app

        这样,只有当 package.json 发生变化时,才会重新运行 npm install,否则它会使用缓存结果,极大地节省时间。


3、合并 RUN 命令

        每个 RUN 命令会创建一个镜像层,多个命令可以合并到一个 RUN 中,减少镜像层的数量,优化镜像大小。


RUN apt-get update && apt-get install -y \

    python3 \

    python3-pip && \

    apt-get clean && \

    rm -rf /var/lib/apt/lists/*

四、Dockerfile 使用须知

        .dockerignore 文件:类似于 .gitignore,.dockerignore 文件可以避免将不必要的文件

(如 .git、node_modules)复制到镜像中,优化构建速度和镜像体积。


        命令顺序和缓存:Docker 构建是分层的,每个命令会生成一个新的层。如果前面的层没有变化,

Docker 会使用缓存,避免重新执行命令。因此,优化命令顺序能加速构建过程。


        最小化镜像大小:选择合适的基础镜像(如 Alpine),移除不必要的包和文件,

尽量减小镜像体积,提升启动速度和安全性。


        避免敏感信息:不要将密码、秘钥等敏感信息硬编码在 Dockerfile 中。可以使用环境变量、

配置文件等方式进行注入。


        容器进程的管理:确保 Docker 容器中运行的进程是前台进程,否则容器可能会意外退出。

可以通过 CMD 或 ENTRYPOINT 来定义正确的启动进程。 




五、一个完整的Dockerfile实例

# Step 1: 使用 Node.js 作为基础镜像

FROM node:14

 

# Step 2: 设置工作目录

WORKDIR /app

 

# Step 3: 复制 package.json 并安装依赖

COPY package.json /app

RUN npm install

 

# Step 4: 复制应用代码

COPY . /app

 

# Step 5: 构建应用

RUN npm run build

 

# Step 6: 暴露应用端口

EXPOSE 3000

 

# Step 7: 定义容器启动命令

CMD ["npm", "start"]


六、总结

        Dockerfile 是容器化开发中的关键工具。理解并掌握其使用方式,不仅能提高开发效率,

还能让你的应用具备更强的可移植性和灵活性。通过优化配置和合理安排构建步骤,可以打造更轻量、更高效的容器镜像。


         只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。

如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~



相关文章

iotop-监控磁盘I/O

iotop-监控磁盘I/O

iotop概述iotop 是一个类似 top 的工具,用来显示实时的磁盘活动。Linux下的IO统计工具如iostat,nmon等大多数是只能统计到per设备的读写情况。iotop 监控 Linux...

MySQL 创建索引报错

创建索引报错添加索引发现报错,具体报错如下:create unique index sm_sample_clothing_skc_SkcUniqueKey_uindex on sm_sample_cl...

MongoDB的碎片化问题

一、碎片化问题1.1 为什么会出现碎片化的问题在生产业务中,一般会对集合数据进行频繁的增删改,常见的碎片化原因有:1、记录被remove,但是其空间没有被复用drop命令会直接删除集合的物理文件,空间...

Oozie安装web页面

Oozie安装web页面

1、查看web页面,页面显示页面显示无法打开oozie的web安装页面,如果需要安装页面需要安装Ext js的lib库2、安装ExtJS 2.2库进入/var/lib/oozie路径中cd  /var...

kafka性能关键参数配置指导

本文为kafka调优过程中主要参数以及参数相关释意,在遇到kafak性能问题时可优先调整一下参数1.Broker参数指导KAFKA_HEAP_OPTS:-Xmx6G   ...

CDP实操--Ranger Tag-based策略验证(四)

CDP实操--Ranger Tag-based策略验证(四)

1.1Ranger Tag-based策略验证在Ranger webui里给allan_admin和sam_sec用户赋权,给予添加classification的权限使用allan_admin或者sa...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。