Docker全攻略:从入门到精通,掌握容器构建关键技能

云掣YunChe2个月前行业资讯176

引言

        Dockerfile 是构建 Docker 镜像的核心文件。它定义了如何将应用程序及其依赖打包成一个可以跨平台运行的容器。本篇博客将从基础概念出发,逐步介绍 Dockerfile 的常见配置、使用注意事项,以及如何编写高效的 Dockerfile。




一、什么是 Dockerfile

        Dockerfile 是一组指令的集合,用于定义如何创建一个 Docker 镜像。每条指令对应于镜像构建中的一个步骤,这些步骤被逐个执行,最终生成一个可用的容器镜像。它不仅提升了应用的可移植性,还简化了部署和管理的流程。


        Dockerfile是一个没有后缀名的文件!Dockerfile是一个没有后缀名的文件!Dockerfile是一个没有后缀名的文件!放到用来执行cmd命令的文件夹中即可。



二、Dockerfile 的基本结构



        Dockerfile 中的每一行是一个命令,这些命令定义了镜像的构建流程。以下是 Dockerfile 常见指令的基础介绍:


FROM:定义基础镜像


格式:FROM <image>[:tag]

说明:Dockerfile 中每一个镜像必须从某个基础镜像开始,比如 FROM node:14,表示基于 Node.js 14 构建镜像。

RUN:执行命令


格式:RUN <command>

说明:用于在镜像构建过程中执行命令,如安装软件包等。

COPY 和 ADD:复制文件


格式:COPY <src> <dest> 或 ADD <src> <dest>

说明:将文件从主机复制到镜像中。ADD 可以处理 URL 和压缩文件,而 COPY 更为简单,通常推荐使用。

WORKDIR:设置工作目录


格式:WORKDIR <path>

说明:定义命令的执行路径,如果该路径不存在,Docker 会自动创建。

CMD 和 ENTRYPOINT:定义容器启动时的默认行为


格式:CMD ["executable", "param1", "param2"]

说明:CMD 提供了容器的默认运行命令,但可以被覆盖。ENTRYPOINT 则定义了固定的启动命令,通常配合 CMD 来设置参数。

EXPOSE:暴露端口


格式:EXPOSE <port>

说明:声明容器内部应用监听的端口,不过需要在运行容器时明确暴露该端口。

ENV:设置环境变量


格式:ENV <key> <value>

说明:用于定义在构建和运行时可用的环境变量。

三、Dockerfile 的常见配置项

        首先我们要知道,Dockerfile中的指令分为两大类,一部分为声明式指令,比如“FROM”、“WORKDIR”、“EXPOSE”、“ENV”、“VOLUME”、“USER”、“LABEL”,它们只是声明一个基础,一个规则或者一个关系,另一部分为创建式指令,如“RUN”、“COPY”、“ADD”、“CMD”、“ENTRYPOINT”,它们往往是增加部分文件或内容、预设部分命令等,都会创建一个镜像层,若干个镜像层合并起来就是你要生成的新镜像。比如:


FROM node:14              # 基础镜像,不创建新层

WORKDIR /app              # 设置工作目录,不创建新层

COPY package.json /app    # 复制文件,创建新层

RUN npm install           # 安装依赖,创建新层

COPY . /app               # 复制代码,创建新层

CMD ["npm", "start"]      # 设置容器启动命令,创建新层

        为了让 Dockerfile 更高效和可维护,以下是一些常见的优化配置:


1、多阶段构建 (Multi-stage Builds)

        在开发过程中可能会遇到需要在镜像内编译源代码,但编译后的产物才是最终的镜像内容。多阶段构建可以将编译和最终镜像的制作分离出来,减少镜像体积。


FROM golang:1.16 AS builder

WORKDIR /app

COPY . .

RUN go build -o myapp

 

FROM alpine:latest

WORKDIR /app

COPY --from=builder /app/myapp .

CMD ["./myapp"]

2、缓存优化

        Dockerfile 中的命令是逐行缓存的。当构建镜像时,如果 Docker 发现某个指令之前已经执行过,并且输入没有发生变化,它会直接使用缓存的结果,而不重新执行。这能显著提升构建速度。


        如果文件结构频繁变化,可以通过合理安排 COPY 和 RUN 来减少不必要的重新构建。


        例如,假设你在 Dockerfile 中执行如下指令:


COPY . /app

RUN npm install

        如果你的项目代码发生了变化,COPY . /app 会被重新执行,那么 RUN npm install 也会重新执行,即使 package.json 没有变化。重新安装依赖往往非常耗时,这是不必要的。


         解决办法是将 package.json 先单独复制并安装依赖,再复制其余代码:


# Step 1: 复制 package.json 并安装依赖

COPY package.json /app

RUN npm install

 

# Step 2: 复制项目的其他文件

COPY . /app

        这样,只有当 package.json 发生变化时,才会重新运行 npm install,否则它会使用缓存结果,极大地节省时间。


3、合并 RUN 命令

        每个 RUN 命令会创建一个镜像层,多个命令可以合并到一个 RUN 中,减少镜像层的数量,优化镜像大小。


RUN apt-get update && apt-get install -y \

    python3 \

    python3-pip && \

    apt-get clean && \

    rm -rf /var/lib/apt/lists/*

四、Dockerfile 使用须知

        .dockerignore 文件:类似于 .gitignore,.dockerignore 文件可以避免将不必要的文件(如 .git、node_modules)复制到镜像中,优化构建速度和镜像体积。


        命令顺序和缓存:Docker 构建是分层的,每个命令会生成一个新的层。如果前面的层没有变化,Docker 会使用缓存,避免重新执行命令。因此,优化命令顺序能加速构建过程。


        最小化镜像大小:选择合适的基础镜像(如 Alpine),移除不必要的包和文件,尽量减小镜像体积,提升启动速度和安全性。


        避免敏感信息:不要将密码、秘钥等敏感信息硬编码在 Dockerfile 中。可以使用环境变量、配置文件等方式进行注入。


        容器进程的管理:确保 Docker 容器中运行的进程是前台进程,否则容器可能会意外退出。可以通过 CMD 或 ENTRYPOINT 来定义正确的启动进程。 




五、一个完整的Dockerfile实例

# Step 1: 使用 Node.js 作为基础镜像

FROM node:14

 

# Step 2: 设置工作目录

WORKDIR /app

 

# Step 3: 复制 package.json 并安装依赖

COPY package.json /app

RUN npm install

 

# Step 4: 复制应用代码

COPY . /app

 

# Step 5: 构建应用

RUN npm run build

 

# Step 6: 暴露应用端口

EXPOSE 3000

 

# Step 7: 定义容器启动命令

CMD ["npm", "start"]

六、总结

        Dockerfile 是容器化开发中的关键工具。理解并掌握其使用方式,不仅能提高开发效率,还能让你的应用具备更强的可移植性和灵活性。通过优化配置和合理安排构建步骤,可以打造更轻量、更高效的容器镜像。



免责申明:

本文转载自网友公开分享,若有侵权,请联系我们删除!


相关文章

ubuntu设置共享文件夹

ubuntu设置共享文件夹

本文基于在VMware虚拟机环境下安装的ubuntu桌面版,且以及安装好Vmwaretools,如果根据本文未设置成功,请重装VMwaretools一、设置共享文件夹首先打开虚拟机,右击选项卡打开虚拟...

Docker:技术架构的演进之路(上)

Docker:技术架构的演进之路(上)

前言一、前言技术架构是指在软件开发和系统构建中,为了满足业务需求和技术要求,对系统的整体结构、组件、接口、数据流以及技术选型等方面进行的详细设计和规划。它是软件开发过程中的重要组成部分,为开发团队提供...

docker composer 安装sentry的运维总结--未完待续

docker composer 安装sentry的运维总结--未完待续

一、sentry安装1、下载最新的github工程地址是https://github.com/getsentry/self-hosted。我们安装的时候最新版本还是Sentry 21.6.1, 截止目...

Linux--多路转接之epoll

Linux--多路转接之epoll

epoll 是 Linux 下多路复用 I/O 接口 select/poll 的增强版本,它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统 CPU 利用率。它是 Linux 下多路复用 AP...

Linux 配置Java环境(一)

Linux 配置Java环境(一)

一、配置Java环境1、查看系统是否有java环境输入指令java -version回车即可如图表示Linux系统有自带的jdk,但是这并不是我们想要的,所以得卸载2、卸载系统自带的jdk1 .找到具...

【计算机网络】详解数据链路层数据帧&Mac地址&ARP协议

【计算机网络】详解数据链路层数据帧&Mac地址&ARP协议

一、以太网帧         "以太网" 不是一种具体的网络,而是一种技术标准;既包含了数据链路层的内容,也包含了一些物理层的内容...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。