FFmpeg

概述

参考：
GitHub 项目，FFmpge/FFmpge
官网

FFmpeg 是一个库和工具的集合，用于处理多媒体内容，比如音频、视频、字幕、相关元数据等。

FFmpeg 是视频处理最常用的开源软件。它功能强大，用途广泛，大量用于视频网站和商业软件（比如 Youtube 和 iTunes），也是许多音频和视频格式的标准编码/解码实现。

FFmpeg 本身是一个庞大的项目，包含许多组件和库文件，最常用的是它的命令行工具。本文介绍 FFmpeg 命令行如何处理视频，比桌面视频处理软件更简洁高效。

安装 FFmpeg

https://www.bilibili.com/read/cv23895928/

可以根据官方文档先完成安装。

首先来到FFmpeg的官网https://ffmpeg.org，根据你使用的电脑平台进行下载。这里我们下载Windows版本，这里有两个版本，具体选择哪个版本可以参考下面这句话自行决定。这里选择 Windows builds by BtbN 版本进行下载。

Notes: 在Windows系统上，Gyan.dev 和 BtbN 都提供了 FFmpeg 的预编译版本。Gyan.dev 通常使用 MSVC 编译器，而 BtbN 使用 MinGW 编译器。因此，Gyan.dev 的版本可能会更符合 Windows 标准，而 BtbN 的版本可能会更加开放和跨平台。

这时候来到 GitHub 页面，选择其中的 Windows 版本下载。这里有两个版本，具体下载哪个版本根据下面这段话自行决定，两者区别如下：

Notes: 完整版适用于终端用户，因为它包含了所有的可执行文件和静态库，用户可以从命令行调用 FFmpeg 的工具来进行视频处理；
Shared 版仅包含共享库和工具，不包含可执行文件和静态库，这使得开发者可以使用 FFmpeg 的功能实现自己的应用程序或集成 FFmpeg 到自己的项目中。

下载完整版 ffmpeg-master-latest-win64-gpl.zip。解压后直接使用 CLI 二进制文件即可开始使用。

命令行工具

参考：
阮一峰，FFmpeg 视频处理入门教程

基本概念

容器

视频文件本身其实是一个容器（container），里面包括了视频和音频，也可能有字幕等其他内容。

常见的容器格式有以下几种。一般来说，视频文件的后缀名反映了它的容器格式。

MP4
MKV
WebM
AVI

ffmpeg -formats 命令查看 FFmpeg 支持的容器。

编码格式

视频和音频都需要经过编码，才能保存成文件。不同的编码格式（CODEC），有不同的压缩率，会导致文件大小和清晰度的差异。

常用的视频编码格式如下。

H.262
H.264
H.265

上面的编码格式都是有版权的，但是可以免费使用。此外，还有几种无版权的视频编码格式。

常用的音频编码格式如下。

上面所有这些都是有损的编码格式，编码后会损失一些细节，以换取压缩后较小的文件体积。无损的编码格式压缩出来的文件体积较大，这里就不介绍了。

ffmpeg -codecs 命令可以查看 FFmpeg 支持的编码格式，视频编码和音频编码都在内。

编码器

编码器（encoders）是实现某种编码格式的库文件。只有安装了某种格式的编码器，才能实现该格式视频/音频的编码和解码。

以下是一些 FFmpeg 内置的视频编码器。

libx264：最流行的开源 H.264 编码器
NVENC：基于 NVIDIA GPU 的 H.264 编码器
libx265：开源的 HEVC 编码器
libvpx：谷歌的 VP8 和 VP9 编码器
libaom：AV1 编码器

音频编码器如下。

libfdk-aac
aac

ffmpeg -encoders 命令可以查看 FFmpeg 已安装的编码器。

ffmpeg

参考：
https://ffmpeg.org/ffmpeg.html

FFmpeg 的命令行参数非常多，可以分成五个部分

ffmpeg {1} {2} -i {3} {4} {5}

上面命令中，五个部分的参数依次如下。

全局参数
输入文件参数
输入文件
输出文件参数
输出文件

参数太多的时候，为了便于查看，ffmpeg 命令可以写成多行。

下面是一个例子

$ ffmpeg \
-y \ # 全局参数
-c:a libfdk_aac -c:v libx264 \ # 输入文件参数
-i input.mp4 \ # 输入文件
-c:v libvpx-vp9 -c:a libvorbis \ # 输出文件参数
output.webm # 输出文件

上面的命令将 mp4 文件转成 webm 文件，这两个都是容器格式。输入的 mp4 文件的音频编码格式是 aac，视频编码格式是 H.264；输出的 webm 文件的视频编码格式是 VP9，音频格式是 Vorbis。

如果不指明编码格式，FFmpeg 会自己判断输入文件的编码。因此，上面的命令可以简单写成 ffmpeg -i input.avi output.mp4

Syntax(语法)

OPTIONS

https://ffmpeg.org/ffmpeg.html#Options

-c：指定编码器
-c copy：直接复制，不经过重新编码（这样比较快）
-c:v # 指定视频编码器。可以使用 ffmpeg -encoders 查看说有可用的编码器
-c:a # 指定音频编码器
-i # 指定输入文件
-an # 去除音频流
-vn # 去除视频流
-preset # 指定输出的视频质量，会影响文件的生成速度，有以下几个可用的值 ultrafast, superfast, veryfast, faster, fast, medium, slow, slower, veryslow。
-y # 不经过确认，输出时直接覆盖同名文件。

通用选项

-hide_banner # 查看视频文件的元信息，比如编码格式和比特率，可以只使用 -i 参数。上面命令会输出很多冗余信息，加上-hide_banner 参数，可以只显示元信息。
-encoders # 显示所有可用的编码器

EXAMPLE

添加水印

ffmpeg -i input.mp4 -vf "drawtext=text='DesistDaydream':x=1800:y=10:fontsize=24:fontcolor=white:fontfile=SmileySans-Oblique-2.ttf" output.mp4

文字：DesistDaydream
位置：x=1800,y=10
字体大小：24
颜色：白
字体：得意黑

压缩视频

https://longjin666.cn/1443/

https://neo0moriarty.github.io/h265-compress-video/

有两项参数选择，一个是影响清晰度，一个是影响文件大小的，测试了几个参数，结果差距很小，可以直接使用默认的参数。确保 crf 参数在 20 左右比较重要，这项影响了清晰度，18 以下肉眼不可以分辨，18-30 差距非常小，30 以上清晰度不大好，所以选20左右即可。

ffmpeg -i input.avi -c:v libx265  -crf 20 -c:a copy output.mp4

转换编码格式

转换编码格式（transcoding）指的是，将视频文件从一种编码转成另一种编码。比如转成 H.264 编码，一般使用编码器 libx264，所以只需指定输出文件的视频编码器即可。

下面是转成 H.265 编码的写法。

$ ffmpeg -i [input.file] -c:v libx265 output.mp4

转换容器格式

转换容器格式（transmuxing）指的是，将视频文件从一种容器转到另一种容器。下面是 mp4 转 webm 的写法。

上面例子中，只是转一下容器，内部的编码格式不变，所以使用-c copy 指定直接拷贝，不经过转码，这样比较快。

调整码率

调整码率（transrating）指的是，改变编码的比特率，一般用来将视频文件的体积变小。下面的例子指定码率最小为 964K，最大为 3856K，缓冲区大小为 2000K。

$ ffmpeg -i input.mp4 -minrate 964K -maxrate 3856K -bufsize 2000K output.mp4

改变分辨率（transsizing）

下面是改变视频分辨率（transsizing）的例子，从 1080p 转为 480p 。

$ ffmpeg -i input.mp4 -vf scale=480:-1 output.mp4

提取音频

有时，需要从视频里面提取音频（demuxing），可以像下面这样写。

上面例子中，-vn 表示去掉视频，-c:a copy 表示不改变音频编码，直接拷贝。

添加音轨

添加音轨（muxing）指的是，将外部音频加入视频，比如添加背景音乐或旁白。

上面例子中，有音频和视频两个输入文件，FFmpeg 会将它们合成为一个文件。

截图

下面的例子是从指定时间开始，连续对 1 秒钟的视频进行截图。

如果只需要截一张图，可以指定只截取一帧。

上面例子中，-vframes 1 指定只截取一帧，-q:v 2 表示输出的图片质量，一般是 1 到 5 之间（1 为质量最高）。

裁剪

裁剪（cutting）指的是，截取原始视频里面的一个片段，输出为一个新视频。可以指定开始时间（start）和持续时间（duration），也可以指定结束时间（end）。

下面是实际的例子。

上面例子中，-c copy 表示不改变音频和视频的编码格式，直接拷贝，这样会快很多。

为音频添加封面

有些视频网站只允许上传视频文件。如果要上传音频文件，必须为音频添加封面，将其转为视频，然后上传。

下面命令可以将音频文件，转为带封面的视频文件。

上面命令中，有两个输入文件，一个是封面图片 cover.jpg，另一个是音频文件 input.mp3。-loop 1 参数表示图片无限循环，-shortest 参数表示音频文件结束，输出视频就结束。

ffprobe

https://ffmpeg.org/ffprobe.html

https://www.cnblogs.com/renhui/p/9209664.html

ffprobe 是 ffmpeg 命令行工具中相对简单的，此命令是用来查看媒体文件格式的工具。

FFmpeg 生态

https://github.com/Lake1059/FFmpegFreeUI # 3FUI 是 ffmpeg 在 Windows 上的轻度专业交互外壳，收录大量参数，界面美观，交互友好。此项目面向国内使用环境，让普通人也能够轻松压制视频和转换格式。

反馈

此页是否对你有帮助？

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最后修改 July 17, 2025: python uv. ffmpeg (d71c3618)