Jul 30, 2024 , with read , about 35min.

撸一个纯前端实现的FFmpeg视频转压缩工具

#FFmpeg #WebAssembly #React #视频处理

引言

写文章的时候，有的地方为了描述，或者演示清楚，所以经常需要准备一些GIF/WEBP 的短视频演示素材插入文中。经常会用到 FFmpeg 这个命令行工具，不过尽管用了很久，我始终是记不住这些参数命令，太多了主要是。我甚至写过一篇文章去结构性的总结使用 FFmpeg ---- 《FFmpeg的安装和基本使用》。

之所以我不用现有的视频剪辑工具，主要原因还是觉得臃肿。

我一开始本来只是想做个界面，动态的帮我拼接生成指令，然后粘贴到命令行去使用。

不过做完了，想着现在不是有 wasm 吗？直接放浏览器里面跑不是更省事？

技术栈的选择

React：为了练习使用 React，所以这次就选用 React 来撸吧
shadcn-ui: 一个 UI 库
FFmpeg.wasm：FFmpeg的WebAssembly版本，使得在浏览器中运行FFmpeg成为可能。
TypeScript：没什么好提的
react-hook-form：用于处理表单状态和验证的React库
zod：TypeScript优先的模式声明和验证库

一些技术，像 react-hook-form 和 zod，我之前完全没用过，不过现在我和 AI 结对编程，基本上也是磕磕绊绊用起来了，之前的工作中也没用到过，就当拓展一下认识了。

这个项目本身来说，就是一个小工具，在做之前先整理下思路，就两个点：

首先，我得拼出命令行可用的指令串。
让它在浏览器中去执行

本文也只是从大致实现上去描述一下，所以不会逐行实现，感兴趣的朋友可以自行翻源码 joisun/ffmpeg-convertor，有更多想法的话，也欢迎 PR。

演示地址:https://ffmpeg-convertor.vercel.app/

构建 UI

表单设计与验证

我们使用react-hook-form和zod来处理表单。首先，定义了一个formSchema，它描述了表单的结构和验证规则：

const formSchema = z.object({
  fps: z.coerce.number().lte(120).gte(10),
  width: z.coerce.number().lte(5000).gte(1),
  loop: z.coerce.number().gte(0),
  bitrate: z.string().min(0),
  compression: z.coerce.number().lte(100).gte(0),
  output: z.string().min(1).max(50).regex(/^[\w-]+$/),
  // ... 其他字段
})copy success

这个schema不仅定义了每个字段的类型，还包含了详细的验证规则，如最大/最小值、正则表达式匹配等。

表单组件

使用useForm钩子初始化表单，并设置默认值：

const form = useForm < z.infer < typeof formSchema >> ({
  resolver: zodResolver(formSchema),
  defaultValues: {
    fps: 30,
    width: 480,
    loop: 0,
    bitrate: '800k',
    // ... 其他默认值
  },
})copy success

然后用 Shadcn-ui 的 Form 组件去构建 UI：

// ......
<Form {...form}>
        <form
          onSubmit={form.handleSubmit(() => onSubmit(form.getValues(), false))}
          className="sm:grid lg:grid-cols-2 xl:grid-cols-3 2xl:grid-cols-4 gap-x-4 gap-y-4"
        >
          <FormField
            control={form.control}
            name="fps"
            render={({ field }) => (
              <FormItem>
                <FormLabel>帧率</FormLabel>
                <FormControl>
                  <Input type="number" placeholder="" {...field} />
                </FormControl>
                <FormDescription>控制输出资源的帧率</FormDescription>
                <FormMessage />
              </FormItem>
            )}
          />
          <FormField
// ......
copy success

文件上传与预览

使用自定义的Dropzone组件处理文件上传，VideoClipper组件用于视频预览和裁剪：

组件代码的实现可自行翻阅源码

<Dropzone
  onChange={handleDropzoneChange}
  className="w-full h-24 my-12 flex items-center justify-center"
  fileExtension="video/*"
/>

<VideoClipper src={videoSrc} onClipChange={handleVideoClipperChange}>
  {/* ... */}
</VideoClipper>copy success

到这里，基本的用户界面就算构建完成了。接下来就是接入 FFmpeg 了。

接入 FFmpeg

在浏览器中使用 FFmpeg，就需要借助 wasm 的实现，我们使用 ffmpeg.wasm。

为了我们使用方便，我们采用 React Hook 的方式对它进行一些封装：

这个 hook 将导出一个对象，其中包括了一些状态，还有一个 transcode 方法。该方法用于执行对文件的转换。

interface FFmpegInstance {
    load: () => Promise<void>;
    transcode: (file: File, commandParts: CommandPartsType) => Promise<void>;
    isLoaded: boolean; // 是否加载完成
    isDoing: boolean;// 是否正在执行转换任务
    isLoading: boolean;// 是否正在加载
    progress: number;// 转换任务处理进度
    transcodedTime: number; // 转化的产物时长
    logs: string[];//执行期间的日志
    error: Error | null;//错误
    openMT:boolean;// 是否开启了多线程
}copy success

FFmpeg.wasm 的接入有一些注意点，FFmpeg.wasm 官方提供了两种包：

多线程支持
单线程

对于多线程支持，需要用到 SharedArrayBuffer ，是 JavaScript 中的一个对象，它代表一个固定长度的原始二进制数据缓冲区，可以在多个工作线程（Web Workers）之间共享。

不过由于它支持多个线程操作同一个内存空间，处于安全考虑，通常需要网站实施特定的安全头才能启用也就是：

'Cross-Origin-Embedder-Policy': 'require-corp',
'Cross-Origin-Opener-Policy': 'same-origin',copy success

单线程则没有这些要求。不过单线程相对多线程肯定是要慢很多。

另一个问题就是多线程并不是所有浏览器都支持，似乎目前 Chromium based 的浏览器都不支持。这也就意味着， Chrome, Safari, 还有一众过程套壳的浏览器都不支持。好消息是 FireFox 支持。

为此，我们需要做一个自动启用，去自动切换这两种模式。下面是核心的部分代码：

// 检测当前浏览器环境是不是 FireFox， 如果是就把  OpenMT 这个开启标志设为 true
const browser = Bowser.getParser(window.navigator.userAgent)
let OpenMT = false
if (browser.getBrowser().name === 'Firefox') {
  OpenMT = true
}
serOpenMT(OpenMT)

//  根据 OpenMT 的值自行加载 对应 的 FFmpeg.wasm 模块。
const CORE_URL = 'https://cdn.jsdelivr.net/npm/@ffmpeg/core@0.12.6/dist/esm'
const CORE_MT_URL = 'https://cdn.jsdelivr.net/npm/@ffmpeg/core-mt@0.12.6/dist/esm'
const baseURL = OpenMT ? CORE_MT_URL : CORE_URL
await ffmpegRef.current.load({
  coreURL: await toBlobURL(`${baseURL}/ffmpeg-core.js`, 'text/javascript'),
  wasmURL: await toBlobURL(`${baseURL}/ffmpeg-core.wasm`, 'application/wasm'),
  ...(OpenMT
    ? {
        workerURL: await toBlobURL(
          `${baseURL}/ffmpeg-core.worker.js`,
          'text/javascript'
        ),
      }
    : {})
})copy success

这部分代码，官方也是这么干的。可以看看官方的 Playgroud。对应的源码在 here.

另外，在开发阶段，vite.config.ts 中需要配置响应头：

optimizeDeps: { exclude: ["@ffmpeg/ffmpeg", "@ffmpeg/util"], },
server: {
headers: {
  'Cross-Origin-Embedder-Policy': 'require-corp',
  'Cross-Origin-Opener-Policy': 'same-origin',
},
}copy success

在部署阶段，因为我使用的是 vercel 部署的， vercel 暴露了 vercel.json 配置文件，可以很方便的支持我们自行配置，如下：

// vercel.json
{
  "headers": [
    {
      "source": "/",
      "headers": [
        {
          "key": "Cross-Origin-Embedder-Policy",
          "value": "require-corp"
        },
        {
          "key": "Cross-Origin-Opener-Policy",
          "value": "same-origin"
        }
      ]
    },
    {
      "source": "/assets/(.*)",
      "headers": [
        {
          "key": "Cross-Origin-Embedder-Policy",
          "value": "require-corp"
        },
        {
          "key": "Cross-Origin-Opener-Policy",
          "value": "same-origin"
        }
      ]
    }
  ]
}copy success

完整的 useFFmpeg Hook 实践，详见源码.

FFmpeg命令生成与执行

定义了onSubmit函数来处理表单提交。它首先生成FFmpeg命令，然后根据需要执行转码：

async function onSubmit(values: z.infer<typeof formSchema>, onlyGenerateCommand?: boolean) {
  const { command, commandParts } = generateFFmpegCommand({
    ...values,
    timeRange,
    input: sanitizeFilename(files[0].name)
  });
  setCommand(command);
  if (onlyGenerateCommand) return;

  await handleTranscode(files[0], commandParts);
}copy success