本文最后更新于 2025年10月2日 by 阿喵
在剪映里,视频字幕识别功能需要会员才能使用,对于偶尔剪辑视频的朋友来说,挺困扰的。 无独有偶,在 GitHub 上发现了 FlyCut Caption,可以使用demo网站,也可以自行部署。
AI 智能视频字幕生成器,用智能字幕生成技术改变您的视频,自动生成准确字幕,精确编辑,支持多种格式导出。为内容创作者、教育工作者和企业提供完美解决方案。
工具介绍
这款强大的 AI 字幕处理工具。 基于 Whisper 模型,高精度识别视频语音生成字幕,还支持可视化编辑和视频剪辑功能。可自由调整字幕的字体、颜色、位置等样式,同时可直接实时预览效果,完全本地化 AI 处理。 同时支持导出 SRT、JSON 等字幕格式,还可以直接导出视频文件。 提供详细的安装使用指南,可以集成到现有的项目当中,有需要的同学可以收藏备用。
项目截图

功能特色
🎯 核心功能
- 🎤 智能语音识别:基于 Whisper 模型的高精度语音转文字,支持多种语言
- ✂️ 可视化字幕编辑:直观的字幕片段选择和删除界面
- 🎬 实时视频预览:与字幕同步的视频播放器,支持区间播放
- 📤 多格式导出:支持 SRT、JSON 字幕格式以及视频文件导出
- 🎨 字幕样式定制:自定义字幕字体、颜色、位置等样式
- 🌐 国际化支持:组件化国际化设计,支持中文、英文、自定义语言包(如日语示例)
🔧 技术特色
- ⚡ 现代化技术栈:React 19 + TypeScript + Vite + Tailwind CSS
- 🧠 本地 AI 处理:使用 Hugging Face Transformers.js 在浏览器本地运行 AI 模型
- 🎯 Web Workers:ASR 处理在后台线程运行,不阻塞主界面
- 📱 响应式设计:适配不同屏幕尺寸的现代化界面
- 🎪 组件化架构:模块化设计,易于维护和扩展
使用指南
1. 上传视频文件
- 支持格式:MP4, WebM, AVI, MOV
- 支持音频:MP3, WAV, OGG
- 拖拽文件到上传区域或点击选择文件

上传完成后,进入ASR配置界面:

2. 生成字幕
- 选择识别语言(支持中文、英文等多种语言)
- 点击开始识别,AI 将自动生成带时间戳的字幕
- 识别过程在后台进行,不影响界面操作

3. 编辑字幕
- 选择片段:在字幕列表中选择要删除的片段
- 批量操作:支持全选、批量删除、恢复删除等操作
- 实时预览:点击字幕片段可跳转到对应时间点
- 历史记录:支持撤销/重做操作

4. 视频预览
- 预览模式:自动跳过删除的片段,预览最终效果
- 快捷键支持:
空格
:播放/暂停←/→
:快退/快进 5 秒Shift + ←/→
:快退/快进 10 秒↑/↓
:调节音量M
:静音/取消静音F
:全屏
5. 字幕样式
- 字体设置:字体大小、粗细、颜色
- 位置调整:字幕显示位置、对齐方式
- 背景样式:背景颜色、透明度、边框
- 实时预览:所见即所得的样式调整
6. 导出结果
- 字幕导出:SRT 格式(通用字幕格式)、JSON 格式
- 视频导出:
- 仅保留未删除的片段
- 可选择烧录字幕到视频
- 支持不同质量设置
- 多种格式输出
项目地址
声明:本站为个人非盈利博客,资源均网络收集且免费分享无限制,无需登录。资源仅供测试学习,请于24小时内删除,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集。请支持正版!如若侵犯了您的合法权益,可联系我们处理。