卡卡字幕助手(VideoCaptioner)是一款基于大语言模型(LLM)的视频字幕处理助手,一键高质量字幕视频合成,支持语音识别,字幕生成、断句、优化、翻译全流程处理让视频字幕制作简单高效。
操作简单且无需高配置,支持网络调用和本地离线(支持调用GPU)两种方式进行语音识别,利用可用通过大语言模型进行字幕智能断句、校正、翻译,字幕视频全流程一键处理!为视频配上效果惊艳的字幕。
- 🎯 无需GPU即可使用强大的语音识别引擎,生成精准字幕
- ✂️ 基于 LLM 的智能分割与断句,字幕阅读更自然流畅
- 🔄 AI字幕多线程优化与翻译,调整字幕格式、表达更地道专业
- 🎬 支持批量视频字幕合成,提升处理效率
- 📝 直观的字幕编辑查看界面,支持实时预览和快捷编辑
- 🤖 消耗模型 Token 少,且内置基础 LLM 模型,保证开箱即用
Windows 用户
软件较为轻量,打包大小不足 60M,已集成所有必要环境,下载后可直接运行。
从 Release 页面下载最新版本的可执行程序
打开安装包进行安装
(可选)LLM API 配置,选择是否启用字幕优化或者字幕翻译
拖拽视频文件到软件窗口,即可全自动处理
提示:每一个步骤均支持单独处理,均支持文件拖拽。
✨ 主要功能
软件充分利用大语言模型(LLM)在理解上下文方面的优势,对语音识别生成的字幕进一步处理。有效修正错别字、统一专业术语,让字幕内容更加准确连贯,为用户带来出色的观看体验!
1. 多平台视频下载与处理
- 支持国内外主流视频平台(B站、Youtube等)
- 自动提取视频原有字幕处理
2. 专业的语音识别引擎
- 提供多种接口在线识别,效果媲美剪映(免费、高速)
- 支持本地Whisper模型(保护隐私、可离线)
3. 字幕智能纠错
- 自动优化专业术语、代码片段和数学公式格式
- 上下文进行断句优化,提升阅读体验
- 支持文稿提示,使用原有文稿或者相关提示优化字幕断句
4. 高质量字幕翻译
- 结合上下文的智能翻译,确保译文兼顾全文
- 通过Prompt指导大模型反思翻译,提升翻译质量
- 使用序列模糊匹配算法、保证时间轴完全一致
5. 字幕样式调整
- 丰富的字幕样式模板(科普风、新闻风、番剧风等等)
- 多种格式字幕视频(SRT、ASS、VTT、TXT)
⚙️ 基本配置
1. LLM API 配置说明 (可选)
- 软件内置基础大语言模型(
gpt-4o-mini
),无需配置即可使用。但为获得更好的效果,建议在设置中配置个人 API。 - 支持标准 OpenAI API 格式(兼容SiliconCloud、DeepSeek 等)请自行注册配置。
- 追求更高质量可选用
Claude-3.5-sonnet
或gpt-4o
2. 本地 Whisper 语音识别配置(需软件内下载)
- 下载模型:
Tiny
,Base
,Small
,Medium
,Large-v1
,Large-v2
,Large-v3
, 无需代理国内可直接下载 - 中文识别推荐使用
Medium
及以上版本,以确保识别质量 - 对于英文识别,
Small
效果已经已经不错
3. 文稿匹配
- 在“字幕优化与翻译”页面,包含“文稿匹配”选项。支持使用视频的原有文稿或者相关提示优化字幕断句
- 全流程处理时,请先填写文稿信息,再进行开始任务处理。
相关软件
沉浸式翻译
超好用的网页文档视频翻译工具
ThrottleStop
轻量级的CPU频率与功率限制控制工具
Drive Icon Manager
电脑里的网盘图标删除器
Potplayer
Potplayer,好用的PC多媒体播放器
傲梅分区助手
免费无广告的优秀国产分区软件
RunMemtestPro
内存稳定性测试工具