AI-Video-Transcriber是一款开源的AI视频转录和摘要工具,支持本地和 YouTube、TikTok、Bilibili 等 30 多个平台的视频自动转录、翻译和智能摘要生成。
该工具的开发初衷源于作者在观看长视频时需要反复回看来做笔记的痛点,许多优质的长视频内容缺乏字幕和文字稿,而用户往往只关心核心观点和重点内容。AI-Video-Transcriber可以利用人工智能技术为用户提供专业的视频转录、翻译和内容摘要服务。
转录功能采用 Faster-Whisper AI 引擎,能够实现高精度的语音转文字,支持 100 多种语言的自动识别。其次是 AI 文本优化功能,系统会自动进行错别字修正、句子补全和智能分段,使转录文本更加易读。第三是多语言摘要生成功能,可以生成英语、中文、日语、韩语、西班牙语等多种语言的智能摘要。条件式翻译功能当用户选择的摘要语言与视频原语言不一致时,系统会自动调用大语言模型(支持 OpenAI 或本地 Ollama)进行翻译。
项目提供三种部署方式:Docker 容器化部署(最简单)、自动安装脚本部署以及手动安装部署。满足不同用户的需求。用户只需配置 OpenAI API 密钥或 Ollama 本地服务,即可启用完整的 AI 功能。
启动服务后,通过浏览器访问本地端口,粘贴视频链接或上传本地文件,选择目标摘要语言,点击开始即可自动完成转录、优化、翻译和摘要的全流程处理。处理完成后,用户可以直接在网页上查看结果,也可以下载 Markdown 格式的转录文本、翻译文本和摘要文件。该工具特别适合语言学习者、内容创作者、学生和研究人员,帮助他们从多语言视频内容中快速提取价值信息。
✨ 功能特性
- 🎥 多平台支持: 支持YouTube、Tiktok、Bilibili、以及其他30+平台。支持直接上传本地视频文件。
- 🗣️ 智能转录: 使用Faster-Whisper进行高精度语音转文字
- 🤖 AI文本优化: 自动错别字修正、句子完整化和智能分段
- 🌍 多语言摘要: 支持多种语言的智能摘要生成
- ⚡ 实时进度: 实时进度跟踪和状态更新
- ⚙️ 条件式翻译: 当所选摘要语言与检测到的转录语言不一致时,系统自动调用LLM (OpenAI/Ollama) 进行翻译
- 📱 移动适配: 完美支持移动设备
- ✂️ 长视频分段: 自动将长视频分段成20分钟的块进行处理,确保高效处理扩展内容。
🚀 快速开始
环境要求
- Python 3.8+
- FFmpeg
- 可选:OpenAI API密钥(用于OpenAI AI功能)或 Ollama 服务(用于本地LLM功能)
硬件要求:
最低配置: 4GB内存,双核CPU
推荐配置: 8GB内存,四核CPU
理想配置: 16GB内存,多核CPU,SSD存储
安装方法
方法一:自动安装
# 克隆项目 git clone https://github.com/tiandaoyuxi/AI-Video-Transcriber.git cd AI-Video-Transcriber # 运行安装脚本 chmod +x install.sh ./install.sh
方法二:Docker部署
# 克隆项目 git clone https://github.com/tiandaoyuxi/AI-Video-Transcriber.git cd AI-Video-Transcriber # 使用Docker Compose(最简单) cp .env.example .env # 编辑.env文件,设置你的OPENAI_API_KEY 或 OLLAMA_BASE_URL/OLLAMA_MODEL_NAME docker-compose up -d # 或者直接使用Docker docker build -t ai-video-transcriber . docker run -p 8000:8000 --env-file .env ai-video-transcriber
方法三:手动安装
- 安装Python依赖
# macOS (PEP 668) 强烈建议使用虚拟环境 python3 -m venv venv source venv/bin/activate python -m pip install --upgrade pip pip install -r requirements.txt
- 安装FFmpeg
# macOS brew install ffmpeg # Ubuntu/Debian sudo apt update && sudo apt install ffmpeg # CentOS/RHEL sudo yum install ffmpeg
- 配置环境变量
# For OpenAI API export OPENAI_API_KEY="your_openai_api_key_here" # Optional: only if you use a custom OpenAI-compatible gateway export OPENAI_BASE_URL="https://oneapi.basevec.com/v1" export OPENAI_MODEL_NAME="gpt-4o" # Optional, default is gpt-4o # For Ollama (prioritized if set) export OLLAMA_BASE_URL="http://xxx.xxx.xxx.xxx:xxxxx/v1" # Your Ollama service address export OLLAMA_MODEL_NAME="xxxxx:xb" # Your preferred Ollama model
启动服务
python3 start.py
服务启动后,打开浏览器访问 http://localhost:8000
