想象一下:你只说一句话,AI 就帮你把整个短剧写出来、角色形象设计好、分镜脚本拆好、配音配乐、视频合成,全部搞定。这不是 PPT,是真的能看的短剧视频。
这就是「火宝短剧」正在做的事——一个基于 AI 的短剧自动化生产平台,已在 GitHub 收获 10.3k Stars、2k Forks。

相关链接
Github项目地址:https://github.com/chatfire-AI/huobao-drama
火宝短剧是什么
火宝短剧(Huobao Drama)是一个基于 TypeScript 全栈开发的 AI 短剧自动化生产平台,由南京的一支创业团队开发。项目的核心理念是:一句话输入,完整短剧输出,整个流程从剧本生成、角色设计、分镜制作到视频合成全部自动化完成。
技术架构清晰:
- 前端:Nuxt 3 + Vue 3 + TypeScript,纯 CSS 样式,无 UI 框架
- 后端:Hono + Drizzle ORM + better-sqlite3
- AI 层:Mastra AI Agents + AI SDK(OpenAI 兼容接口)
- 视频处理:FFmpeg + fluent-ffmpeg
- 图片处理:Sharp
核心功能
🎭 角色管理
AI 自动生成角色形象,支持批量生成、角色图片上传和音色分配试听。系统内置 5 个专用 Agent:script_rewriter(剧本改写)、extractor(角色场景提取)、storyboard_breaker(分镜拆解)、voice_assigner(音色分配)、grid_prompt_generator(提示词生成),各司其职。
🎬 分镜制作
输入剧本后,AI 自动拆解分镜脚本,包含场景描述和镜头设计。每张分镜图通过文生图模型生成,支持宫格图批量生成与切分,可选首帧/尾帧/分镜板等不同帧类型。
🎥 视频生成
图生视频模型自动生成分镜视频,配合 MiniMax TTS 配音生成,FFmpeg 负责单镜头合成(视频+音频+字幕),最后整集拼接导出成品。
🤖 AI Agents 工作流
项目内置 5 个 Mastra Agent,形成完整的短剧生产流水线:小说输入 → 格式化剧本改写 → 角色场景提取与去重 → 分镜序列拆解 → 角色音色分配 → 提示词生成 → 媒体合成。
🔌 多厂商适配
图片、视频、TTS 三条线都支持多厂商切换:
- 图片:OpenAI、Gemini、MiniMax、火山引擎、阿里、Chatfire
- 视频:MiniMax、火山引擎/Seedance、Vidu、阿里
- TTS:MiniMax
快速部署
Docker 一键部署(推荐)
最简单的跑起来的方式,只需一条命令:
git clone https://github.com/chatfire-AI/huobao-drama.git
cd huobao-drama
docker compose up -d
容器内置 FFmpeg 和默认配置,数据目录通过 volume 挂载保证持久化。Linux 用户需额外添加 --add-host=host.docker.internal:host-gateway 以访问宿主机上的 Ollama 等本地服务。
传统 Node.js 部署
需要 Node.js 20+ 和 FFmpeg 4.0+:
# 克隆项目
git clone https://github.com/chatfire-AI/huobao-drama.git
cd huobao-drama
# 安装前后端依赖
cd backend && npm install
cd ../frontend && npm install
# 开发模式运行
cd backend && npm run dev # 终端1,后端 :5679
cd frontend && npm run dev # 终端2,前端 :3013
生产环境需先构建前端 npm run generate,再启动后端 npm start,后端会同时托管前端静态文件,单端口提供服务。
访问本地 Ollama
容器内可通过 http://host.docker.internal:端口号 访问宿主机上的 Ollama 等服务。宿主机需设置 export OLLAMA_HOST=0.0.0.0:11434 && ollama serve 监听所有接口。
适用人群
- 短视频创作者:快速生成短剧内容,降低制作成本
- AI 爱好者:体验完整的 AI Agent 工作流
- 独立开发者:参考 TypeScript 全栈项目架构
- 内容工作室:批量生产短剧的自动化方案
测试体验
warpnav 小编测试了官方的在线 Demo,整体体验下来最直接的感受是:工作流设计得相当完整。从输入一句话到拿到完整视频,每个环节都有对应的处理模块,没有明显的断档。
角色管理和分镜编辑的界面比想象中细致,可以单独调整每个分镜的图片和配音。宫格图的切分功能对于做连续镜头很有用,不用手动去切图再上传。
多厂商适配这点比较实用,图片和视频都可以切换不同厂商,找性价比最高的方案。TTS 目前只支持 MiniMax,如果有其他 TTS 需求可能需要魔改一下代码。
整体来说,这个项目对于想快速跑通一个短剧生产全流程的人来说很有参考价值。开源代码结构清晰,注释也比较全,改造成本不高。当然,要真正用起来,还是得自己配置好各个厂商的 API Key。
© 版权声明
本站部分内容源于网络收集,文章等版权归原作者所有,若需删稿请联系管理员邮箱:[email protected]
相关文章
暂无评论...