耗时 20 天,AI 漫剧 APP 和 Web 全部开源, 已斩获 764 星!

作者:苍何日期:2026/1/28

这是苍何的第 474 篇原创!

大家好,我是消失了一段时间的苍何。

1 月 5 号,我写了篇文章,并开源了 AI 漫剧 APP,获得了很多朋友的喜欢。

图片

然后在 GitHub 上一共获得了 764 星和 181 fork,让我有些吃惊。

图片

说实话,这个项目远超我们的预期,甚至连歪果哥都来给我们提 issue,希望支持双语。

图片

甚至还有老板来咨询问我卖不卖这个 APP,我说,大哥,咱都开源了,自己去整吧,不用付费,哈哈哈。

这或许就是开源的魅力吧。

但我发现,APP 还是不大方便,评论区也不少求 web 版本的。

图片

于是,我们又花了 20 天,开源了个 Web 版本的 AI 漫剧平台,他是长这个样子的。

图片

主打的人群还是对 AI 漫剧感兴趣的小白群体,能够一句话生成漫剧故事

如果你不知道生成什么故事,也可以使用系统内置的模板,比如「马到成功送祝福」、「马上有美食」等新年主题的故事。

图片

为了照顾一些朋友想要自由发挥的需求,我们还添加了自定义工作流选项,也就是从创建角色到分镜编排,再到生成镜头,最后导出,都可以自定义。

图片

在编排的时候,你可以自定义不同的镜头,比如全景、中景、特写,可以添加镜头和场景。

图片

可以生成不同的镜头视频。

图片

在底层,做了很多的处理,能保证角色的一致性。

图片

做了几个系列,分别对应 2D、3D、写实等场景。

图片

我们做了非常多深度的调优,在保持人物一致性的同时也添加了不少细节去优化生成的效果。

图片

下面,我来分享下在开发这个项目过程中,我们踩过的坑,和一些可能算不上什么经验的经验,另外也教下大家怎么使用。

创作和开源不易,如果文章对你有帮助,欢迎点赞转发。

经验分享

我感觉最头疼的问题之一是角色一致性问题,也就是角色在不同画面中长得不一样,该如何很好的解决。

我们尝试使用了不少办法,甚至引入了本地 ComfyUI,开启锁定种子,第一张图的种子会被记录,后续所有图使用相同的种子,以保持整体风格的一致性。

图片

总结出角色一致性最佳实践如下:

1- 参考图选择:清晰、无遮挡、多角度
2- 描述格式:「性别+年龄+发型+发色+眼睛+服装+特征」
3- 示例:「25岁女性,黑色长直发,棕色大眼睛,穿白色衬衫和黑色西装裙,戴细框眼镜」
4

对于镜头,考虑很多像我一样对运镜不大熟悉的小白,我们内置了 9 种标准镜头模板,AI 根据故事自动选择不同分镜的镜头。

图片

对于生成质量上,有以下几点可以给大家分享:

1- 画面描述要具体,避免模糊词汇
2- 使用「锁定种子」保持风格统一
3- 负面提示词排除不想要的元素
4- 多生成几次,选择最满意的
5

在镜头节奏上,建议采用如下方式:

1基本原则:
2
3- 全景→中景→特写(渐进式)
4- 对话场景用过肩镜头正反打
5- 情绪高潮用特写
6- 场景转换用全景或框中框
7
8示例分镜节奏:
91. T1 全景俯瞰 - 城市远景(建立环境)
102. T2 环境中景 - 主角走在街上(角色入场)
113. T4 标准中景 - 主角看手机(日常动作)
124. T6 特写 - 手机屏幕显示消息(信息传递)
135. T6 特写 - 主角惊讶表情(情绪反应)
146. T8 跟随视角 - 主角奔跑(动态转场)
15

如何使用

我们整理了一份详细的使用指南,还没放到 GitHub,大家如果需要可以评论区留言,或者等我们推到 GitHub 哈。

先来看下整体流程:

1[导入剧本]  [创建角色]  [创建场景]  [编排分镜]  [生成图片]  [生成视频]  [导出]
2                                                                
3  (可选)      上传参考图    上传参考图    选择模板      AI生成       (可选)
4             填写描述      填写描述      写画面描述    保持一致性
5

图片

生图这里你可以选择本地 ComfyUI 的方式,也可以选择 API 的方式。

这里以 API 为例,如果你希望稳定,性价比高的 API 平台,可以试试 Atlas Cloud。

地址:www.atlascloud.ai?ref=AXZ9S7

在漫剧场景中稳定出图出视频很重要,而且对于内容角色的生成,最好避开接口的审查和限制规则。

Atlas Cloud 这个 API 聚合平台能很好的满足漫剧这个场景的需求,毕竟它主打的是企业级 API 聚合,拥有 300+ 知名大模型,总结下来是:稳定、易用、低价

图片

那该如何使用呢?注册登录后,打开控制台,新建 API 密钥。

图片

多说一嘴,Atlas Cloud 目前注册绑卡即可白嫖 1 美元使用额度,可以免费生成不少图了。

填写名称后,点击创建:

图片

然后复制这个 API,填入到环境变量中:

图片

需要复制一份 env,然后把改调用方式为使用云端 API 的方式:

图片

然后就可以启动项目,项目启动后,你可以一句话生成故事,也可以按照流程自定义,你可以先创建一个角色并添加场景:

图片

角色描述和场景描述都可以用 AI 生成,也可以自定义更改。

然后就是对镜头进行编排,可以添加自定义镜头,描述同样也可以 AI 一键生成,不满意可以改。在这里你可以选择需要出镜的角色:

图片

可以看到已经添加的镜头列表,有专业分镜格式的标准提示语,对于分镜的生成效果会更好。

图片

然后就可以生成镜头和对应的分镜视频:

图片

可以选择一键生成全部视频,这里选择 API 的方式来生成。

图片

最后,你可以导出所有的图片包、视频包、分镜脚本,做素材备份,最后就是做视频的合成。

图片

我们做了比较详细的产品特点说明说和使用说明书,目前还在优化中,如果你想提前看看,可以评论区告诉我。

说真的,这套系统,我认为,还是又再次满足了我做漫剧的激情,虽然我们不是专业的漫导,也非该行业的从业者。

但通过 AI 编程,我们也能做出一个,算是能满足我们需求的工具,然后去满足我们做漫剧的心。

因为是开源平台,你可以自定义各种花式玩法,觉得哪儿不满意,甚至可以让 Claude Code 帮你改。

有时候,我觉得 AI 编程最大的价值,或许在于:

满足自己的灵魂,而非取悦别人。

如果你喜欢我们的作品,也欢迎给我们 star,如果你想加入我们平台共建,也欢迎联系我。

目前平台有三个核心贡献者,分别是猫哥,蜗牛和苍何。

我们会在深夜畅聊产品的,沟通如何优化。

图片

每当在 GitHub 上有新的进步,我们会为此而欢呼,当然,我们今年的目标是破千 star,也不知道能不能完成,哈哈哈。

图片

当然我知道,我们做的远远不足,很多想要优化的点都还没优化,一方面是因为我们时间精力问题,另一方面,我们对漫剧这个行业的 know how 还有限。

当然了,我也在不断的学习,学习优秀的产品,学习他们如何做出精品的漫剧。

最近也在用 oiioii 来学做精品漫剧,到时候再来和大家分享了。

好啦,最后,如果你有一定的 vibe coding 能力,同时也是 AI 漫剧的热爱者,欢迎加入我们 GitHub 开源项目的共建。

感谢你喜欢我的文章,我们下一期见啦。


耗时 20 天,AI 漫剧 APP 和 Web 全部开源, 已斩获 764 星!》 是转载文章,点击查看原文


相关推荐


万字长文!搞懂机器学习中的概率图模型
aicoting2026/1/19

推荐直接网站在线阅读:aicoting.cn 概率图模型(Probabilistic Graphical Models, PGM)是一类结合概率论与图论的强大工具,用于描述多个随机变量之间的依赖关系。它通过图结构将复杂的联合概率分布分解为局部条件概率分布,使得对高维数据建模和推断变得可行且高效。 根据图的类型,PGM 可分为有向图模型(如贝叶斯网络)和无向图模型(如马尔可夫随机场)。贝叶斯网络利用有向无环图表示变量之间的因果关系,适合建模因果推断和序列数据;马尔可夫随机场则通过无向图捕捉变量之


WPF样式进阶实战:外置样式+MVVM主题切换+样式优先级全解析
bugcome_com2026/1/11

在WPF开发中,样式(Style)是实现界面美化、统一风格、提高代码复用性的核心利器。但很多开发者在实际项目中,容易陷入「内联样式冗余」「主题切换困难」「样式优先级混乱」的困境,写出难以维护的XAML代码。 今天我们就通过一个完整的模块化实战项目(附全部可运行代码),从「外置样式封装」到「MVVM模式主题切换」,再到「样式优先级核心知识点」,全方位解锁WPF样式的高级用法,最终实现一个支持「浅/深色全局主题切换」「按钮专属样式切换」「传统后台代码样式切换」的完整案例。 一、项目架构梳理:模块化让


2025年终总结,智启
袁庭新2026/1/3

大家好,我是袁庭新。2025年就这么溜走了,对我而言,是极为不寻常的一年,总是想着用文字把它记录下来。 文章输出 写是为了更好的思考,坚持写作,力争更好的思考。 2025年累计发表54篇原创文章,平均1周更1篇,大多数是技术相关。2025年我有个转变——每个月写一篇月总结,对这个月主要做了什么事做一个系统的梳理,尽量以可量化的形式呈现,比如,这个月写了多少篇文章,拍了几条短视频,录了几节课,办了几场讲座等诸如此类。 为什么采用这种方式呢?前些年我也不是没写过年终总结,年底一回顾,感觉又稀里糊涂过


一文带你吃透 Java 反射机制
BestAns2025/12/24

一文带你吃透 Java 反射机制 在Java开发中,“反射”绝对是个让人又爱又恨的知识点。有人觉得它晦涩难懂、破坏封装,也有人靠它实现了各种灵活的功能——比如框架开发、动态配置加载。 其实反射没那么神秘,今天就给大家用最通俗的语言讲清楚:反射到底是什么、怎么用,以及反射在实际开发中的应用。 一、Java反射到底是什么? 我们先从Java的核心特性“封装”说起。平时写代码时,我们通过new关键字创建对象,调用类的方法、访问属性,都是在“编译期”就确定好要操作的类,比如User user = new


为什么说 AI 赋能前端开发,已经不是选择题,而是必然趋势?
西陵2025/12/16

首发于公众号 code进化论,欢迎关注。 前言 这几年 AI 在前端开发里的能力几乎是肉眼可见地进化”。从最早只能帮我们做做代码补全、提示几个参数,例如早期的 comate。到后来能够独立生成一个完整的 React/Vue 组件,连逻辑、样式和交互都能自动写好,例如 cursor 和 claude。再到现在,AI 已经能根据一句自然语言去搭建整个前端项目,自动创建页面、路由、接口层,甚至跑通基础业务流程,例如 v0 和 bolt.new。AI 的角色正在从“聪明的编辑器”变成“能独立干活的虚拟工


计算机十万个为什么--数据库索引
无限大62025/12/8

计算机十万个为什么--数据库索引 大家好,欢迎来到最新一期的无限大博客。 突然发现自己对数据库相关的内容掌握不够扎实,于是就去学习了一下,顺便也将自己的理解写成了一篇博客。 希望这篇文章能对大家有所帮助 数据库索引:给数据仓库装个"智能导航系统" 🧭 想象一下,你走进一个占地 1000 平方米的超级图书馆 📚,里面塞满了几十万本书,却连个分类牌都没有。老板忽然喊你找一本《数据库从入门到放弃》,你是不是当场想表演一个原地消失术?😱 这就是没有索引的数据库的日常!每次查询都像蒙眼找书,全表


失业7个月,我把公司开起来了:一个程序媛的“野蛮生长”
后端小肥肠2025/11/28

大家好,我是小肥肠。 4月被裁,11月注册公司。 这7个月,我一个人赚回了以前一年的工资,也攒够了人生第一台CC的首付。今天不讲技术,聊聊这半年一个程序媛的野蛮生长。 1. 半年了我开起了公司 从4月到现在已经创业半年多了(7个月),这7个月以来,我从一个一无所有的失业人到现在攒够了一台cc的首付(赚的比以前上班一年还多),我的共学社群实现了从0到现在的300多人。 其中有很多和我一样的程序员,他们都是被我的文章吸引来共学群一起成长,也有很多小白进来一步一步成长为可以自行搭建自己的智能体。 在这


提示词工程入门-03
一诺滚雪球2026/2/6

前言 "写个代码" "帮我写个快速排序函数,用 Python 实现,要求时间复杂度 O(n log n),添加详细注释" 同样是让 AI 写代码,为什么第一个指令得到的是模糊的回复,而第二个能得到精确满足需求的代码? 这就是提示词工程(Prompt Engineering)的魔力。 好的 Prompt = 好的输出。今天我们来学习如何写出让 AI "秒懂"的提示词。 1. 什么是提示词工程 提示词(Prompt):你给大模型的输入指令 提示词工程(Prompt Engineering):设计和


EasyExcel的使用
脸大是真的好~2026/2/15

需求1:能够导出1个Excel文件,能够导入一个Excel文件; 需求2:导出的文件,能实现第1行,第123列的合并单元格:也就是会写注册处理器;知道sheet和cell是什么; 需求3:能实现合并的单元格设置单元格宽高,背景颜色,内容居中,字体大小; 需求4:能控制从任意行开始写入,并让要输出的字段居中; 需求5:导出能实现从任意行开始读入; 导出Excel文件 <!-- EasyExcel 核心依赖 --> <dependency> <groupId>com.alibaba</gro


一个简单Demo彻底理解前后端怎么连的丨Figma + Supabase + Vercel
阿星AI工作室2026/2/23

哈喽,大家好! 我是阿星👋 很多小白编程学了三个月,全是AI做主UI,难以融入自己的设计理念。 甚至不了解前后端到底怎么连通的。 一旦代码出错了,可能和AI对话还要重新理解一遍概念。所以今天,我们通过一个简单的case,把一个完整前后端的核心链路全跑一遍👇🏻 让你能自己把控UI、把控数据库、把控前端、后端。 🗺️ 先看一眼全局流程 整件事分五步,每一步做完了才能进下一步: ① Figma 画页面 →  ② 定接口契约 →  ③ Supabase 建数据库→  ④ AI 帮你写连接代码

首页编辑器站点地图

本站内容在 CC BY-SA 4.0 协议下发布

Copyright © 2026 XYZ博客