尝试直接生成漫画(用DeepSeek结合GPT)
deepseek吧
全部回复
仅看楼主
level 9
相信大家都看过GPT生成漫画的功能了,但是即使是在之前展示漫画的贴里,也有很多吧友询问流程。因此这贴不仅展示漫画本身,也展示操作过程和提示词。1楼先放未经人工修字的结果(我知道大家肯定会吐槽ai生成的中文模糊,但是效果其实比以前的“西夏文”要好很多了[喷],如果大家用过以前的ai绘画生成中文,就知道什么叫做“西夏文”,现在可是有不少的改进)
当然开始之前先套个盾:因为贴吧里有很多讨论不同ai模型的,除了DeepSeek以外,还有谷歌的Gemini和马斯克的Gork,所以我想:GPT应该是可以提到的吧。不过考虑到现在各种视频平台都早就已经充满了GPT生成图片的各种教程,所以其实我估计大家都已经早就会了[狂汗]。因此这贴展示操作流程也只是一个记录,等以后出现了更方便的ai漫画,将来就可以对比这贴只在目前有时效性的内容做出了多少的改进。
之前也有很多吧友提问“能不能生成本子”,首先CLoseAi肯定是不允许的……[滑稽]这一点从当年GPT推出之后大家应该都知道了,不过我看贴吧里有很多研究破甲提示词,我倒是有点好奇大伙能不能破图像生成的甲……(大家肯定好奇为什么不是我来破?因为我确实没有破限的经验)破限我只在本地部署玩,而本地部署基本不用破甲提示词,直接下载去除限制的模型就行。
不过还有一个比较常见的误区就是:ai绘画不是很久以前就有了吗?怎么会炒冷饭?[疑问]这里也会跟各位吧友说明一下“ai绘画”和“ai漫画”的区别。实际上ai绘画确实很早之前就有,但是以前的ai漫画还是人工拼凑出来的。也就是说:以前的ai漫画是使用ai绘画加人工逐张手动拼接而成的。而现在的GPT又
整活
,就是做到了能够直接生成拼接后的漫画,也就是省略了人工拼图的流程。
2025年04月01日 13点04分 1
level 9
当然,看完上面的漫画之后,大家可能会觉得背景有点混乱,这倒不是GPT的锅,而是DeepSeek的经常性
发癫[狂汗](DS写了个“两位ai在坍塌的赛博空间里……”说实话这个描述别说让GPT画了,就是让人画我觉得也很难想出来怎样的背景才算是“坍塌的赛博空间”)其实只要手动指定背景的话,GPT是能画出正常的背景的,如图所示:
-
顺便填一下楼上挖的坑,这楼展示GPT自己生成的角色有多普通[阴险],如图所示:
-
大家可以看到,GPT自己生成的角色一点特色也没有,所以我只好又拿出了发展已久的Stable Diffusion。
接下来……
[真棒]SD启动!(下图是Stable Diffusion生成的,不是GPT生成的)
大家可以看到,还是经典的SD搞ai绘画效果好(毕竟扩散模型已经发展了好几年了)所以我把SD生成的角色作为参考图,使用上传图片功能直接上传到GPT,就能让GPT按照指定的外观来生成了。
-
不过大伙如果拿上面那张图和楼上的漫画进行对比,就会发现GPT生成的漫画丢失了很多角色细节[啊]。这个其实是老问题:别说GPT了,就连发展了好几年的Stable Diffusion都无法保证细节一致。
-
接下来再来展示一下1楼提到的“西夏文”问题,下面这张图展示了SD、FLUX、GPT、人工的对比,大家就知道:Stable Diffusion发展这么几年,其实一直没有解决中文问题,
在图里大家可以看到,FLUX模型刚推出时候说是解决了英文字母的问题。但是填写中文内容,FLUX则是会跑出日文……只能说GPT在这方面确实是有更新[钱]。不过这也并不意味着扩散模型就不支持中文,只是中文经常没有被当成ai绘画的训练数据而已。
-
其实中文的训练数据非常的多,不论是以前曾经被忽略现在被GPT捡起来的自回归模型,还是发展已久的扩散模型,都是可以通过增加中文的训练数据来实现画出中文的。最后也期待一下国产的ai能够给大家带来更便宜的ai漫画,毕竟老外的GPT用起来很麻烦,老外的ai价格还贵,只能希望国产ai加油哇![真棒]
2025年04月01日 14点04分 3
角色一致性的解决办法目前最主流也是最有用的还是专门训练一个角色的lora模型
2025年05月24日 15点05分
@rabbitea [乖]其实这贴里追求的不是角色一致,而是在多格漫画里分配不同角色(让不同角色分格,或者处在同一格里面时,不受其它角色影响)单一角色的话本来也不影响一致性。而GPT开源的模型只有1和2,从GPT3之后就不能给GPT训练LORA了
2025年05月24日 15点05分
level 1
看我主页,那就是基本用AI做的
2025年04月01日 14点04分 4
哇!炫酷[真棒],不过我的2楼被百度抽楼了,我得在5楼补档一下
2025年04月01日 14点04分
level 9
2楼好像被百度抽楼了,我补一下:
-
看了1楼的结尾,大家肯定会吐槽:连动动手指拼图这种简单的操作都要节省吗?[啊]其实如果大家这么想,可能会误解ai生成漫画的目的:如果只是为了漫画本身,那动用人工肯定没问题。但是只要是在这个贴吧看过足够多贴的吧友,就知道贴吧里有很多利用ai来玩交互式游戏的(比如跑团、角色扮演、小说接龙……)那么ai生成漫画究竟意味着什么,相信大家也能够明白了[真棒]:不只把思维局限在漫画本身,还有更多创意。
-
接下来开始介绍流程,其实步骤就是用DeepSeek生成小说,然后把小说内容分段复制给GPT生图就行了,如图所示(注意:以下结果经过人工修字,未经人工嵌字的效果在1楼已经展示过了)有的吧友可能会好奇prompt在哪里,其实截图里就有提示词。为了让大家看到提示词的位置,图片里会用用箭头指示prompt的位置。
当然如果有使用过以前的ai绘画的吧友,可能会好奇那不就是和ai的对话吗?实际上这就是GPT的更新之处:使用自然语言作为提示词[钱],因为以前的ai绘画都是使用标签作为prompt。所以一些吧友可能没有意识到:因为在GPT可以使用自然语言作为prompt,所以只需要用中文向GPT描述画面里有什么就行了。
然后就是提示词里的角色,大家可能会好奇,截图里的prompt为什么是“角色1”和“角色2”而不是“角色名称”?这其实就是因为有一个常见的问题叫做“提示词污染”。因为GPT里内置了很多角色,这意味着如果和训练数据里的某个角色同名的话,就会导致角色外观受到其它角色影响[喷],从而看起来不像自己决定的外观。所以我选择用指向性的“角色1”和“角色2”来指定(角色外观在3楼展示了)
这时候大家可能会好奇,那这里是怎么确定角色外观的?这其实就是涉及到另外一个功能了,就是上传图片。大家可以把有着角色外观的图片上传,就能用图片里的标记确定角色了[勉强](当然也可以直接让GPT随机生成角色,但是GPT自己生成的角色外观有点太普通了,3楼展示了GPT生成的角色进行对比)
最后就是关于画手问题,大家都好奇以前的Stable Diffusion不是已经解决画手问题了吗?怎么GPT手又崩了?[疑问]其实是因为网上都在谈论说GPT在尝试不同的技术路线。以前的Stable Diffusion都是扩散模型,而GPT使用的是自回归模型。这意味着不同技术的探索,可能会重新面临一些在其它技术上已经解决的问题。
-
不过就像以前的Stable Diffusion逐步解决画手问题一样,曾被长期放下的自回归模型既然能被GPT捡起来还能搞成这样,那么最终应该也能找到画手的解决办法,这一点大家就不用太在意了。
2025年04月01日 14点04分 5
level 1
gpt是不是要充会员啊
2025年04月01日 15点04分 6
[钱]是的,20美元,换算到国内还挺贵的。不过在这个贴吧里大家都不推荐充,因为ai进步很快,万一国产ai又给大伙搞个更便宜的,充这个就亏了
2025年04月01日 15点04分
@安泽11 [乖]其实自从今年2月godot贴吧就有研究怎么接入ai以来,我也一直在围观ai的情况。如果你也会了ai,就能增强npc的对话了(也能改善游戏的玩法)
2025年04月01日 16点04分
@人类的大敌 好的,感谢godot吧主[笑眼]
2025年04月01日 15点04分
@人类的大敌 那太重要了,吧主加油,出个攻略[真棒]
2025年04月07日 10点04分
level 1
所以现在SD可以通过训练Lora画出稳定的四格漫画吗?一直对这方面比较感兴趣,那种线上不开源的还是算了,不能本地部署自己控制工作流的没啥意义
2025年04月03日 13点04分 7
@rabbitea 晕,刚才看了下私信设置成只接收好友的了没收到,再发一次吧谢谢
2025年05月25日 02点05分
工作流能做到,但取决是否有人去做。[勉强]我都能想到技术路线:早在两年前ai就能生成骨骼动作了,接下来LLM把骨骼分配给漫画格子,再接Control Net对应角色,最后语言模型填对话框。考虑最近GPT很火,可能已有人在研究工作流了。虽然工作流能,但是Lora肯定做不到,因为Lora追求的不是可控性,而是过拟合
2025年04月03日 15点04分
有的兄弟有的,我之前部署过一个不用lora模型也可以生成四格漫画的工作流,不过角色一致性还是有问题,不过如果自己加上训练后的lora模型那就OK了,不过我电脑性能太差了训不动lora而且原工作流很复杂于是就放弃了,你要是想研究这方面的话我明天有空把那个工作流的地址发给你
2025年05月24日 15点05分
@rabbitea 你这是一次给出多段描述词,然后一次性生成一个图片里包含多格图片这样的吗?还是说一次给出多段描述词,跑出多个单独图,然后保持这些图的一致性这样的?
2025年05月24日 15点05分
level 3
娘版DeepSeek和ChatGPT可爱

2025年04月03日 15点04分 8
其实DeepSeek的娘化形象在贴吧里之前就有许多吧友画过,不过如果要用吧友的设定的话,就需要申请授权。[钱]感觉等授权有点久,这贴里就直接用SD生成了
2025年05月24日 15点05分
level 9
6
2025年04月03日 16点04分 9
level 6
cy
2025年04月23日 12点04分 10
level 1
你还玩godot吗?
2025年05月24日 14点05分 11
猜猜我是哪个贴吧的吧主?[滑稽]我是否玩godot只需要考虑一点:百度会撤下长期不讨论相关话题的吧主,那么我是如何保留吧主的头衔的?
2025年05月24日 15点05分
level 12
3
2025年05月24日 16点05分 12
level 9
这贴本来是上个月发的,没想到这个月还能被顶上来。[啊]既然如此,在这贴记录一下自己瞎搞的穿越剧情(穿越题材的剧情算是目前比较普遍的剧本题材了,考虑到这个贴吧里有挺多用ai生成小说的,大家应该也想象过穿越到不同的世界观里的效果吧)如图所示:
顺便来点西夏文大挑战:[滑稽]看看谁能看懂GPT生成的中文(不过前面在1楼和3楼都槽吐过“西夏文”了,这一点倒不是重点,而是考虑到中文属于那种缺个几字也不响影读阅的言语)想必大家一定能猜出来吧(反正我是看不出来GPT画的中文是啥)
2025年05月24日 20点05分 13
1