实在是没招了,有没有大神能救救我🥲承包一个礼拜的瑞幸!!!
deepseek吧
全部回复
仅看楼主
level 4
我是做电商运营的,经营的主要是饰品类目(项链,脚链,身体链等等)的产品。
在接触到 AI 以后越发理解它的神奇和那种指数性迭代的强大,于是自然而然利用它参与到了我的工作和生活当中,尤其是在工作当中利用它来做产品主图和详情图。
于是我经历了以下阶段:
1.利用豆包或即梦直接生图:国内的 大模型好像受到了很强大的安全限制,受限于我的产品类目原因(确实会有皮肤大面积露出的擦边),我的很多图片大模型都无法生成(或者胡乱生成),每次都需要自己反复利用 deepseek 锤炼提示词才有可能达到我想要的效果,最后再利用 ps 进行精修。时间耗费巨大。
2. 于是我换成了 gimini ,利用视觉分析大模型(豆包)+文字推理大模型(deepseek)进行精炼提示词,最后再交给 gimini 最后一次性生成 10 张主图和 12 张详情图,但是这个过程很繁琐,每次的复制粘贴和重新生成往往要花费很长时间,有时候两天才能出一套能够合格的图片。
3.我开始改变策略,既然这个第二步流程思路是对的,那我能不能利用智能体或者 AI 来实现一键生成呢?哪怕是先做个垃圾出来。是的然后我又去了解智能体和工作流,综合分析过后我选择了扣子的工作流,参考各个平台此类博主的视频以后,我做了个垃圾出来:
a.开始
b.利用 deepseek-v3.2 拆解产品
c.利用豆包·1.5·pro·视觉推理 对产品图片做看图报告
d. 利用deepseek-v3.2 根据 b 和 c 生成的数据精炼生成提示词并转译成英文
e.利用豆包-seedream-5.0-lite 生成图片
f.结束
看着好像没什么问题,但是生成出来的图片不堪入目,而且看图和生图的环节,好像因为是豆包这类大模型,看图看的比较保守,模特的服饰穿着它压根就不说,生图就更别说了,生成的图片都是修女风,裹得相当严实。
4.于是我进入到了当前第四个阶段,目前还是测试阶段,还没有完全跑通。我在想能不能在扣子中建立我的数据库。将合适我这个类目的很多优秀图片中的排版,背景,光影和摄影镜头,模特,模特情绪,肢体动作,服饰穿搭交给大模型 100% 分析复刻,然后转为提示词,再按分类存入数据库中,最后再回到工作流,在 deepseek 写提示词的时候,要求在每个数据库调用一条来组合成一张完美的模特图片的提示词交给生图的大模型。这样尽可能的利用提示词来约束 AI 生成图片,是不是就可行了?
但如果这个思路是可行的,又怎么保证视觉识别的 AI 它一定会 100% 把我的素材图片识别正确,将我中意的元素提取出来?又或者即使提取出来了,固定了提示词,生图大模型那边不买账觉得是违规提示词拒绝生成怎么办?
烦请有看到的大佬能够给我解惑,感激不尽,从 0 开始熬了 20 多天夜了,实在是没招了才想到到这里来求助,不白嫖。
2026年04月16日 17点04分 1
level 4
采纳意见前三位承包一个礼拜咖啡[吐舌]
2026年04月16日 17点04分 2
level 6
来了,一个很大的问题是,模型性能差不是你通过架构解决的,任何应用实际上架构和提示词都是不会造成太大的影响,本质还是你的模型是否够强。建议你换些好的模型试试看
2026年04月16日 18点04分 3
level 6
建议你可以试试一些更强大的模型,比如将DeepSeekv3.2换成gemini3.1pro,生图换成gemini3pro-image(也叫nano banana pro)或同等级产品试试看
2026年04月16日 18点04分 4
level 6
提示词和工作流程是一方面,但最重要的还是看你模型是否够强
2026年04月16日 18点04分 5
level 6
关于审查:toC的网页和应用审查都比较严格,有条件建议购买API使用。大部分国产模型,除DeepSeek以外,安全审查发生在模型训练层面上而不是二次审查,因此有容易被拒绝的需求不建议使用
2026年04月16日 18点04分 6
目前国模做文本推理普遍都没什么审查的,基本上都是阿里,腾讯这些平台自己加的二次审查。lz遇到的是生图模型的审查,这个一般是训练中就会有的
2026年04月16日 19点04分
level 9
生图怕违规就用grok。只要别太过分就行,出图效果也不错。
2026年04月16日 18点04分 7
level 6
生图模型我记得有一个Zimage是完全没有审查的nsfw也能生成
2026年04月16日 18点04分 8
level 6
另外我个人的一点私心是,不太建议使用工作流,有条件可以试试学一点编程,工作流自由度限制比较大,当然只是我个人体会
2026年04月16日 18点04分 9
工作流对代码行数和嵌套层级和流中格式都有限制,我已经不用了,还是编程自由度高IDE配套强
2026年04月17日 01点04分
level 5
感觉直接去一些开源的社区翻翻工作流更好,没必要自己手搓
2026年04月16日 18点04分 10
level 6
关于写提示词的部分。这部分是每个模型性格不太一样导致的,你像gemini就比较偏向于华丽丰富,DeepSeek就比较平淡简洁一点。但是DeepSeek很好的一点是它性能其实不算特别差,通过恰当的方式,比如说few shot,就是给几个精细写过的案例,它就能比较好的拟合案例的模式
2026年04月16日 18点04分 11
level 6
深夜说的有点乱,但是大概就是你现在效果不好,主要原因是模型不够强导致的,次要原因是提示词还有提升空间
2026年04月16日 18点04分 12
私信了,靓仔
2026年04月17日 07点04分
level 6
有一点四路,明天细说
2026年04月16日 19点04分 13
私信了,靓仔
2026年04月17日 07点04分
level 7
很好奇你是做什么工作的
2026年04月17日 06点04分 14
国内的电商小运营[小乖]
2026年04月17日 07点04分
1