真·晕晕无双 真·晕晕无双
痛苦的思索永无尽头
关注数: 40 粉丝数: 475 发帖数: 10,361 关注贴吧数: 21
诶,你怎么知道我是jrpg老炮+异星工厂500小时 二十年jrpg老玩家,异度之刃三部曲都是二周目起步 异星工厂500+小时,戴森球计划300+小时 今年玩过的觉得最好玩的游戏是死亡搁浅2 该怎么说呢,冥冥之中仿佛和游戏制作组神交已久( 总之游戏已经关注两年多,好像最近终于要上线公测了 看熊人族直播玩还是很对胃口的,似乎有不少玩家吐槽四号谷地的流程,但我云下来反而觉得这段流程比后面的第二张地图更有意思? 隔壁几个主打大世界的二游都开服玩过一会儿,就玩法上来说都没能打动我,基本都是玩一会儿就放弃了 这游戏目前看下来玩法特别对我的电波 不过很遗憾,最近两次cbt我都没有获取到游玩资格 我对三测卡池的看法是大部分设定都能接受,包括角色池超过80抽不继承,其实作为一个非酋早就习惯了攒够井再下池子 有意见的地方是武器池的抽取资源主要是由角色池产出的副产物这件事,这个设定结合75%的歪率以及80发的大保底: 1、如果你角色池子提前出up欧了一把,除非直接放弃专武图鉴否则等于没欧,极其打击提前出up的乐趣 2、因为抽卡资源和角色池子随机性绑定,武器池不像角色池可以提前规划的比较清晰。欧了还好说,一旦你小保底歪了但大保底又不够,试图赌一把还赌输了,结果就是要么看着打水漂要么强氪礼包。 我知道拉个表出来综合期望并不离谱,但是这里面就是藏了一些很让人恼火的小陷阱在等待着某些小倒霉蛋掉进来。 你以为你欧了一把? 狠狠地惩罚你们这些小贪心鬼!
关于目前市面上3D辅助课程的感想 楼主本人最近一年从各大盗录课贩子那买了一堆3d辅助的录播,大概全部加一起就几百块(太贵的买不起 并不是说全部都看完了,有些课程讲的真的一言难尽就实在看不下去,然后也基本都是开1.5-2倍速看 不是抱着学画画的心态来的,主要是看看现在情况大概是个什么样,然后我也对3d出图流程比较感兴趣 各方面看下来的感想是: 1、大家都是兴趣班类型的,没有任何一个是奔着就业方向去的。 你本身就是行业内的人来学点新知识可以提高你的工作效率,你是个主要经营社交媒体平台的网红画师来学点东西提高你的技能水平,你是个萌新主要过来凑个热闹。 虽然说可能和大环境恶劣有关,但讲师们都几乎集体默认不分享任何对你进入真正的职场有帮助的知识。 讲师们自己其实大部分也基本和游戏行业无关。 --------------------------分割线-------------------------- 2、大家都很少讲美术基础,美学设计相关的知识。课程知识主要围绕软件为主,其次是3d建模知识,再次是出图效果。 讲软件是比讲美术更枯燥乏味的,很多录播我都是卡在了这部分放弃继续看下去。 具体是哪些我就不点名了,看盗录的就别那么厚脸皮了 --------------------------分割线-------------------------- 3、总体来说这些班值不值得去学看个人目标,如果你是奔着就业去的都不推荐,浪费你的时间。 适合想要拓宽技能树的有牢靠美术基础的人,或者想提升工作效率的职业大佬。 个人比较推荐t5,他的软件部分讲解的相对没那么枯燥。 粉帮老大也是t5班学出来的,我觉得他的审美比t5好,但是教学风格上我是更喜欢t5。 其他的不予置评了,毕竟是个看盗录的 --------------------------分割线-------------------------- 也欢迎大家分享下自己报的一些3d辅助班的体验感想
黎之轨迹3——不,应该说是界之轨迹1 本作的剧本属于是最极端的先射箭再画靶子了,都不带演的,主角团三线都对主线没有任何推进作用。 为了讲一个刻奇故事强行做了一整个和故事本身没有任何关联的游戏流程。 游玩本作时久违的体会到了闪之轨迹2的那种绝望感。 出场角色人均谜语人,知道点东西也打死不透露半个字,就看你们这帮小丑主角团在那瞎忙活。 一切都被人家安排得明明白白,让你玩那三天游戏流程纯粹是陪你过家家,顺带寒暄***脉关系。 相比之下前作黎之轨迹2在我心中都变得没有那么难以接受了,起码最后结局不显得主角团像一帮小丑。 写本作游戏剧本这帮人是真的甲级战犯,排着队隔一个枪毙一个都必有漏网之鱼! 这真是我行我上了,我随便动动脑子都能想到更好的做法: 1、首先把共和国明面上筹备载人航天计划但实质上举国备战的状态作为大背景,引发主角团(包括隔壁帝国与教会组)的调查。 2、三线主角团完全可以做成类似创之轨迹的跟随一条线索不断切换视角来逐渐揭露残渣,AD,汉密尔顿的谋划与雷瓦汀计划的全貌。 随着流程的推进这三条线可以交汇,随着他们各自的立场引发冲突战斗,最终实现联合携手揭开谜底。 本作中这些悬念包袱在数量和质量上都是可以撑得起的,偏偏他们要当谜语人! 3、学妹当然可以被牺牲,但是应当更多地铺垫她的心路历程,而不是这么的突兀。顺着这条线完全可以讲清楚她这家族的这些事,而不是一股脑丢到乐园的回忆水晶里面! 4、教会和结社应该给出更加过脑子的描写,而不是高矮个子组合直接跳反,妹妹头西装男在哪都能带个大哥打酱油美其名曰“见证”。 我是说假如:冰火娃本作登场之初就是作为汉密尔顿的保镖,被她的人格魅力吸引,但随着不断揭开的真相使他们内心有着激烈的思想斗争最终还是坚定的站在教会的对立面。 再比方说:绿毛小丑这帮人的所有正面戏份都可以删掉,本来就没你的事儿,你来刷什么存在感?为了强行给流程注水吗? 5、狮子直接滚出主角团,和剑仙坐一桌去。 主角团有你没你有什么差别?强行降低逼格,整个塑造一塌糊涂。 6、多给静名一些戏份,我是真的不理解最后你怎么就放了黎恩鸽子莫名其妙加入4spg的。 本作最后迷宫静名加入的时候我第一反应就是你集把谁啊?和你很熟吗?你是没有自己的工作要做吗? 7、眼镜哥跳反能不能加点铺垫? 你法在共和国篇是真的很喜欢突然引入任何铺垫但是强的离谱的角色,前有史上最强猎兵,在前两作里已经被玩家喷烂了都。 毫无人格魅力,强的莫名其妙。 本作更是离谱,没有任何戏份的结社突然来了个足以和马克邦相提并论的幻术师就不说了,结局蹦出来个跳反眼镜哥。 直接能从地球空间跳跃到宇宙,不是哥们儿?你这么强还要什么火箭,直接造他十几台王者之剑几百发核弹传上去说不定早就把是那破盒子连带0骑给炸死了。 能时间停止,能从平行宇宙拉分身来战斗这种bug级的就更不用说了,马克邦都没你这么神棍。
一个普通上班族两周后总算通关了黑神话悟空的感想,聊聊剧本 两年前法环那会儿我还能一周内通关,现在年纪大了,打游戏也没有那么上头了。 慢吞吞的也算是通关了,其实也一直在网上关注游戏的咨询,跟着攻略打了不戴金箍的结局。 首先是争议最大的一点——黑神话悟空剧本改编是不是不尊重原著? 我认为是的。 我对原著的理解一直都是在一定程度上影射作者所处时代现实社会现象的神魔幻想故事,原著中几乎每个角色都写得栩栩如生,神神佛鬼怪都描写的市井生活气息十足。 但主线的根本还是讲述师徒四人在旅途中磨练心性,证得大道的故事。 原作没有否定取经成功,功成正果是好事。 而黑神话悟空已经说明的故事再结合一些刻意的留白,游主创团队确实有意引导玩家去否定取经这件事的成果,这也就是非常彻底的否定原著了。 其次,黑神话悟空的剧本是不是阴谋论? 我认为是的。 原著中作者虽然极尽讽刺神佛妖魔无任何区别,有时候细想妥妥的就是一部职场官场厚黑文学,但并没有对这套世界观制度有过本质的批判与反对。 六界众生在这样的轮回下依然是维持了一个长久的秩序。 而黑神话悟空的剧本从本质上就反对原作构建的这套世界观的合理性,并二创增加了灵韵这个延长仙佛寿命的资源。 还让神佛垄断了这项资源,进而引申出了阶级矛盾使得游戏中一部分角色的行为具有其合理性。 最后,黑神话悟空是不是抹黑了悟空的形象? 我认为没有。 关于原著的形象到底是什么样我就不想说了,各人的理解不同。 但本作的悟空是一个有成长曲线的复杂形象: 1、取经时期,他是真的服了,怕了。他对牛魔王说的那些话十分清晰,可以看出他真的没得选了。在取经这一路上他干的好事坏事,皆是身不由己。 2、修成正果时期,悟空还是受不了这个神佛压迫世间劳苦大众的制度,他对八戒说:这供品,本该给那种地收菜的人吃。我们吃了,他们就少吃一点。 3、辞去佛位时期,宁愿死也要追求自我的自由。相信即便自身兵解消散,将来也会有后继者收集继承他的根器成为一个全新的无拘无束的齐天大圣。 我很喜欢这个形象的悟空,这是属于游科理解的那个悟空,也恰好很对我的胃口。 我喜欢这个剧本吗? 我觉得我还挺喜欢的,但是这个剧本很明显有大量的缺失和关键事件情节交代不清,或者有意模糊的情况。 根据对冯骥的采访他说本来计划做13章,最后发售只有6章。可能是这个大改导致了现在剧本的问题吧,就挺遗憾的。 我不认为这个剧本烂,但我认为这个剧本还不够好,还有提升空间。 他有一个不错的立意,有一个很好的框架,有一个宏大的格局,但缺乏了实质的骨肉血水去填充丰满。
【长文】时隔一年,stable diffusion有哪些变化呢? 差不多一年前的这个时候,在了解了一些NAI的信息后我开始在自己的本地电脑上部署了当时的sd1.5的生态。 但玩了几个月感觉没意思了,就放下了。 这段时间刚好有点闲,回去看了下SD的最新版本,也就是SDXL。 感到乐子不少,就打算回坑玩玩 首先介绍一下SDXL是什么,SDXL是SD1.5这条技术路线上的终极产物,里面技术细节就没什么特别多好说的。 总而言之就是SD1.5的超级加倍版,参数量翻了几倍,摸到了人类对图像感知的临界点。 具体来说就是学啥像啥,不像SD1.5那样图像风格高度一致,看多了都是一眼AI。 虽然SDXL在绘图能力方面追上了midjourney v5,但受限于clip的性能,其并不如mid和niji那么方便易用。 但好在SDXL依然维持了stability ai的传统——真·开源,这使得该模型在用户社区中有着非常好的可拓展性以及无可比拟的可定制性。 你说是吧,close ai 下一代SD,也就是SD的V3版本在这几天也公布了一个预览版。 应该是受到了openai的dall e3的启发,他们用上了新的diffusion transformer架构,同时可以确定他们彻底抛弃掉了clip。 stability ai接下来应该必然是全力梭哈这条技术路线,他们放出来的几个大模型预览效果都完全可以和open ai的dall e3以及sora比肩了。 而stability ai的CEO也都明确了,他们依然会保持开源策略(具体是否会有商用限制还要到时候再看)。 你说是吧,close ai 扯远了,回到SDXL上。 SDXL是去年七月初发布的,起初社区里的人都不太待见这个新东西。 因为对硬件配置要求太高,部署难度高,易用性太差,训练难度过高等等问题生态发展很缓慢。 但随着webui支持了其fp8精度下的推理,社区大神对其技术的研究,到最近一段时间SDXL的社区生态已经被建设的很好了。 比起潜力已经被挖掘殆尽的SD1.5,XL明显更加优异的绘制性能显然是更吸引人的。 那么回到画制片人老婆这一点,我还是看到了novel ai v3版本后才对SDXL的性能到底有多强有一个明确的感知。 NAI3可以轻易的通过作品以及角色名称的提示词,来精确还原出这个角色,还可以风格词来定制一些绘制风格。 甚至可以通过一些抽象词汇来定制图像的情感传达方向。 但是十分可惜的是,NAI3不可能再像当年那样被泄露出来了,现阶段想体验这个最强的SDXL还是需要付费的。 但好在,民间大神也不甘示弱。 比如Animagine XL,他们在最新3.0版本里同样实现了和NAI3接近的效果。 实际上,这个模型使用了和NAI3类似的数据集来源和打标方式,但明显他们的数据集规模和打标强度要差不少。 它的性能距离NAI3还是存在不小的差距,但丝毫不影响其是目前为止开源社区里能被免费使用的,性能最好的二次元模型,没有之一。 例如输入【miyu/koharu/mika,blue archive】等提示词,便可以分别生成这些人设还原度较高,且十分精美的图像:而从这几张例图可以看出,得益于XL模型在噪声随机分布方面的改进,已经很大程度上脱离了此前【一眼AI】的尴尬情况。 图片的明暗分布变得更加自由,更符合人眼的常识。 但这种程度的东西对我来说还不够,要解锁一些更加进阶的玩法那必然就要涉及到微调,定制自己更加中意和喜欢的模型。 我对这个模型目前的意见是: 1、色彩对比度偏灰,我对二次元艺术的喜好偏向于更高的对比度,更强烈的色彩风格。 2、角色的造型太普通了,我需要更加独特的,符合我的喜好的造型倾向。 于是我花了点时间,收集了二十几张我在网上浏览时发现的符合我喜好的作品。 【为避免争议,所有收集而来的作品均为原发布者声称为AI生成的图像】 在打标完成后,将Animagine XL 3.0作为基底大模型,调好学习画风的参数就丢进炼丹炉就开始训练了这个lora了。 我还配置了卷积层维度相关的参数,训练成了lora的变种模型,也就是lycoris。 经过一段时间的等待后训练完成,我根据每次保存时生成的样本图筛选了几个版本出来进行对比。 使用webui的xyz脚本功能生成如下表格:综合对比下来,cute_v3_02这个版本我最满意。 画风学习的比较到位,且并未发现明显的过拟合现象,手指错误相对较少。 到这一版本应该是训练了21*25*3=1575步。 XL训练lora的效率比预想中的速度要快很多,在SD1.5版本中,应当是在2000-3000步左右才能获得相对效果较好的画风lora。 cute_v3_02版本的四张测试图片:除了肉眼可见的偏向于萝莉、可爱风格外,还有着橙红色的线条、粗描边、扁平化的材质等特征。 色彩显著偏暖,亮度较高,明暗交接处有橘色的描边。 仅用21张图片作为素材,就可以微调到这么出色的效果,可见SDXL的性能和潜力。 感觉又可以玩上一段时间了
游戏设计中的弱引导的反义词不是强引导 近些年各大游戏媒体对两代开放世界塞尔达与艾尔登法环的高度赞誉总是会提到他们开放世界设计的精妙,其中总是避免不了提到他们的【弱引导】设计。 以至于与之相对应的传统的【强引导】都快要被污名化了,我觉得有必要讨论一下这个现象了。 弱引导不是不设计引导,【无引导】是摆烂和设计拙劣的体现,不是弱引导。 拿艾尔登法环举例,法环的开放世界中充满了各种精心设计的弱引导: 1、游戏中始终会在玩家的可活动区域内设置一个非常显眼的引导地标,如大小黄金树,城堡/要塞/遗迹等等。 其中有着玩家大多数时候都能看到的显著地标,如大黄金树、神授塔;也有着玩家登上了某些高处时才能看到的小地标,如各种城堡、遗迹。 2、游戏中大地图区域的自然景观有显著差异,从平原到湖泊;从火山到黄金高原;从猩红腐败到苍白荒芜的雪原;甚至还有神秘寂寥的地下世界与古老破落的天空之城。 3、在墓地的入口前的显眼处总会摆放发光雕像引导物,在洞穴的入口处总会摆放会发光的蓝色水母。 这些设计是环环相扣的,在玩家自发对游戏开放世界的探索中无形的引导玩家前往各处兴趣点。 这些种种设计均深度参考学习了旷野之息,甚至法环的地图工具功能都与旷野之息高度相似。 但同时法环的部分引导设计是直接摆烂的状态,就比如NPC系统。 FS社直接从自己的箱庭魂系列游戏中把这套东西直接原封不动搬过来用了。 虽说他们后续更新优化了部分,但结果上来看勉强够个及格分。 我们可以说制作组对这部分并没有经过深思熟虑的设计,导致子系统(NPC)与主系统(开放世界)有明显割裂的表现。 那么与之对应的,旷野之息/王国之泪的NPC设计就是不折不扣的强引导。 除了传统固定的功能性NPC,他们还把所有的主线支线都整理到了一个记事板中,涉及到的NPC触发事件点直接标注到了地图上。 从结果来看,这种强引导设计给玩家带来的体验是远好于法环的“弱引导”或者说无引导的。 那么我可以得出这样一个结论: 弱引导的反义词不是强引导,弱引导的反面是无引导。 假设有这么一个横坐标:左边是弱引导,中间是强引导,右边是无引导。 那么越靠左,必然是设计强度、密度越高的。
器材党的最终归宿还是买原厂 今年618入坑,先买了A7R5+腾龙35150。 这套组合玩得很开心,虽然现在还是拍依托,但是这是我的技术问题和器材没什么关系。 我也很喜欢这个镜头,只能说除了重没有任何缺憾。 作为一个人像头光圈的足够大,焦段覆盖很满足,对焦很棒。 焦外表现一般般,但是起码可以说并不丑。 只要你能接受它的重量,那选择了它你基本就可以告别其他任何人像变焦了。+ 最近的样片,如上,使用35端F2.8拍摄效果。 这样直直的怼着闪光灯拍都没有出现明显的对比度下降和炫光,真的已经让我没什么好苛求的了。 这就是E卡口人像变焦镜皇无可争议吧? 本想着一步到位,一个镜头解决大部分需求,但35150用了半年还是觉得腻了。 新鲜感一旦消散,就老想着买点新的东西玩玩。 但腾龙这个大变焦在手,其实已经让我对所有的原厂+副厂24-200之间的变焦头失去了兴趣。 于是把目光转向了大光定,经过半个月的仔细调研,最终我锁定在了两颗50gm上。 找了个时间去了索尼的线下店实际体验了一下,其实去之前我是基本确认了501.4gm的,毕竟更便宜以及轻了整整200克。 但实际体验完之后,501.2gm让我认定了就是非它莫属。 然后就是大出血,带回家牙都咬碎了。带回家后,拿家里的猫试了试。如上,都是开着最大光圈大概0.5m的近摄,虚化强无敌。 明天去萤火虫场内再试试,找几个coser拍拍看看
装甲核心6打完了三个结局,理解了为啥媒体普遍对本作剧本打差评 游戏早早买了,打了一个结局跑去玩伊苏10了,然后伊苏10打完回来接着打。 我的顺序是一周目共存,二周目点火,三周目补完。 这几个结局一个比一个离谱,共存就是啥也没干让企业继续祸害卢比孔,点火就是卢比孔城市化率太高了,而补完更是重量级。 这个宇宙城市化率都有点太高了是吧? 不是哪个结局更好哪个更差,而是621来到这个星球到底干了什么? 621并不是一个只会服从命令的工具人,无论是沃尔特还是艾尔,抑或是卡拉战友瓜伊苏密西根等等等等角色,他们的情绪丰富度都仿佛是从各种机战动画里穿越过来的。 而621会受到他们的影响,改变自己一开始只是赚点钱做个手术过上常人生活的目的,去达成游戏的三个结局。 要知道这三个结局可不是谁的安排,是主角亲自去推动达成的。 但这三个结局又是那么的离谱,割裂感太强烈了。 拿我的二周目选择来举例: 我继承了沃尔特的遗志,和一直相伴的艾尔分道扬镳,与战友在卡门线上激斗,最后还要去卫星炮上与一路陪伴支援着我的艾尔做一个了断。 每一处转折点都可谓充满了立场与情感的激烈交锋,但如此荡气回肠的激斗之后迎来的结局却那么空虚。 这让我怀疑是宫崎英高写了一个世界观和剧本大纲,但是具体内容却交给了山村胜等人来填充一般,落差太大。 这些积累下来的情绪没有一个宣泄点,打完三个结局后只是感到了空虚和意难平。
【锐评】伊苏10——祖宗之法 当我第一次听说黎轨2和伊苏10是连续推出的时候,我对黎轨2的质量就没抱什么期待了。 falcom的传统就是这样,当伊苏和轨迹撞档期的时候,轨迹总是会被献祭掉。 毫不意外,黎轨2刷新了falcom的游戏剧本下限。 但伊苏10给我的感觉就是出乎意料,但也在情理之中。 JRGP化,或者说轨迹化是伊苏8代以来这个系列最显著的转变。 主要角色的出场数量越来越多,主线流程越来越长,相应的凑数的游玩内容也越来越多。 但好在每一作的亚特鲁都会彻底刷新上一作的包袱,剧本的创作自由度是很高的,不像闪轨4部曲既有空零碧珠玉在前,自己也有系列史上最庞大的叙事包袱要解开。 如同伊苏8那般出场角色众多但依然能描绘出丹娜这么出彩的角色对falcom来说估计也是超常发挥。 伊苏10的好兄弟并没有被脸谱化,但作为本作的绝对主角——卡嘉和丹娜比还是差了些。 她挺可爱的,但归根结底红发浪荡子注定不可能与她交集过多。从细微处看本作缺少足够的情感传达,从宏观来看本作剧本的格局立意又没有亮点。结果就是整体叙事体验比较平淡。 而谈到剧本,伊苏10在走了789三代轨迹化后又换了一个方向。本作出场角色依然众多,但能称为主角的就只有两个可控角色了。 或者进一步说,我们的好兄弟卡嘉就是绝对唯一的主角,毕竟红发男真的没话说。 缩减主角团这事儿对伊苏10来说其实是有好处的,起码不至于把大量笔墨和预算拿去用到一堆脸谱化的角色身上,这就给了流程关键时刻以充足的资源来深入刻画主要相关角色。 与之对应的,本作的战斗系统也进行了一波前所未有的大改。 从系列过去几作的轻度快节奏ARPG变成了相对慢下来的,以外界交互应对为主的偏硬核ARPG了。 本作的核心玩法就是精准格挡,通过积累仇恨倍率在敌人输出的间隙释放技能打出高额伤害。 以往的单人小技能在本作高难度的战斗中存在感被大大降低了,本作也没有了技能熟练度奖杯。 而被加强设计的是boss的招式,玩到中后期boss甚至会丧心病狂的连续交替释放红色攻击与红色攻击,操作强度极高非常考验反应力。 但游玩乐趣是真的很强,高难度下击败敌人的成就感也不错。 并且本作还有隐藏的韧性与明面上的护甲值设计,整体交互十分出色。 不再是系列过往那种玩家和敌人缺乏互动反应的陈旧感,系统设计是能让人明显感到在往时下流行的重视即时游玩反馈的方向靠拢。 总的来看,伊苏10这个游戏的外包装看起来非常的陈旧,但内容的改动与跨步之大确实令我感到惊喜。 尤其是这几年falcom游戏演出效果的进步速度之快,弥补了当年以闪1劳拉大战菲为代表留下的法社演出尴尬笑谈。 缺点是游戏的美术与图形技术还是太粗糙了,虽然现在互联网上jrpg老害们总是在叫嚣画面不重要,仿佛他们的声量能覆盖整个玩家群体。 但游戏图形技术与审美的重要性确实是电子游戏的一部分,也是被包含在广义游戏性之中的。 从伊苏10来看falcom的员工们对创新进取的热情并未消退,但还是被戴上了名为技术力的镣铐后才被允许起舞。 优点: 全新的战斗系统趣味十足,十分具有挑战性。 演出效果十分出色,即使画面显得那么廉价粗糙也丝毫不影响游玩时的视听享受。 缺点: 美术和画面和当今时代脱节严重。 流程注水。 可以预见的是伊苏10奠定了未来数年这个系列的发展方向,它吸收了系列过往的那些精华,又积极的从外界汲取了新鲜的设计元素。 我认为这个游戏就是falcom自伊苏8以来,他们推出的最具有诚意也是最好玩的游戏,推荐给所有不介意画面表现力的ARPG爱好者。
【AIGC】白裙少女们的旅行 这已经是这个系列的第二波了,与第一波提到的大部分技术细节是一样的:https://tieba.baidu.com/p/8442594548 这次主打旅行的主题,进行一下扩展,也就是什么人在什么地方做什么? 我脑海中浮现出来的画面是【白裙少女】在各种【风光】中走过,但一个人还是太孤独了,为了破掉这个孤独感我的选择十分简单粗暴——加人。 不仅要将旅行者增加到两人,我还要她们牵着手,强化两人的联系。 我尝试了正对镜头与背对镜头两种构图,最后发现效果都挺不错的,就都保留下来了。 画面风格刻意模仿了相机,使用3:2的画幅,保持前景的虚化效果来突出人物主体。 因为是旅行和双人主题,我增广了拍摄镜头的焦距,为了实现这个效果使用了风景相关的提示词并增加其权重。 风景相关的提示词又自动关联上了【大气透视】这个现象,使画面中远近层次被拉开了,赋予了光影与色调更加高级的质感。 最后的效果是人物的特征被略微弱化,增强了整个画面的平均观感,变得像是旅游照了。 同时白裙少女牵着手去旅行这个意象很好的表现和传达出了了我对【二次元旅行题材】画面的幻想。 我想说的是,AI这种现阶段还不怎么好用的东西也是可以成为一种表达与创作的工具的。 在我看来这些工具和儿时用来涂鸦的蜡笔没什么本质上不同。 我们都没有什么独特的技巧,工具也不是那么好用,画出来的线条也都不是很听话。 但我们都想表达些什么,并用自己拙劣的技巧来尝试一下。 至于这样拙劣的作品有没有灵魂,谁在乎呢? 最后还是老规矩:所有AI生成的内容都是无版权的,以下所有图片均可随意取用。
来简单介绍一下现在最流行的三个绘图AI吧 隔壁nai吧近期基本废了,感觉互联网上这种基础行业知识介绍的还挺少的,我来写一篇吧。 1、stable diffusion 这个是stablity ai公司制作的模型,也是世界上第一个真正意义上完全开源的基于扩散模型的绘图AI。 而novelai就是基于stable diffusion1.5进行微调后的商业发行版本,nai的出现也是互联网上彻底引爆ai绘图话题的导火索,虽然现在几乎没什么关注nai了。 stable diffusion的原始模型是这次介绍的这三个ai中性能最差的,其最后一次版本更新是在去年十二月。 但性能差也有优势,那就是其很适合在个人家用电脑上运行,在dreambooth等微调工具发布后更是直接把模型训练下放到了个人电脑级别。 由此,stable diffusion成为了目前世界上最亲民的ai绘图模型,现在互联网上大部分的ai生成图片均是由此模型及其微调版本生成。 第三方插件无数,开源社区每天都在开发各种新奇的功能。 只要你愿意研究,使用这个性能最差的模型也依然可以生成非常好的内容。 下图由基于stable diffusion1.5微调而来的Counterfeit-V3.0生成2、midjourney 由自主创业小团队开发的基于扩散模型的绘图AI,也是目前商业上最成功的图像生成AI。 其开发训练是闭源的,并且在快速推出新版本提供新功能,是目前世界上性能最好的图像生成AI。 目前midjourney最令人惊叹的是其可以使用不同的提示词生成不同风格的高质量图片,这意味其参数量十分庞大,对运行设备的性能要求极高。 目前midjourney凭借着易用,好用,且为用户提供生成图片的商用许可等特性,在商业化道路上走的十分成功。 其稳定高质量的图片甚至可以达到了商用的标准,国内外许多设计师已经开始使用midjourney辅助设计了。 3、nijijourney nijijourney是midjourney团队推出的专门针对二次元的绘图AI,可以认为是在二次元图片训练素材中进行了针对性微调的midjourney。 其绘图性能和midjourney保持一致,近期在更新v5版本后在互联网上也越来越火了,我们现在看到的许多图片也是由niji生成的。 下图由nijijourney生成最后扩展再额外介绍一个 DeepFloyd IF 由stability ai公司旗下DeepFloyd实验室开发训练,现已学术开源。 其技术特点是把text encoder从时下流行的clip换成了T5-XXL,使其拥有了gpt3级别的语义理解能力,可以用近似于聊天的方式去描述出你想要绘制的图片,并且能让这个AI准确理解你的意图。 同时此次开源的IF-4.3B模型中的unet部分也在实验室评估中也是目前所有同类型模型中表现最好的。 其绘制能力目前来看可以说十分惊人,除了可以准确的绘制出英文句子以外,还可以实现许多奇思妙想。 可以去huggingface上在线体验一下这个模型的生成性能,官方也提供一些提示词示例。 并且这个模型依然可以在个人电脑中运行,只是需要最少14gb的显存。 目前已经可以在github上获取到他们的代码。
【模型分析】关于Counterfeit-V3.0是如何被构建出来的 致力于重建nai吧的技术讨论氛围 前几天,大名鼎鼎的Counterfeit系列模型更新到了3.0,我体验过后感觉十分良好。 该模型在构成,色彩,泛用性,易用性方面都做到了相当好的地步。 唯一的缺憾是人体结构损害严重,据作者的描述是因为过于重视构图,忽视sd1.5无法绘制复杂的人体动态导致的。 接下来让我们进入到分析环节。 其制作者gsdf在早前上传的Replicant和Counterfeit-V2.0的模型卡中提到了他的模型是从采用了DreamBooth + Merge Block Weights + Merge LoRA等三种方法来制作的。 其实翻译过就是微调大模型,训练lora,根据需求进行分层合并。 这样我们就对这个模型的构建起源有一个基本概念了。 而Counterfeit的最新版本,3.0的模型卡中提到了以下几个关键技术知识点: 1、采用了BLIP2参与到打标。这一点可以有效提高模型的易用性,实际上前几天开源的IF-4.3大模型的text encoder也用来到类似的技术,它们都有用到T5-XXL。 2、优先考虑构图。即专门有意识的去微调或者训练过构图相关的模型,并融合进去。 3、合并了负值。可以理解为将一个模型在合并到基本模型中时,权重设置为负值来达成【删除一部分权重】的效果。 通过以上这些信息,我们大概能整理出模型在构建的全过程,其中每一个环节涉及到的技术详情也比较清晰的能被推测出来: 0、收集准备好一批高质量训练素材,使用BLIP2和deepbooru/wd1.4进行组合打标。 1、微调训练用于基底的,能画出我们想要的那些概念的底模,一般是照片类模型。 2、数个用于风格的,可以通过合并OUT层完成切换风格的模型,例如可以带来光影效果的,可以带来角色绘制风格的。 3、被专门用于添加额外概念的模型,例如被专门用于训练构图的模型。 4、一部分被用于负面概念的特殊模型,被用于添加负值合并。 5、通过分层合并插件,不断调试到一个令人满意的状态。 这些就是我对于这个系列模型的构建分析,如有错误欢迎指出。 通过这种推理分析,能帮助我们指明构建更加优良模型的方法,更加深入的学习sd模型的构建细节。 值得注意的是,许多模型构建者都提到了BASE层不应当进行任何融合操作,否则就容易出现较为严重的崩坏。 这其实是因为基本语义模块在融合过程中遭到严重损坏,无法准确的将训练时的概念与实际上的向量一一对应造成的。 类似于我们的合并通常会破坏VAE层,轻则导致模型绘图的色彩风格产生损坏,重则导致色彩信息大幅丢失。 在我们学习这些模型的构建过程里,尤其需要注意这些问题并做好规避。
dreambooth果然只是一个微调的工具 我在贴吧消失这么久回来一看这吧竟然已经被和ai毫无关系的一帮人占领了,属实是没想到 其实这段时间一直再研究dreambooth,我发现对这玩意儿来说太重的任务是基本没办法进行的。 或者说太重的任务通常效果较差,训练图集应该是在300张左右是比较恰当的,最终收敛结果都比较稳定。 然后所谓微调,本质上就是使模型专注于学习一小部分概念,而概念范围越小训练难度越低成品效果也越好。 batch size和Gradient Accumulation Steps最好的设置就是1,我哪怕设置成2最终效果都和1有明显差距。 学利率和学习率优化器建议就设置为1e-6和余弦系列,设置的稍微高一点细节就完全学不到,或者说学的不像。 但是归根结底最重要的还是高品质的训练图集,无论你的参数调的再完美,不如多花点时间优化训练集。 如果你打算进行任何形式的模型训练,你90%的前期时间应该花在训练集的优化上。 因为最终训练成品效果90%以上都和训练图集质量正相关。 最后是打标建议,我推荐使用blip2和wd1.4双管齐下。 blip2可以为我们的画面提供一段准确的自然语言描述,方便我们在生成画面时使用一段自然语言提示词快速定义画面的主题结构。 也就是用【什么人在什么地方干什么事】这样一句固定的话就迅速将画面选定在一定的范围内。 然后再用wd1.4打标来为画面中各个概念进行标注,反映在实际图片生成时用来补充修饰的单个提示词。 最后放一些阶段性成果,我在生成这些图片的模型中主要是想训练的概念是【甜美少女】【服装模特】【小裙子】【洛丽塔风格】。 最终效果使我较为满意,我想要的概念都被准确的还原出来了。
1 下一页