Stable Diffusint 3.5发布,本地部署详解及与Flux.1比较
• Stable Diffusion 3.5 Large:拥有 80 亿参数,这是其系列最强大的模型,能够生成分辨率达 1 百万像素的图像。• Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large 的精简版本,同样80亿参数,可以更快地生成图像,但会牺牲一些质量。• Stable Diffusion 3.5 Medium:拥有25亿
昔日开源文生图霸主Stabilty AI带着Stable Diffusion 3.5又杀回来了,SD3.5能否力压Flux重续辉煌?
在Flux横空出世并逐渐一统开源文生图江湖的情况下,我们都以为风雨飘摇的Stabilty AI完了,不料它带着新版SD3.5模型又回来了,这次SD3.5全家桶模型分Stable Diffusion 3.5 Large 和 3.5 Large Turbo ,以及稍晚于本月29日发布的SD 3.5 Medium。先不谈生成图像质量,比起Flux最大的区别就是SD3.5全系支持商用。
SD3.5模型介绍
• Stable Diffusion 3.5 Large:拥有 80 亿参数,这是其系列最强大的模型,能够生成分辨率达 1 百万像素的图像。
• Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large 的精简版本,同样80亿参数,可以更快地生成图像,但会牺牲一些质量。
• Stable Diffusion 3.5 Medium:拥有25亿参数,采用改进的 MMDiT-X 架构和训练方法。针对智能手机和笔记本电脑等边缘设备运行而优化的模型,可在消费级硬件上“开箱即用”,在质量和定制易用性之间取得平衡,能够生成分辨率从 0.25 到 2 百万像素的图像。
SD3.5模型的使用
SD3.5刚发布,Comfyui就第一时间宣布对SD3.5本地部署的支持。
SD3.5跟SD3和Flux一样,需要文本编码器支持,如果已经运行过SD3或Flux就不需要下载clip_l.safetensors、clip_g.safetensors和 t5xxl_fp16.safetensors。
下载模型文件sd3.5_large.safetensors或sd3.5_large_turbo.safetensor放在您的 ComfyUI/models/checkpoints/ 目录中。
Stable Diffusion 3.5 Large和3.5 Large Turbo使用不同的是,前者在设置中,step一般设置20以上,cfg设置5左右,而后者因为算是快速版,其默认step设置为4,cfg设置为1.2。
相同提示词下SD 3.5 Larg生成的图像质量更好,对文本生成更精准。
Mesmerizing cinematic portrait of a woman, fused with the “SD3.5 Large” logo, her hair styled in sharp, futuristic waves with hints of electric blue and glowing white streaks. The “SD3.5 Large” text is front and center, rendered in polished chrome, with holographic light trails swirling around it. The scene explodes with dynamic energy, with motion blurs, light beams, and neon effects creating an overload of visual impact. The woman stands confidently, her eyes sharp and intense, reflecting the glow of futuristic tech elements. Her surroundings are filled with abstract, high-speed light streams and swirling particles, as though she is moving through a fast-paced, futuristic world. The letters appear almost weightless, infused with glowing light and reflecting the chaos of energy that surrounds her. The overall vibe is high-tech, fast, and completely mesmerizing.
SD 3.5 Large Turbo虽然步数更少,生成速度更快一点,但是对文本内容生成不怎么好,比Large模型的生成质量稍有不足。
SD3.5 Large Turbo(step 4,cfg 1.2)
以上两个版本16G及以上显卡应该能够正常运行。另外Comfy.org同时推出了SD3.5 Large的fp8集成模型,不需要加载文本编码器模型,12G显卡即可使用。
在C站上还提前出现了以SD3.5 Medium为底座模型的轻量版本,11GB大小,8G显卡即可使用。
SD3.5与Flux.1的比较
1.SD3.5最大的优势是全系可商用。
非商业用途免费:个人和组织可以免费将该模型用于非商业用途,包括科学研究。
免费用于商业用途(年收入最高 100 万美元):初创企业、中小型企业和创作者可以免费将该模型用于商业用途,只要他们的年总收入低于 100 万美元。
输出所有权:保留所产生的媒体的所有权,不受限制性许可的影响。
2.SD3.5在参数上比Flux.1就要少一些(Flux.1 dev版是120亿参数),在Elo评分中也比Flux.1要低。从初步使用中看,质量稍有差距,SD3.5在文本生成中有了很大进步,与Flux.1相比差距已不大。
3.其次SD3.5支持对模型进行微调,而不像Flux只能用Lora来实现特定要求。
4.最后一点是SD3.5对NSFW审核较宽松,原生系列模型对上半身是完全放开的,不像Flux那样完全不能露,而且模型支持微调,所以社区的各种微调模型会很快冒出来,你懂的。
5.实测效果比较,前者是SD3.5 Large,后者是Flux.1 dev fp8。
A vast and ethereal garden is surrounded by a huge glass dome, filled with glowing plants, floating water lilies, and waterfalls. The garden is illuminated by a soft golden glow emanating from an artificial sun suspended at the top of the dome. In the center, there is a huge ancient tree with blue leaves glowing and roots extending into a clear pond.
Cinematic Film Still, two beautiful lesbian women kissing. The woman on the right has flowing blonde hair. The woman on the left has short red hair. clothed females, pale skin, french kiss, sfw, erotica, cinematic lighting. Photographed on a Sony ILCE-7M2, 155mm F/7.1 Cine lens, ISO 800, cold color temperature lighting, high resolution, Romantic
a pretty woman in the street under the rain raising a sign, the sign says “SD3.5 Large Is Great!!!”,looking at viewer.
总的来说,SD3.5对比Flux.1的生成质量是稍有差距,但是因为SD3.5更开放,短短一两天,开源社区已经涌现了各种SD3.5的微调模型以及Lora,期待文生图开源社区的百花齐放。
感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。
AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
一、AIGC所有方向的学习路线
AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、AIGC必备工具
工具都帮大家整理好了,安装就可直接上手!
三、最新AIGC学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、AIGC视频教程合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)