
本文由NUS Showlab领导。第一张歌曲Yiren是新加坡国立大学Showlab@nus的医生。他的研究方向是视觉产生和多模式。他在CVPR,Siggraph和Neurips等领先的国际会议上发表了许多研究结果。刘在一起成为了NUS Chongqing研究所的四年级本科生,他的研究方向是视觉上一代。该项目的套装是学校的校长Shou Zheng。不久前,最新的GPT-4O图像尚未通过编辑和编辑功能打开。吉卜力等风格产生的影响令人惊叹,还可以清楚地看到开放社区与商业压迫者之间的巨大差距,从图像造型的意义上讲。当前,开放资源扩散模型通常面临着图像到图像样式转移的锯境:增强时尚效果,细节,结构和语义缺陷静态经常被牺牲;为了保持同样的方式,风格的表达是明显的。为了解决这个问题,我们提出了OmniconSistency,该问题使用配对数据创建了GPT-4O的出色时尚一致性,该一致性在开放生态系统资源中紧密地注入了商业级别的功能。纸张标题:imnicisistency:研究 - 学习研究 - 杂货数据来自配对的样式数据项目主页:https://github.com/showlab/showlab/omnicononsistency paper链接:https://arxiv.org/abs/2505.184444444445demo链接:提出了基于DIT的通用一致性增强插件,可以准确维护输入图像的细节,语义和结构,同时保持强大的风格化。 OmniconSistency训练仅使用由GPT-4O产生的2,600对高质量图像,整个过程仅需大约500小时的GPU计算能力,这很低。什么e imanconsistension的亮点?让我们看一下这三个句子的摘要:✅解决插头和游戏的一致性之间的SEESAW问题,这与社区Lora✅轻巧,高效,出色的任何磁通量兼容,可与GPT-4O相当,与GPT-4O兼容?目前,主要制造商的AI地图业务的主要方法是将Naki Istirong Lora +插件 + Image2Image Pipeline的一致性相结合。以微调的洛拉模块样式的特定风格,它将在文本到图像(T2I)活动中获得高质量的世代。一致性模块(例如ControlNET,IP-ADAPTER,REDUX等)负责维持在图像到图像(I2i)活动中的结构,边缘或姿势等条件,从而使更大的脱皮强度可以实现更强的风格化效果。问题是,当将这两种模块组合在一起时,“ Free PLAying“需要强迫一致性模式的样式模块和“严格控制”。尤其是在I2i的工作中,风格的表达通常被削弱,并且风格的毁灭都很大。换句话说,现有方法被捕获在时尚的强度和一致性之间,并且无法达到两者的介绍方法。图像中的“护理一致性”。我们提出了一种新的,可与风格的脱钩研究方法,其中包括以下三个基本设计:✅1。绘图研究的内在性一致性:来自Omnicisistency Data Pairs的研究对现代化的研究机制,然后将其置于现有方法,然后将其置于现有图像,并置于现有方法。是原始之间的一对关系Inal图像和高度一致的时尚结果,特别是了解样式转移图像的相似性。特定过程是:通过编码在Denoise代币中获得的VAE获得的干净潜在令牌,并指导模型通过因原因的注意机制来确定配对图像之前和之后的一致性。 ✅2。两阶段共同的解耦策略的样式:稳定的将军将表达式与保持一致性与训练技术保持一致性的关键,我们在训练阶段采用了训练机制:第一阶段:样式研究:样式研究。基于22种不同的艺术风格,我们能够使用结果的时尚图为每种样式练习一个模块,并最终构建了Lora模块库的稳定样式。第二阶段:研究是相同的。在此阶段,我们所有人都采用了洛拉风格,并训练了LO的轻量级一致性在时尚之前和之后,带有配对数据的RA。我们将滚动装载机制设计到洛拉(Lora)的库,这是洛拉(Lora)动态风格及其相应培训的训练的子集。这样可以确保Pare -Same模块专注于在不学习任何特定内容内容的情况下保持样式中的结构和语义。致力于这种培训的方法在保持表达样式的能力的同时,保持了样式表达,从而大大提高了模型在许多样式场景中对概括的一致性。 ✅3。模块化体系结构设计:插件,匹配的马拉卡斯。 OmniconSistenciencentions被设计为具有非常强大的兼容性的完全模块化插头和拔出电源系统:插件lora:一致性模块专门用于条件,并使用具有LARA样式的独立“空格”,并且在两个体系结构之间没有参数冲突。因此,任何拥抱面社区风格的Lora模型都可以直接在没有改变或相关性的情况下扎根于iNaSCESTINCES。因果关注:与通量作用和先前的控制生成不同,我们将双向注意机制更改为关注原因。我们定义了一个注意力面具,该面具限制了条件令牌查询和噪声文本令牌的基本计算。该好处在Flux的Noized Text Branch中没有新的训练参数,该参数完全释放了时尚洛拉的安装站点。与EasyControl/IP-ADAPTER和其他控制信号兼容:由于一致性模块对条件的条件采用了注意力 +方法 +方法,因此其他控制方法也可以是无缝的,并且不会相互干扰。