效果与GPT 4O相当!腾讯Hunyuan开源特征自定义图像
时间:2025-04-21 09:24 作者:365bet网页版

Kuai Technology于4月18日报道,Tencent Hunyuan宣布了Instantcharacter Image -Lostomizatization Generator的开源,并与文学和传记的开源源头兼容。在大型模型中,使用此插件,您只需要一个图片和一个句子就可以在所需的姿势中出现任何字符。据报道,Instantcharacter的优势在于,这将确保角色在各种场景,高质量的照片和准确性中的一致性和真实性,并且还具有灵活的文本编辑。用户可以在必要时轻松切换任何场景,以允许字符生成任何动作。因此,内容创建者可以使用此插件来维护生成的角色非常一致,并且可以创建可更好地满足其需求的视觉作品,这些作品可用于漫画和电影创作等场景。输入以下原始图片: +提示:一只兔子在厨房里拿着勺子喝酒汤,您可以获得以下图片: +提示:城市兔子,赛博朋克,您可以得到:在实际审查中,开放式速观资源的影响与GPT 4O等领导行业相媲美。 Tencent Hunyuan说,现有的基于研究的方法主要取决于U-NET体系结构,但是一般能力和图像质量的能力存在局限性,而基于优化的技术需要适当维修特定主题,这不可避免地减少文本控制。为了解决这个问题,InstantCharacter已使用DIT模型构建了创新框架。该图使用许多变压器编码器引入了扩展的适配器,该适配器可以有效地处理角色域特征并与现代扩散变压器的潜在空间无缝相互作用。该设计使系统可以轻松调整不同的字符功能。 [本文的结尾]如果您需要打印,请确保指示来源:kuai技术Ology编辑:Shiqi