Apple 与加州大学研究人员合作,发布了带有自然语言指令的开源人工智能图像编辑模型 MGIE。

苹果与加州大学的研究人员合作推出了新的人工智能图像编辑模型 MGIE。 MGIE 代表 MLLM 引导图像编辑,使用多模态大语言模型 (MLLM),允许用户根据自然语言指令编辑图像。 该模型在 2024 年国际学习表示会议上的一篇论文中提出,展示了其在保持竞争性推理效率的同时改进自动指标和人工评估的能力。

February 07, 2024
4 文章