• 首   页|
  • 联系我们|
  • 快速导航

实训项目

2021级实训项目——Text-to-Image: 文本驱动的精准图像生成

来 源:   发布时间: 2024-09-03 15:19:35   点击次数: 0


项目成员:戴钰俊 万振民

项目简介:当前文本到图像生成技术备受瞩目,但市面上的文生图模型均由单一提示直接生成图像,难以精细调整空间布局,缺乏基于原始图像在特定位置进行处理的能力。我们的项目通过将Grounding DINO的精确目标检测与GLIGEN的边界框控制结合,让用户仅凭简洁文本指令,就能在特定图像区域内精准生成物体,解决了文本驱动图像生成中空间控制的难题,结合lora技术实现良好的局部编辑效果,让创意直观呈现在预期位置。