首页 > 互联网 > 正文

AI“看图说话”根据图片反推prompt

2023-04-11 09:57:10来源:人民邮电报  


(资料图片仅供参考)

微软必应上线AI绘图功能,Midjourney“创作”的《一对坐在屋顶的90年代的中国情侣》画作火遍社交网络,百度“文心一言”画成语、画菜名的魔性画风引发热议……近日,各种生成式AI产品层出不穷,AI作画屡见不鲜。AI绘图能够根据用户输入的文字描述,生成与之匹配的图像,凭借“低门槛”、易操作的优势,成功吸引了广大网友的注意力。

既然AI绘图已不是新鲜事,那么很多人或者说大部分人不能借AI之力绘出神作的“门槛”是什么?答案是prompt(提示)。

去年在美国科罗拉多州艺术博览会上摘得金奖的AI画作《太空歌剧院》,其创作者曾明确表示拒绝分享自己在Midjourney作图过程中所用的提示。据了解,获奖画作的创作过程耗时80多个小时,经过近900次迭代才得到最终呈现。

正因如此,人工智能生成内容(AIGC)产业衍生出了一种专门的职业——提示工程师。

从AI作画来说,优秀的提示工程师和普通用户之间存在着明显的差距。拥有多学科背景、掌握艺术史和平面设计等专业知识,才能写出诸如“用35毫米胶片拍摄”“米拉之家的拱顶”“阿尔丰斯·穆夏风格”等专业级prompt作为AI绘图输入。

近日AI绘图神器Midjourney发布的“/describe”命令,或许能够弥合普通用户和prompt工程师之间的差距。简单来说,新功能可根据用户上传的图片去“反推”提示,将图像转换成相应的文字描述。据了解,目前Midjourney能够根据图片提供4个版本的文字描述,为用户提供创作灵感,基于提示“草稿”来按需调整描述,进而生成自己想要的画作。

标签:

相关阅读

相关词

推荐阅读