吸收AI画画全技能 视觉版ChatGPT来了
2023-03-14 11:42:25
来源: 深圳商报
|
记者对ChatGPT说:“请生成一张机器人图片。”话音刚落,图片立刻生成。这就是由MSRA资深研究人员提出的视觉版ChatGPT(Visual ChatGPT),同时,它也看得懂图,有理解能力。 OpenAI 重磅推出的聊天对话模型ChatGPT,短短几个月席卷社会各个领域。ChatGPT会的东西五花八门,现如今,Visual ChatGPT将ChatGPT和一系列可视化基础模型连接起来,以支持在聊天过程中发送和接收图像。 从头训练一个多模态模型,工作量非常大。于是,研究人员想到可以在ChatGPT的基础上,结合一些视觉模型来达到目的。而想要达到这一目的,需要一个中间站,由此他们提出了提示管理器的概念。相关报道称,提示管理器可以明确告诉ChatGPT每个视觉模型的作用,并指定好输入输出格式;转换不同的视觉信息,如将PNG图像、深度图像、掩码矩阵等转换为语言格式,方便ChatGPT理解。它能处理视觉模型的历史生成结果,以及不同模型的调用优先级、规避冲突等,让ChatGPT能够以迭代的方式接收视觉模型的生成内容,直到输出用户满意的结果。 与此同时,研究人员也提到了这项工作目前还存在一些局限性:生成结果的质量,主要取决于视觉模型的性能;使用大量的提示工程,会一定程度上影响生成结果的速度;此外,在输入图片的隐私安全上,还需要做进一步升级保护。 |
免责声明:本文内容由用户注册发布,仅代表作者或来源网站个人观点,不构成任何投资建议,不代表本网站的观点和立场,与本网站无关。本网系信息发布平台,仅提供信息存储空间服务,其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如因作品内容侵权需删除与其他问题需要同本网联系的,请尽快通过本网的邮箱或电话联系。
热门推荐
热文排行
- 1地方楼市“花式调控”凸显精细化:面向新市民与多孩家庭,因城施策挖掘有效需求
- 2 “云健身”出现“人传人” 你跟刘畊宏跳“本草纲目”了吗
- 3连云港投产国内单流程规模最大炼化一体化项目,可形成加工原油能力1600万吨/年
- 4彩虹张掖行走记:非遗传承人守艺守心 戈壁滩演“曲苑杂坛”
- 5对话A股成长力丨帝科股份董事长史卫利:12.47亿并购Solamet ,最看重的是知识产权包
- 6 “套路化”的偶像爱情电影,现实只是调味剂
- 7 饰演人民调解员,陈晓希望每个人都能“好好说话”
- 8 “天地合作”唱响大美中华,《经典咏流传》第五期“便引诗情到碧霄”
- 9服务信托落地新场景,中航信托聚焦二手房交易资金监管痛点
- 10 静悄悄的麦田里,长出一座“博物馆”

