多模态的时代来临了
多模态吧
全部回复
仅看楼主
吧务
level 10
AI已经实现了多种模态相互生成,比如图文互生(通过clip获取特征,各种扩散模型如stablediffsion、dalle等)、文文互生(GPT系列、bard、文心一言等)、音文互生(语音识别和文字转语音等,并已广泛应用),目前视频和文字互生也已经出现。
也许过不了多久,AI将能够更智能的处理多种模态的任务,不仅仅限于目前的visual ChatGPT的形式,也不只是目前语音助手这类自然语言识别能力不足的形式。
多模态时代来临了。
注:以上内容不由语言模型生成
2023年03月22日 11点03分 1
吧务
level 10
GPT这样的大语言模型是AI的转折点,从前的AI大部分都是处理人在10秒内能完成多少工作,多是用来替代重复劳动。chatGPT出现后,AI已经能完成完成人在几小时内才能完成的工作。
2023年03月22日 16点03分 2
level 3
你好,能做个设计吗
2023年04月19日 15点04分 3
什么设计
2023年04月19日 16点04分
@命起涟漪💦 多模态的
2023年04月20日 04点04分
@食宵夜🍺🍺 能详细说说吗,包括哪些模态,末端任务是什么
2023年04月20日 04点04分
@命起涟漪💦 有别的方式吗?发你文档
2023年04月20日 10点04分
1