傲世皇朝资讯
OpenAI官宣开放多模态ChatGPT,能看、能听,还会说,引发热议。此前不少头部公司已经发布相关大模型产品,而OpenAI官宣开放多模态ChatGPT,让人工智能领域的竞争再起风云。
开放多模态ChatGPT
但更先进的AI也有新风险
北京时间周一晚间,人工智能领域的知名创业公司OpenAI发布题为《ChatGPT现在能看、能听、能说》的公告,宣布将在未来两周时间里向付费用户推送这项功能。
按照OpenAI的说法,用户可以拍一张冰箱的照片,然后让ChatGPT来推荐菜谱;在旅行时拍摄一张地标的照片,让Chat-GPT来讲述这处景点的有趣之处。当然,也能拍一张数学题的照片,让ChatGPT来解答。
在官方给出的例子中,给ChatGPT一张自行车的照片,问它如何把座椅调低。然后Chat-GPT表示看车的型号,有的车有快拆杆,有的是用螺栓固定,然后给出了详细的步骤。
值得关注的是,ChatGPT会说话啦!OpenAI也将语音识别、转录和音频生成功能打包,推出了AI语音聊天的功能,这项功能只适用于iOS和安卓客户端。用户可以用这项功能为家里的小孩讲睡前故事。或者家里吃着饭,突然为某个问题吵起架来,这个时候就可以把ChatGPT拍在桌面上解决争论……
OpenAI表示,新的语音技术能够仅通过几秒钟的真实语音创造出逼真的合成声音。这种功能打开了创造力的大门,也带来了新的风险,例如不法分子可能伪造公众人物进行欺诈。所以OpenAI的决策是通过“语音聊天”这样的特定用例来推出这项功能。
群雄逐鹿,市场竞争愈发激烈
大模型引发了全球不少企业参与和布局。一份报告显示,从已经发布的大模型分布来看,美国在大模型数量上居全球之首。而我国的竞争亦愈发激烈。
今年7月,华为云在开发者大会2023上发布盘古大模型3.0。华为常务董事、华为云CEO张平安表示,盘古大模型3.0是完全面向行业的大模型,包括“5+N+X”三层架构。盘古大模型不会作诗,只做事,将围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服务。
阿里云推出AI绘画新品“通义万相”。基于阿里研发的组合式生成模型Composer,通义万相提出了基于扩散模型的“组合式生成”框架,通过对配色、布局、风格等图像设计元素进行拆解和组合,提供了高度可控性和极大自由度的图像生成效果。
腾讯云宣布升级MaaS平台,将行业大模型能力应用到金融风控、同传翻译、数智人客服等新场景中。其中,金融风控大模型相比传统风控有10倍的效率提升。
8月31日凌晨,百度文心一言宣布,将率先向全社会全面开放。用户可以在应用商店下载“文心一言App”或登录“文心一言官网”体验。
9月4日晚间,科大讯飞宣布讯飞星火大模型面向全民开放,将实现通用模型对标ChatGPT3.5。
财经评论人士杨德龙分析,随着大模型等技术全面赋能,不少领域已经有成果。人工智能是互联网发展的最新阶段,也是改变工作生活方式的重要方向,我们要积极关注,但只有少数的公司才具有核心竞争力。
IPG中国首席经济学家柏文喜表示,目前国内相关企业在人工智能、大模型等领域出现了激烈的竞争,而且不少是面向用户免费开放的。一些运营商也在大模型新赛道上加速奔跑,推动大模型和AI产业的发展。这一领域的竞争会愈发激烈。 华商报记者 黄涛
来源:华商网-华商报
编辑:王蜀周秦