在人工智能技术持续迭代的背景下,OpenAI 再度刷新用户体验。该公司近日宣布,ChatGPT 移动应用程序正式推出视频和屏幕共享功能,标志着多模态交互迈入全新阶段。这一由 GPT-4o 支持的 Advanced Voice 高级语音模式,为用户提供了更直观、更实用的 AI 交互方式。
据 OpenAI 研究员在直播中演示,用户只需点击聊天栏旁的语音图标,再点击左下角的视频图标,即可启动视频对话。屏幕共享功能同样简单,手机用户通过打开三级菜单选择 “Share Screen” 即可实现。这一创新功能为用户提供了多元化的应用场景,从技能学习到日常生活问题解答,乃至产品和景点介绍,都将变得更加生动和高效。
值得注意的是,OpenAI 在功能演示中展现了 AI 的卓越感知能力。研究员通过摄像头让 GPT 识别现场人员的装扮,并准确回应 “谁最像圣诞老人” “谁像驯鹿” 等趣味问题。此外,系统还可分析短信内容并提供回复建议,甚至在用户展示手冲咖啡工具时提供专业操作指导。
为增添节日气氛,OpenAI 特别推出 “限时” 圣诞老人专属语音模式,有效期持续到明年 1 月初。全球移动、网络和桌面 App 用户只需点击主界面雪花图标或在设置中启用,即可与”圣诞老人”开启对话。值得一提的是,即便用户高级语音额度已用完,首次与圣诞老人对话时系统也将重置额度。
目前,ChatGPT Plus 和 ChatGPT Pro 的付费订阅用户已可体验这一视频功能。企业和教育领域的客户则将于明年 1 月获得接入权限。这一多模态交互能力的提升,不仅丰富了 AI 助手的应用场景,也为用户提供了更加智能和人性化的交互体验。
资料来源:综合报道;图片来源:OpenAI 官方 X 平台