字节跳动旗下 AI 助手豆包日前上线了图片理解功能,在电脑端或 App 端上传图片后即可识别图片内容。
据了解,豆包的“图片理解”功能可识别图片中包含的元素和基本特征。用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。好奇这个功能具体表现如何,那就继续往下看。
AI 理解图片
我们尝试让豆包识别玻璃瓶可口可乐、一张风景照和两张影视作品剧照,结果如下:
在 PC 端上传图片后,对话框内会自动显示“解释这张图片”快捷按钮。可口可乐照片、风景照的解读令人满意。
“牛魔王”识别这次结果可用,但并不是期待中的那样
而在询问剧照出处时,第一次在 PC 端尝试,豆包并没有给出有用答案;第二次在 App 端得到了反馈,但结果错误。这张其实是《重启人生》的剧照。
第一次尝试
第二次尝试
最后,我们通过豆包拍照功能拍摄了一个机器人手办,其识别表现尚可。
总结
不断增加新 AI 能力,对 AI 助理产品来说终归是好事。此次豆包新加入的图片解读能力,总体来说表现中规中矩,有时候会出现没法给出答案的情况。希望字节跳动继续优化相关功能,让未来的 AI 能力变得更可靠。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有