前往GPT
Bing 可以读取图片!从一张图开始,所有的要求都满足了。这一波,GPT-4要输了。
什么,微软的Bing可以识别图片?或者它领先于ChatGPT?
与一开始只画饼不落地的GPT-4预览版相比,这次Bing抢了风头。
一些Reddit 用户发现,Bing 界面上突然出现了上传图片的选项。
据说上传图片后,Bing 可以做任何事情。
无论是编程写代码,还是做题画图,甚至是看病,都轻而易举。
(不过好像还在小范围测试,比如小编还没有体验过)
看表情包大量网友发现这个功能后,第一个测试的肯定是各种表情包。
将模因输入必应,看看它是否能找出笑话在哪里。
例如,在下图中,一名男子正在出租车的后座熨烫衣服,而汽车仍在行驶。
根据Bing 的说法,这张照片中有太多不寻常的部分。一来在出租车里熨衣服很离谱,二来是不是暗示男人穿的衣服和出租车一样?还是某种巧合?
第三,熨衣板固定在出租车上,存在不稳定的风险。结果男人熨的衣服是蓝色的,和黄色形成鲜明对比,这是不是在暗示什么?
可以看到,Bing尽可能地捕捉到了图片中的所有细节,甚至分析的也相当合理。
在漫画《为什么要给神经网络添加层?在下图中,Bing 也给出了自己的分析。
漫画夸大了统计学习和神经网络之间的差异,通过对比前者使用的严肃和技术语言与后者的直接建议形成幽默的并置。
总的来说,这部漫画借鉴了与机器学习的两种方法相关的刻板印象和普遍看法,突出了统计学习和神经网络之间的差异。
当然,在GPT-4 的预览版中也显示了相同的图像。
GPT-4 一针见血,这部漫画讽刺了统计学习和神经网络在提高模型性能的方法上的差异。
但在另一组图表中,Bing 似乎并没有说到重点。
Bing也装模作样的分析了一下,说可能是连接器和包装的对比?也可能是插头的底面看起来像一张脸。
他还分析了三幅图是什么,再找词,却没提梗在哪。
但是,如果让Bing做一些客观的分析,比如识别线材品牌,结果还是很准确的。
相比之下,GPT-4在分析以下一组表情包时可以立即做出反应——
图中的“Lighting充电线”,看起来像是一个大而过时的VGA接口,插在这个小巧现代的智能手机上,对比强烈。
写代码的时候,GPT-4在画蛋糕的时候,最让人惊叹的是它超强的代码理解能力。
演示中,Greg Brockman直接在纸上画了草图,拍了一张照片,发给GPT-4,说,按照这个布局给我写网页代码,然后写出来。
这位小哥还让Bing试试看能不能用同样的笑话做一个网站。
最后的效果看起来真的不错。虽然界面看起来不是很漂亮,但是该有的都有。
程序代码如下:
然后,小哥让必应继续完善代码,做出相应的网页。
Bing 说当然可以,只需微调代码即可。但指出JavaScript不是一种编译型语言,而是一种解释型语言。
所以你不需要编译器,你只需要一个浏览器或者一个JavaScript 引擎。
经过友情科普,冰也圆满完成了任务。
下面这个当医生的用例就更厉害了。
小哥直接拍了一张红了的胳膊,问冰有什么病。
冰直接判断为瘀伤,皮下血管破裂。
甚至有许多方法可以缓解症状:
最初24 小时内冰敷以消肿消炎。
24小时后加热,促进血液循环,消除淤血。
将瘀伤部位抬高至高于心脏,可降低血压和血液淤积。
服用非处方止痛药。
多吃富含维生素C、维生素K、锌、菠萝蛋白酶的食物,加速伤口愈合和胶原蛋白合成。
涂上软膏以减轻瘀伤和炎症肿胀。
还是蛮专业的。
也有师兄发了一张组织剖面图让必应破解。
冰不仅认出了图片的内容,还详细解释了什么叫组织,什么叫截面。
它甚至解释了何时使用组织的横截面视图。
然后小哥就问了,你觉得组织的面向是什么?
据冰分析,这是一块肌肉组织的横截面。
甚至,冰非常严谨地指出,他不能仅凭一张图片来判断一个人是否健康。
也有网友苦苦的化身大学生,让阿冰当个好老师,把图片里的东西告诉他。
冰说,认真听老师讲(删),这就是肾,它有四个主要功能,就是啦啦啦啦……
好家伙,以后这种整理总结的学习任务,直接丢给AI就完事了。人工智能永远不会失去耐心。
甚至有人直接给冰出了细胞减数分裂的问题。
据Bing 介绍,上传的图像是减数分裂的示意图,即从一个二倍体细胞分裂成四个单倍体细胞。
然后解释了减数分裂的过程和意义。
有时和
不太灵光当然,Bing 的识图功能目前还有不少改进的空间。
比如,小哥问图中 A 框里有几个 ×(根据图例,A.trifida 就是 ×)。
人眼一看是 11 个,可怎么 Bing 说的不对呢。
Bing 说总共有 9 个,A 框里 5 个 X,B 框里 4 个○,加起来一共 9 个。
说好的 A 框,说好的 X 呢!怎么又○又 B 框的。
再比如,这张《任天堂大乱斗》的游戏角色图中,Bing 只认出了其中的 7 个角色。
然后,小哥又问一个国际象棋的问题:「在这个开局里,白棋接下来该怎么走?」
但 Bing 一上来就回答错了:「现在轮到黑棋走,至于白棋怎么走,取决于黑棋……」
网友赶紧更正称,不对,你先看清棋子的位置,然后我再说一遍,现在是轮到白棋走。
然而,Bing 这次依然没有回答正确 —— 在给出的位置中,有好几处实际上都没有棋子……
能看出来,Bing 新添的识图功能性能倒是挺强大。
开局一张图,后面全靠强大的生成能力发挥。
事实性的识别和生成感觉问题不大,就是不知道未来有点文化隐喻的那一趴能不能做到更好。
参考资料:
https://www.timesnownews.com/technology-science/snap-and-ask-microsofts-bing-chatbot-now-accepts-picture-prompts-article-100900618
本文来自微信公众号:新智元 (ID:AI_era)
本文由网络整理发布,不代表东辰网立场,转载联系作者并注明出处:https://www.ktwxcd.com/sszx/253265.html