逆天了!可识别并分析图像,史上最强大AI诞生——GPT-4发布!...
14602 0
实名

通过了实名认证的内容创造者

发布于 2023-4-28 11:56:21

您需要 登录 才可以下载或查看,没有账号?注册

x
果然能打败OpenAI的只有它自己!!如果说,前期的ChatGPT已经让你惊叹不已,那么今天轰动全网的GPT-4更能让你对Ai刮目相看,是颠覆你所有认知的程度。曾经小编一度认为Ai就是单纯没有感情的“机器”,现如今,GPT-4让人工智能充满了温度……就连OpenAI的老板Sam Altman也毫不吝啬的表示,这是迄今为止功能最强大的模型!
dc7f6d859f2d08313b9b4077d13de529.png
那么GPT-4到底强在哪里?它是如何充满温度?为什么它的出现让整个网络“波涛汹涌”?小编来告诉你最直接的答案。[micxp_wxonkey]wxv_2839659901991043073[/micxp_wxonkey]
拥有“视觉”,可以识别图像。GPT-4是一个多模态模型,可以接受图像输入,然后理解图像内容,生成相应的说明和分析。比如输入一张奇怪的充电图片。用户问这张图有什么好笑的?

937bd0645a405f5854bf30cc48ae8331.png
GPT-4可以告诉你图中具体的什么包装,具体充电头的型号,用于什么显示器等等等等,还分析出这图里面有特写镜头。像人一样能看懂图片。问下面图中与其他图片有什么不同?

GPT-4会告诉你,不同之处是一个男子在出租车上熨衣服。可以分析图标。比如输入下面这张图表。


用户让GPT-4从图标中找出格鲁吉亚和西亚的平均每日肉类消费量总和,并且按照一定的推理进行分析。
GPT-4的回答是这样的。


找出格鲁吉亚和西亚的平均每日肉类消费量总和,我们将遵循以下步骤:

1. 确定格鲁吉亚的平均每日肉类消费量。2. 确定西亚的平均每日肉类消费量。3. 添加步骤 1 和 2 中的值。
第 1 步:从提供的图表中,我们看到格鲁吉亚的平均每日肉类消费量为每人每天 79.84 克。步骤 2:从图表中我们可以看出,西亚的人均每日肉类消费量为 69.62 克/人/天。第 3 步:将第 1 步和第 2 步中的值相加。79.84 克(格鲁吉亚)+ 69.62 克(西亚)= 149.46 克因此,格鲁吉亚和西亚的平均每日肉类消费量总和为每人每天 149.46 克。如果让之前的ChatGPT解答,基本是瞎说,而现在GPT-4的解答几乎跟人类一样。如果你觉得这个问题还是太简单了,那么让它来解答一个物理题吧。


GPT-4的的解答是

1.a 我们需要表示导电体每个点的温度 T(x)以横坐标 x 为特征的 bar。我们已知 T(0)= T0 和 T(L) = Tb。对于稳态,baris 中一维热传导的热方程:d2T/dx2 = 0积分一次,我们得到:dT/dx = C1第二次积分:T(x)=Cx+C2为了确定常数 C 和 C2,我们使用边界条件:T(0) = TO,由此得出 C2 = TOT(L)=Tb,由此得出 C;=(Tb-TO)/L最后,T(x)的表达式为:T(x)=(Tb-TO)*(x/L)+TO这表示沿导电棒的线性温度分布,斜率为 (Tb - TO)/ L
甚至你把整篇论文的截图发给它,它可以按像素处理读懂论文,总之这人工智能,这次是真的顶级的智能了。

再接着问GPT-4,你对论文中哪一张图感兴趣?
GPT-4的回答是这样的。


能解释一下图2中描述的过程吗?GPT-4图2 InstructionGPT论文说明了其方法的三个步骤:1.监督微调(SFT):他们收集演示数据,其中包括贴标机书面提示和期望的输出行为。该数据用于通过监督学习微调GPT-3。2.奖励模式(RMtraining):他们收集比较数据,其中标注者对几个模型样本的输出进行排名(从最佳到最差)。该数据用于训练奖励模型。3.使用近端策略优化(PPO)的强化学习:他们使用强化学习根据奖励模型优化策略。对于从数据集采样的每个新提示,策略都会生成一个输出。奖励模型计算输出的奖励,奖励用于使用PPO算法更新策略。重复执行这三个步骤来训练InstructionGPT模型。其目的是生成更符合人类偏好并更有效地遵循指令的输出。文字输入限制提升到2.5万字的文本输入。这次提高了字数限制,将会给AI的发挥空间更大。除了直接能读懂文字,即使是上传一张手写稿文字给GPT-4,它也能“看懂”,可以立马生成网站的HTML代码!

经过官方测试表明,在各种专业领域测试和学术基准的表现和人类水平几乎一样。比如模拟律师考试GPT-4取得了10%的优异成绩。做美国的高考SAT试卷题,在阅读理解写作拿下710的高分,数学700分,简直无法无天了。

此外GPT-4还有更多“才艺”,比如能够写歌词,创意脚本,做出各种风格变化等等。

GPT-4充满“温度”
咱们对GPT-4简单了解过后,其实不难发现,光针对识别图像这一个技术,就对视力有障碍的人群非常友好,有些视觉障碍的患者只能识别文字,但是GPT-4的出现,可以更好的帮助他们来欣赏这个世界,目前该Ai已用于软件“Be My Eyes”。
在教育方面,咱们上面也举例说明了,GPT-4并不会直接告诉你学术问题的答案,而是会引导你一步步去解决问题,给你推理演算过程,方便求学者理解。不仅如此,哪怕你实在搞不懂,有任何细节问题,它都会耐心解答,直到你准确的回答“我懂了”,这样的耐心恐怕许多老师都做不到这样的程度。目前GPT-4也用于可汗学院为Khanmigo(人工智能)提供技术支持,类似于虚拟导师和课堂助手。
局限性综上所述,GPT-4的确很强大,但它并不百分百完美,它依旧存在一些局限性:它受到一系列广泛的人造“护栏”的限制,这些“护栏”旨在防止它具有攻击性。 它不会实时更新其知识。 它对英语以外的语言的掌握是有限的。 它不分析音频或视频。 它仍然会产生计算器会避免的算术错误。
除了上述着一些表面问题以外,其实GPT-4还有一个更棘手的问题,它有着独立的判断能力,可能会自主产生“幻觉”,编造事实,因此在使用语言模型输出时应谨慎,尤其是在高风险环境中,它也可能无法解决像人类这样的挑战性问题,例如在代码中引入安全问题。现在已经有很多人表示对Ai的担忧,尤其是它可以准确的识别图像,真实性极高,所以就连OpenAi官方还在提醒人们在使用GPT-4时要“小心”一些,它可能会带来一些“安全隐患”,比如信息泄露等。
训练过程与以前的GPT模型一样,GPT-4基础模型被训练为使用公开可用的数据和OpenAI许可的数据来预测文档中的下一个单词。为了使其与用户的意图保持一致,使用带有人类反馈的强化学习(RLHF)来微调模型的行为。
结论GPT-4的出现标志着OpenAI努力扩大深度学习的一个重要里程碑。虽然不完美,但它在各种学术和专业基准上表现出了人类水平的性能,使其成为一个强大的工具。OpenAI一直在努力降低风险,并建立一个可预测规模的深度学习堆栈,这对未来的人工智能系统至关重要。
end

内容主要涵盖影视特效,CG动国,前沿CG技术,作品欣賞
使用道具 <
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表