GPT-4的这一超常表现自然引发了许多网友的感叹。那么,以后是否可能不需要更强大的模型来解决学术问题呢?这个问题不好回答。至少目前来看,只要不受计算能力的限制,GPT-4开放给各个领域使用,无论是在法律、金融、教育、医学、财务还是作曲等领域,都能够取代并超越人类。
那么,GPT-4是如何做到在MIT考试中取得满分的呢?具体而言,这次测试是由研究团队策划的,他们准备了一个数据集,其中包含4550个问题和解决方案。这些问题和解决方案来自MIT数学系和EECS的学生所学课程的题集、期中考试和期末考试。其中涵盖了6-1:电气科学与工程;6-2:电气工程与计算机科学;6-3:计算机科学与工程;6-4:人工智能与决策;18-1:普通数学;18-2:应用数学;18-3:纯数学;18-C:数学与计算机科学。
从这个数据集中随机选择了228个问题,这些问题既不涉及图像,也不涉及已有解决方案。问题的难度分为练习、习题、期中考试、期末考试、实验和专题,并且按照答案类型进行了排序,包括编程、开放、选择题、数值、表达式和图像。这次考试不仅有GPT-4和GPT-3.5参与,还有StableVicuna-13B、LLaMA-30B和LLaMA-60B。简而言之,目前最强大的几个模型全部参加了这次考试,以确定谁的智商和能力最高。
那么考试结果如何呢?获得最高分的是GPT-4,得分率为100%;而表现最差的是Meta的LLaMA-30B,连及格线都没过,只拿到了30%的分数,可以说是学渣了。
就在几天前,Meta的首席科学家Yann LeCun还在巴黎的会议上嘲笑了CPT,吹嘘了自己的人工智能技术有多神奇,但转眼间自己却成了学渣。可见,科学家的牛逼常常是普通人难以理解的。
看到GPT-4在考试中的表现,许多网友都产生了感慨。毕竟,仅仅两年前,人工智能还在艰难地解决小学数学问题,比如“小明种了5棵柠檬树,每年每棵树产6个柠檬,10年后他一共得到了多少柠檬”。去年初,一项联合研究表示,将数学问题转化为等价的编程问题,可以让GPT-3的同门师兄弟——OpenAI的Codex掌握高等数学,达到MIT本科水平。
尽管GPT-4在这次测试中取得了高分,但仍然存在一些不为人知的黑箱问题。也就是说,这些测试的数据和答案是否包含在数据集中,同时,这些给予的提示词似乎成为了影响它在考试中得分的关键信息。
这也导致一些网友评论称,应该把这些问题交给MIT的数学和EECS学生去做,并给予他们“好的提示”,这样人类学生也能够取得100%的高分。但无论如何,人工智能在规则性知识领域超越人类,这已经是必然的趋势。
资产安全是贯穿整个人类发展历史的永恒主题。从广义上讲,人们的生存和发展权与资产安全是分不开的。换句话说,资产安全对我们在大数据时代的生存至关重要。资产安全一直是一个普遍的话题。它很重要,但最容易被我们忽视。许多投资者因忽...
为什么尽管人工智能发展速度很快,但复制类似人类的智能仍然是我们无法实现的。近年来,人工智能 (AI) 取得了惊人的进步,改变了行业,改善了日常生活,甚至在特定任务上超越了人类。尽管取得了这些进步,但创造一个能够模仿人类智...
最近,英伟达首席执行官黄仁勋表示,人类水平的人工智能(AI)可能会在未来五年内实现,而幻觉作为该领域最大的问题之一,将很容易解决。-黄仁勋在加利福尼亚州圣何塞举行的NvidiaGTC开发者大会上表达了他对通用人工智能(A...
孙正义在演讲中区分了通用人工智能(AGI)和ASI。他解释说,AGI代表人类级别的“天才”智能,比普通人聪明10倍。相比之下,ASI的智能是普通人的10,000倍,远远超过人脑的能力。值得注意的是,目前科学界尚未就AGI...