企业微信
悟空CRM  >   公司新闻  >  GPT-4考过MIT造假,三位教授联名「甩锅」!猪队友作弊,抢发论文

GPT-4考过MIT造假,三位教授联名「甩锅」!猪队友作弊,抢发论文

悟空软件 阅读次数:109 次浏览

CRM客户管理系统
悟空CRM是以客户为中心,围绕客户实现营销、销售、服务、分析的全流程管理,从市场线索的获取、线索识别、客户跟进、客户签约、客户持续服务的客户全生命周期管理,帮助企业高效线索获取,提升客户转化、提高客户满意度,全面赋能企业销售管理,提升销售业绩,从而为企业带来持续的利润。 悟空CRM客户管理全生命周期管理体系的建立与健全... 查看更多

论文作者「官方打假」来了!

前段时间,GPT-4通过MIT数学本科考试,甚至拿了接近满分成绩引众多网友围观。

然而,这篇论文刚发布,就被同校学生爆出「数据集」有问题,结果并不准确。

没想到,爆料一出,AI界大佬LeCun、马库斯等纷纷出来发声。

今天,来自MIT的论文作者正式给出了解释。

让人大跌眼镜的是,作者之一的Iddo Drori,竟然是在没有得到其他人允许的情况下,擅自抢发了论文。

甚至有共同作者表示,自己是在周末外出旅行后,才得知论文已经发了。

而且,Iddo据称不仅「隐瞒」了自己实际采用的方法,而且在发表前就已经被告知,论文中还有问题没有修改……

声明全文

在6月15日,Iddo Drori在arXiv上发布了一份与麻省理工学院(MIT)几十门课程考试和作业数据相关的论文。

然而他这样做并没有得到许多共同作者的同意,尽管被告知在发表之前应该纠正一些问题。而且我们当中的一些人在周末外出旅行后,在6月18日星期天才得知论文已发。

在解决这个问题的过程中,我们发现,与Iddo Drori向我们和收集数据的学生传达的相反,Iddo没有得到所有导师的许可来收集构成论文主题的作业和考试题的数据集。

当论文在社交媒体上出现,并且Iddo未经任何人许可在网上发布数据样本时,一些课程导师才了解到这个数据集的存在,以及他们的课程材料被纳入其中。

这些都是正在通过机构渠道进行处理严重的问题,因此我们没有轻率地在公开场合对此进行声明,但我们认为解释为什么这篇论文不应该被发表并且必须被撤回是很重要的。

我们已要求Iddo从arXiv上撤回论文,并直接联系了arXiv,解释了这个情况。

我们想强调的是,在这篇论文中,所有学生作者都非常努力地工作,如果数据是经过同意收集的话,这篇本来可能是非常有趣和有价值的论文。已发表的论文的许多问题并不是学生的过错。

而且,GPT-4不能获得麻省理工学院学位。

网友:怕不是甩锅吧

对于这份声明,LeCun转发点评道,「感谢澄清」。

曾指出问题的Raunak Chowdhuri,也已经把更新进行了置顶。

不过,有网友指出,这篇论文的问题并不在于有没有「同意」发表,而是在于「方法」本身。

而现在看起来是,这些作者希望自己的名字出现在这篇可能会爆火的论文上,但又不希望承担出错之后的责任。

如果论文并没有被人「打假」,那么也不会有这篇所谓的「公开声明」——迫使其中一些作者与论文割席。

显然,作为论文的共同作者,你必须对你署名的工作质量负责。

也有网友表示:「这是我一生中见过最糟的替罪羊。」

有趣的是,除了论文「造假」被人抓包之后的急忙甩锅——我虽然署名了,但这个问题和我无关。此前在顶会IJCAI 2016上也出现了原理相似的一幕——在论文被接收后,疯狂拉人。

「作者X其实参与了,只不过我们没来得及写上。」

文章地址:ijcai-16-pc.blogspot.com

就在接收名单发送后的第二天,我们发现,有人试图向他们已被接受的论文里添加额外的合作者。
我理解有时在论文提交后,可能会从同事那里得到非常重要的帮助,我们自己的研究组也偶尔这样做。但突然有50多篇论文都需要,就有些奇怪了。
更令人惊讶的是,其中有很多人发现,他们不仅有一位被遗忘的合作者,而是有「多位」(有时多达4个)被遗忘的合作者。
显然,谚语「成功有很多父母,而失败则无人问津」在这里得到了充分的体现。
不过,我们在审稿期间每周都会备份截图,所以知道所有论文的原始作者。(这也是最终在接收名单上所呈现的)。

GPT-4攻破MIT考试

GPT-4在MIT考试中开挂这个结果一经公布,吸引了众多目光。

同样的测试,GPT-3.5搞定三分之一,而GPT-4全拿下了。

这张图表,便成为论文中最亮眼的那一部分。

6月15日,由MIT、波士顿大学,以及康奈尔大学的研究团队发表最新论文,展示了GPT-4在MIT考试中的能力。

论文地址:arxiv.org/pdf/2306.0899

论文中,研究人员自制了一个数据集,其中涵盖了4550个问题和解决方案。

这些包括,MIT数学系和EECS的学生获得本科学位的课程问题集、期中考试和期末考试。

具体如下:

研究人员从数据集中随机生成228个问题,不涉及已有图像和解决方案的问题。

然后,让5个最先进的语言模型模型一起参加了这场考试:GPT-4、GPT-3.5、StableVicuna-13B、LLaMA-30B和LLaMA-60B。

最终结果发现,经过调优后的GPT-4,拿到了100%的分数。而原始版本的GPT-4,没有经过任何调优,也拿下了90%的分数。

而具体调优过程,如结果图中所示,包括Few-shot+CoT+Self-critique+Experts。

每增加一个调优环节,GPT-4的能力也就跃升一步。

而这篇研究当时有争议的地方,就在于让GPT-4给自己打分。

研究团队在数据集上,微调GPT-4,给定问题Q,基准解S,和LLM的答案A,便使用GPT-4自动对模型响应进行了评分。

GPT-4给自己打满分,确实值得怀疑。

客座教授被指「抢发」论文

Iddo Drori

 

 

Iddo Drori是波士顿大学计算机科学实践副教授,麻省理工学院的客座副教授,以及哥伦比亚大学的兼职副教授。

此前曾是麻省理工学院EECS的讲师,康奈尔大学运筹学和信息工程学的客座副教授,以及纽约大学数据科学中心、Courant研究所和NYU Tandon的研究科学家和兼职教授。

他拥有计算机科学博士学位,并在斯坦福大学统计学领域进行过博士后研究。他还拥有组织行为学和创业管理的MBA学位,并拥有十年的工业研究和领导经验。

Iddo Drori的主要研究领域是机器学习、人工智能和计算机视觉,发表了70篇论文,被引用超过5200次,教授过35门计算机科学课程。

他是剑桥大学出版社出版的教材《深度学习的科学》的作者。他在计算机视觉会议上赢得过多项竞赛,并在机器学习会议上获得过多个最佳论文奖项。

而就在刚刚,有网友敏锐地发现:「Iddo现在不仅去掉了LinkedIn主页上『麻省理工学院客座教授』的头衔,而且他的客座职位似乎即将在这个月结束。」

三位共同作者

Armando Solar-Lezama

Armando Solar-Lezama是麻省理工学院的电气工程和计算机科学(EECS)教授,同时也是计算机科学与人工智能实验室(CSAIL)的副主任兼首席运营官。

他是由美国国家科学基金会(NSF)资助的Expeditions项目「通过代码理解世界」的首席项目负责人,并且还是一个创建交互式演示文稿的在线平台——playskript的创始人。

他的研究重点是程序合成。这是一个令人兴奋的研究领域,一方面,程序合成涉及使用自动推理和学习来帮助将更多自动化引入编程过程。另一方面,代码提供了一种独特的建模机制,因此程序合成可以在构建更可预测和稳健的学习系统方面发挥重要作用。

Tonio Buonassisi

Tonio Buonassisi是麻省理工学院的机械工程教授。他的研究主要集中在太阳能光伏和技术经济分析领域,在许多公司的技术发展中发挥了重要作用,因此获得了美国总统早期科学家和工程师奖(PECASE)、美国国家科学基金会职业奖(CAREER Award)和谷歌教师奖。

在MIT,Tonio Buonassisi是可持续发展加速材料实验室的负责人,领导可持续材料开发的研究工作。他还曾担任新加坡加速材料制造计划的创始主任。此外,他还共同创办了初创公司Xinterra以及非营利性组织Fraunhofer可持续能源系统中心。

Tonio Buonassisi在教育方面展现出了极高的热情和才能。他曾荣获麻省理工学院Everett Moore Baker杰出本科教学奖,他的教学影响不仅局限于课堂,还通过其OpenCourseware/YouTube光伏讲座系列获得了超过179,000次观看。他最近还制作了一系列名为「加速材料制造」的YouTube视频,重点关注人工智能在材料研究中的应用。

Yoon Kim

Yoon Kim是麻省理工学院(EECS/CSAIL)的助理教授。之前在哈佛大学获得计算机科学博士学位,导师是Alexander Rush。

他的研究兴趣包括:大规模模型的高效训练和部署、理解大语言模型的能力和限制、用符号机制控制和增强神经网络、计算和人类语言处理之间的联系。

变了味的研究

现在,GPT-4可以说是已经被推崇成了LLM领域的全新「基准」。

这种趋势一方面在迫使研究人员将自己的工作与其进行比较,另一方面又催生了相当一部分只为跟风和炒作的研究。

不仅如此,OpenAI在GPT-4技术报告中开创的「黑盒」方法,也被其他人纷纷效仿。

在HackerNews的讨论中,一位用户表示,机器学习已经不再是一个科学领域,而是变得像社会科学一样,建立在另一种不可证伪和不可重现的研究之上。

有媒体称,这次事件无疑是在人工智能领域树立了一个糟糕的先例,让大家对研究的真实性产生了质疑——互联网上有多少论文实际上是有问题的?

随着「基准」GPT-4开始涉足文章的撰写阶段,论文的质量预计还会有进一步下降。

悟空CRM产品更多介绍:www.5kcrm.com

相关内容

外贸客户管理软件能解决企业哪些实际问题?

随着中国经济的持续发展,各种企业竞争逐渐的加剧,特别是外贸行业企业的竞争同样非常激烈。外贸行业企业在既需要成长又面临激烈竞争的情况下,就需要自己的专业外贸客户管理软件。那么外贸客户管理软件能解决企业哪些实际问题?附外贸客户管理软件解决方案。▋解决销售问题外贸客户管理软件解决企业销售方面的问题。外贸企业的主要的工作之一就是销售,可以说销售对于外贸公司来说至关重要。销售做的好的外贸企业才能够持续的成长
相关文章

有哪些免费的客户管理系统可供选择?

有哪些免费的客户管理系统可供选择?在现今竞争激烈的商业环境中,客户管理成为了企业成功的关键因素之一。通过高效的客户管理系统,企业可以更好地了解和满足客户需求,提升客户满意度并实现持续增长。然而,为了引入优秀的客户管理系统,企业通常需要付出昂贵的费用。对于小型企业或初创企业来说,这可能是一个不小的负担。然而,幸运的是,有许多免费的客户管理系统可供选择。本文将介绍几个值得考虑的免费客户管理系统,并探讨
相关文章

CRM试用指南,CRM试用的几个注意事项

CRM是客户关系管理的缩写,是一种通过IT技术手段,对客户数据进行收集、整理、分析、应用和管理,以实现客户关系的维护和发展的管理思想和方法。随着企业对于客户关系管理的需求不断增长,CRM系统也逐渐成为企业必备的工具之一。对于初次接触CRM系统的用户,试用是了解CRM系统功能和性能的重要方式。本文将介绍CRM试用的几个注意事项。附CRM试用地址。1.确定试用目的和需求在进行CRM试用之前,需要先明确
相关文章

客户营销管理系统能解决企业哪些实际问题?

随着IT技术与经济的持续发展,营销技术与模式也在持续创新。传统的市场营销技术与模式已经严重落后于时代。企业在这种情况下,就需要使用先进的客户营销管理系统来满足企业生存与发展的需求。那么客户营销管理系统能解决企业哪些实际问题?▋解决销售效率问题客户营销管理系统的使用帮助企业解决销售效率问题。传统的销售过程看似简单,实际对于销售人员是比较繁杂的,特别是一些企业新招聘的销售人员,开第一单实际甚至长达三五
相关文章

如何登录海信CRM系统?海信CRM系统的功能和特点是什么?

海信CRM系统是一款功能强大的客户关系管理软件,它为企业提供了一套完整的解决方案,帮助企业实现客户信息的管理、销售业绩的提升和市场营销的精细化。那么,如何登录海信CRM系统呢? 首先,打开浏览器,输入海信CRM系统的网址。一般来说,海信CRM系统的网址会以“https://www.5kcrm.com”开头。在浏览器的地址栏中输入该网址,并按下回车键。 接下来,会跳转到海
相关文章

营销CRM系统能解决哪些实际工作问题?

随着IT技术的高速发展与商业理念的变化,企业营销与销售工作也在快速的变化升级,也就要求企业可以跟上市场营销环境的变化,这个时候就要求企业使用营销CRM系统。那么营销CRM系统能解决哪些实际工作问题?下面从五个方面详细的介绍。▋提升效率营销CRM系统提升企业销售团队的工作效率。传统的销售方式需要销售人员使用大量的时间来进行线索的管理、客户信息的管理、销售过程的管理、合同的管理、回款的管理、回头客户的
相关文章

医疗器械销售管理系统可以解决工作中哪些实际问题?

医疗器械销售管理系统可以解决工作中哪些实际问题?对于医疗器械企业来讲,医疗器械销售工作一直都是公司核心工作之一,而好的医疗器械销售管理系统就像人使用挖掘机与使用铁锹干活一样差距巨大,可以从量到质的提升医疗器械销售的工作效率,提升企业的运营能力与销售收入等。那么医疗器械销售管理系统可以解决工作中哪些实际问题?第一,医疗器械销售管理系统解决繁杂销售管理问题。医疗器械销售看似简单,其实隐藏着繁杂的工作内
相关文章

CRM管理系统的六个主要功能

  CRM管理系统的功能有哪些?  CRM管理系统是什么?它有哪些功能呢?许多企业都在使用CRM管理系统,那么它到底是什么呢?简单来说,CRM管理系统可以帮助企业管理销售流程和客户信息,提高销售效率和客户满意度。  在没有CRM管理系统之前,客户信息的记录和分析、销售线索的分配和跟进、销售过程的规范化管理都是非常困难的。企业需要花费大量时间和人力来整理这些数据。然而,CRM管理系统的出现可以解决这
相关文章

一分钟带您了解CRM客户管理系统!

  大家好,今天我要给大家介绍一个神奇的系统,它就是我们的CRM客户管理系统!这个系统可以帮你轻松管理客户,让你在市场竞争中占据优势。  首先,我们来看看这个系统能够做些什么。它可以帮助你收集、整理和管理客户信息,包括客户基本信息、历史交易记录、沟通记录等等,让你随时随地掌握客户动态,轻松应对各种挑战。  除此之外,CRM客户管理系统还可以自动化客户沟通,让你省去繁琐的手动操作,提高工作效率。例如
相关文章

CDP与CRM的区别

  CDP与CRM的区别  说完 CDP,我们来分析一下CRM的定位和作用,还是从我个人的经历来分享,大家更容易理解。  20多年前我加入华润超市工作,参与的第一个项目就是会员系统,那时候还叫积分卡系统。那时候的积分卡系统就是记录会员姓名生日等很简单的用户信息,作用就是消费有积分,积分能换礼品。那个年代条件有多差?兑换只能一个月一次,而且是采用离线的方式进行。后来网络条件好了,可以实现在线兑换积分
相关文章
最新文章

客户营销管理系统能解决企业哪些实际问题?

随着IT技术与经济的持续发展,营销技术与模式也在持续创新。传统的市场营销技术与模式已经严重落后于时代。企业在这种情况下,就需要使用先进的客户营销管理系统来满足企业生存与发展的需求。那么客户营销管理系统能解决企业哪些实际问题?▋解决销售效率问题客户营销管理系统的使用帮助企业解决销售效率问题。传统的销售过程看似简单,实际对于销售人员是比较繁杂的,特别是一些企业新招聘的销售人员,开第一单实际甚至长达三五
最新文章

外贸客户管理软件能解决企业哪些实际问题?

随着中国经济的持续发展,各种企业竞争逐渐的加剧,特别是外贸行业企业的竞争同样非常激烈。外贸行业企业在既需要成长又面临激烈竞争的情况下,就需要自己的专业外贸客户管理软件。那么外贸客户管理软件能解决企业哪些实际问题?附外贸客户管理软件解决方案。▋解决销售问题外贸客户管理软件解决企业销售方面的问题。外贸企业的主要的工作之一就是销售,可以说销售对于外贸公司来说至关重要。销售做的好的外贸企业才能够持续的成长
最新文章

营销CRM系统能解决哪些实际工作问题?

随着IT技术的高速发展与商业理念的变化,企业营销与销售工作也在快速的变化升级,也就要求企业可以跟上市场营销环境的变化,这个时候就要求企业使用营销CRM系统。那么营销CRM系统能解决哪些实际工作问题?下面从五个方面详细的介绍。▋提升效率营销CRM系统提升企业销售团队的工作效率。传统的销售方式需要销售人员使用大量的时间来进行线索的管理、客户信息的管理、销售过程的管理、合同的管理、回款的管理、回头客户的
最新文章

快速注册,立即使用

仅需一分钟,立即注册悟空云。悟空CRM免费试用。