搜狐科技第138期《思想大爆炸——对话科学家》专栏对话西湖大学工学院终身教授张跃。嘉宾简介:张跃是西湖大学工程学院终身教授,曾任新加坡科技设计大学助理教授。主要研究领域为自然语言处理、文本挖掘、机器学习和人工智能。要点: 1、最关键的深度科学家因素是贝叶斯优化问题和以学术经验为指导的试错问题。 2、如果人类和机器共同加速科学研究的发展,而不用担心出版范式的滞后,那么科研成果的复制性就会大大提高,就不会有造假的问题。 3.人工智能研究本身和人工智能安全研究必须齐头并进,人工智能可以被控制。 4、未来我们希望把各个学科的科学家变成计算机科学家,真正帮助人们设计新材料、发明新物质、解决更多挑战。由SOHU技术作者创建|周金童编辑|杨进随着人工智能的快速发展,西湖大学再次成为人们关注的焦点。近日,张跃教授团队开发出一款AI科学系统——DeepScientist,引起了网友的关注。 DeepScientist是首个具备完整科研能力、无需人工干预、以目标为导向、不断迭代、逐步超越人类研究人员最先进研究成果的人工智能科学系统。这是首次独立产生的研究成果超越了许多科学著作中的最佳方法(State of the Art,SOTA)。展开全文
DeepScientist 的工作流程是什么?世界卫生大会限制是否已被克服? AI科学家的出现会改变科学研究的范式吗?带着这些问题,搜狐采访了西湖大学工学院终身教授张跃,听他分享了Deepscientist从研发到落地的故事。
中国第一位人工智能科学家
《深度科学家》的命名是翁逸轩的作品,为第一作者文章。起初,他想将其称为 Deep Researcher,但因 Open AI 开发的搜索智能而得名,于是就成了 DeepScientist。
谈及研究初衷,张跃表示:“我们开发DeepScientist的真正目标是打造一个具有独立科研能力的大规模科研代理,因为人们在研究过程中面临很多挑战,而科学家的精力又有限。如果大规模模型能够帮助人们解决这些挑战,就能促进科学发展。”进步。”
过去一两年,张跃团队在深度科学家探索上取得了里程碑式的进展。
在AI文本检测工作中,DeepScientist在两周内实现并验证了1000多个不同的假设,其发展相当于人类三年的发展。它设计的方法实现了 7.9% 的性能提升,成功超越了现有的 SOTA 解决方案。而DeepScientist还在智能体容错、LLM识别加速等任务上实现了新的SOTA,同样可以在短短几周内超越人类表现。
人类的科学研究很大程度上是一个反复试验的过程。成功和失败的经验以及现有的知识是科学家发明和创造的基础之一。另一个基础是迭代试错并根据实验结果调整计划的能力。这也是张越的起点。致力于设计DeepScientist。人工智能的科学概念于去年6月正式提出。日本Sakana AI公司率先推出AI科学代理系统,张跃实验室也在同时进行相关研究。
“2023年4月开启AI推出CHATGPT-4之后,我们都在思考同一个问题:当AI具备一定程度的智能(解决新问题的能力)时,是否能够帮助人们加速科学研究的发展?所以从去年6月开始,AI科学家的概念和系统原型在全球不断推出,我们也做出了很多基础性的贡献。”张越说道。
第一篇正式发表的AI Scientist文章是张跃团队今年4月推出的Cycleresearcher,该文章也得到了DeepScientist的支持。当时他们还推出了Deepreviewer,全球首个人类实验大规模自动化审稿模型ert 级别。科学家写完论文后,可以回去根据审稿意见进行改进。
然而,Cycle Researcher是一个单线的科研系统,并不能真正解决人类的挑战。它只有写学术论文的能力。这样的科学家无法产生真正改变人们生活的科学成果。
到DeepScientist发布时,它已经实现了迭代开发。它可以夜以继日地进行科学研究,真正改变人们的生活,达到人类探索从未达到的科学高度。这里最关键的因素是学术经验指导下的pr贝叶斯优化问题和试错问题,这也是“里程碑”的重要性。
回到贝叶斯优化过程,张跃也解释道:“首先我们要设定一个目标。比如我们研究的是AI算法,那么我们希望算法达到什么水平的准确度,然后将其分为两个方面。”
首先是思考现有基于科学知识和文献的方法的缺点,这是由理论驱动的。另一个驱动因素是经验性的。编写代码并运行看看实际效果。它需要一些测试基准,可以将其视为实验数据,然后算法根据实验数据得到运行结果。结果是dapand也可以测试。检查其准确性后,可以进一步指导试错过程。这样,DeepScientist就能够从大量的想法和尝试中总结并逐步探索。
张悦说,整个过程有不同的层次。比如顶部有一些技术路线的指南,稍后会分享指南。细分意味着这条技术路线会有不同的设定,而每一个设定都会有不同的结果。基于此试验和错误反馈ck,需要返回顶层检查一下技术路线是否需要调整。
“打个比方,就像发明一个灯泡,你要尝试不同的材料,根据试错的结果,你必须进行一些理论分析,以指导下一步的试错。”张越举了一个例子。
使用 AI 撰写论文、审稿和进行实验
在张跃看来,DeepScientist的出现必将提供一种新的出版范式和科学研究范式。
“当我在学校会议上发表第一篇顶级论文时,整个会议只有一百篇论文。现在同一个会议已经有一万多篇论文了。科研速度很快,论文数量增加了100倍。我们看Arxiv上的文章,但开会时间往往比科研成果要九个月甚至更多。”
此外,张跃还表示,目前合作由于投稿量巨大且经验丰富的审稿人超负荷,推理评估系统已接近崩溃。每个作者都需要审稿,但作者的认真程度和专业知识各不相同,导致论文质量明显下降。
AI科学家的出现将进一步提高学术创新的速度,更多的技术将拥有人,因此未来的出版范式将发生变化,学术会议可能不再需要。
“我们实验室推出了新平台Airaxiv,既接受ARXIV文章,也接受AI撰写的文章,然后利用AI审稿人自动审稿,打分文章质量,并做出个性化算法推荐。等待在学术会议上发表。”张跃说。科学研究的范式也将发生变化。如果每个实验室都使用人工智能来帮助进行实验和撰写论文,科学家们就可以将软件工程和论文的负担交给AI,彻底解放了他们的双手。而且,科学家还可以帮助AI进一步提高科学效率。毕竟,目前的大型模型中还没有科学家的观点。大型模型可以尝试犯错 100 次才能得到三个阳性结果,但在科学家的指导下,它们可能只需要尝试犯错 10 次。
在张跃看来,如果人类和机器共同加速科学研究的进展,而不用担心出版范式的滞后,每个实验室都会根据所见即所得来生产文章,并且科学研究的再现性可以在公众面前得到提高,因为不存在故意造假的问题。
三是出版物差异化。很快每个人都会立即获得最相关的文章。未来的学术会议中,AI将自动聚集最顶尖的科学家相关利益进入一个团体。科学家可以随时召开20-100人的会议,以最高效的线上线下方式交流科研成果。
张跃认为,这是未来将会发生的范式转变。下个月,世界首届科学会议将在北京召开。他们邀请了国内外最相关的科研人员参加小型讨论。
“会议主席由一人控制,但全球愿意参加的学者可以通过我们的AI科学家系统进行研究,并自动生成论文提交会议,然后接受AI评审。我们也将拭目以待,看看整个AI科学家大会对新的学术范式和新兴领域产生什么影响。”张越说道。
全学科人工智能科学家
然而,不少网友担心,一个不需要人工智能的系统人为干预可能会导致研究方向失控或误入歧途。
对此,张跃表示:“人工智能安全问题一直是我们重视的一个问题,所以公开了,我们也采取了谨慎的态度。”
第一批公开接口仅通过人工智能科学会议公开,每位想要使用它们的科学家必须提交书面申请。张跃团队将从众多申请者中挑选出少数最具挑战性和伦理性的研究课题,然后进行协作实验。他们还将拥有道德测试工具。
“比如我们实验室有一个AI生成的论文自动检测系统,可以准确检测一篇论文是否是AI生成的。我们也有第一个大型的AI审稿人模型。后来我们还做了安全的AI审稿人,防止审稿人被恶意用户欺骗,保证评审的可靠””张越举了一个例子。
在他看来,人工智能研究本身和人工智能安全研究应该齐头并进,张跃坚信人工智能是可以控制的。
“作为一名AI语言模型学者,我们对语言模型的工作机制有比较深入的了解,所以我对于驾驭AI抱有比较积极的态度。我也鼓励同学们尽早、多使用AI工具,毕竟未来的人一定要和AI一起工作。”
“AI已经取代了超过50%的程序员,但是仍然需要最好的程序员来控制AI来构建一个好的系统。只有我们使用它之后,AI才能真正理解你并写出你想要的东西。如果你完全依赖AI,你就做不到,而且我们也可以看到论文是不是AI写的。”张越笑着说道。
世界上也有几个团队正在尝试与人工智能科学家一起进行研究。在张跃看来,我国走在世界前列。
目前,查ng Yue的团队正在做两方面的工作。一是让它变得更聪明,洞察力更深,推理能力更强,这样就能少试错,得到积极结果,提高科研效率。二是从计算机科学家扩展到一般学科的科学家,解决生物学、物理、化学等学科的问题。
“我们团队在这些问题上也做出了尝试。与一般科目一样,数据不是存储在计算机上,而是通过实验获得。经过一年的开发,我们创建了航空学平台,它可以让每个实验室以最方便的形式存储实验数据。它上传到云端,最近在全球范围内推出。”
张悦的团队还加入了一些巧思和设计,让教育工作者能够与AI沟通,告诉AI它在做什么实验。学生还可以通过拍照和快速将他们正在进行的实验数字化说。
“我们相信,当我们获得足够的实验学科数据时,我们就能造就今天各个学科的科学家,真正帮助人们设计新材料、发明新物质、解决更多问题、促进社会发展。”张跃说。返回搜狐查看更多