时间: 2025-01-29 17:23:30 | 作者: 特种活性剂
第二届国际科学智能大赛总决赛及颁奖典礼于2024年11月10-11日在上海满意举行。作为科学智能(AI for Science)范畴的全球前沿赛事,本次大赛树立逻辑推理、社会科学、生命科学、物质科学、地球科学等五大赛道,并配有百万奖金池,招引了来自全球24个国家和地区的1085个安排的12687人报名参赛,旨在构建科学智能生态,激起科学智能开展新动能。
复旦大学党委书记裘新和中国科学院院士、北京科学智能研讨院理事长、北京大学国际机器学习研讨中心主任鄂维南上台,为五大赛道的总决赛冠军团队颁布一等奖奖杯与获奖证书。
来自中国科学院上海药物研讨所的博士研讨生张玮从2603支部队中锋芒毕露,取得物质科学赛道冠军(第一名),团队指导老师是来自于中国科学院上海药物研讨所的郑明月研讨员。
来自中国科学院上海药物研讨所的博士研讨生张玮作为一等奖获奖选手代表讲话:“感谢主办方举行国际科学智能大赛,AI for Science的赛题很有意思也很有含义。在比赛进程中,咱们不断学习并测验不同的办法,有的办法功能一般,也有的功能较好。正如有位统计学家说过‘一切的模型都是错的,但有的是有用的’,期望在这类AI4S比赛的推进下,能诞生渐渐的变多有用的模型。也很等待下一年的赛题,届时会鼓舞师弟师妹积极参加,感受一下产学研问题和科研课题的差异。”
科研人员和工业界致力于开发新的催化组成办法,遍及寻求的方针是以高产率获取方针产品,即开发高活性的催化反响系统,以进步原子经济性,削减资源糟蹋和环境污染。但是,高活性催化反响系统的开发常常要对催化剂和溶剂等多种反响条件进行翔实探究,这使得其成为一项时刻和资源耗费极大的使命。现在,反响条件的挑选大多依赖于经历判别和偶尔发现,使得催化反响条件的优化进程既费时又吃力,这严峻约束了新的高效催化组成战略的开展。
经过运用前史催化反响数据,并结合AI技能,可以猜测新催化反响的产率,然后有效地协助科研人员和工业界加速高活性反响条件的挑选速度,削减资源与人力的耗费,促进新物质的发明与组成。
上海药物所zw团队别离测验了干流的深度学习模型和机器学习模型来对反响产率猜测问题进行建模,发现运用言语模型和图神经网络来编码反响在该使命上的体现远远不如Baseline的机器学习模型,便将重心转移到机器学习模型上。经过多轮特征挑选,运用Optuna搜参对LightGBM模型调优,得到了功能较强的猜测模型。再经过清洗和整合开源反响数据集,并结合检索增强猜测战略,进一步大幅度进步猜测功能。
大赛物质科学赛道评委、复旦大学人工智能立异与工业研讨院研讨员徐盈辉对张玮选手的计划形象十分深入:“因为催化反响数据一般伴随着较大的噪声和要害反响条件信息的缺失,这增加了赛题的难度。尽管如此,选手们经过立异的办法应对这些应战,比方物质科学赛道第一名部队zw在催化反响产率猜测使命中,立异地运用了检索增强猜测,经过评价当时检索的反响与现在练习会集数据的相似性,来断定运用模型猜测值或许数据检索值作为终究的猜测成果,然后在这个比赛中取得了优异的成果。”
数据来历杂、质量不齐会导致很难诞生通用的产率猜测模型,针对某类反响搜集高通量试验数据并调集核算迭代调优往往会具有更加好的猜测才能。但是,“开卷有益”,“以史为鉴”,咱们是不是可以经过文本发掘或多模态发掘和树立更大、更全、更规范化的反响数据集供于检索和练习,打破商业公司对反响数据的独占,让AI在化学范畴也可以有满足的数据来完成“scaling law”,无疑是未来值得深究的。让智能化学反响,应时而兴,因时而进。
称谢:感谢赛事举行方上海科学智能研讨院、复旦大学、阿里云天池等赛方安排的科学智能大赛,感谢中国银行上海分行的鼎力支持。