将以线下与线上结合的形式召开,线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野,汇聚年度杰出工作研究者,交流新思想,探讨新思路,引领新前沿。目前已正式开放报名渠道。
每年的智源大会AI系统论坛都是一场技术的盛会,吸引了全球在AI系统领域最受瞩目的技术创新者和高影响力成果的负责人参与。随着大模型对算法、算力和数据需求的持续快速攀升,以及多元化芯片架构的不断涌现,AI系统技术面临前所未有的挑战,全栈技术也因此受到广泛关注。
今年的论坛将聚焦于AI系统的全栈创新,涵盖算子及AI编译器、并行框架优化、超大规模AI集群网络架构优化等关键领域。同时,我们将深入探讨在不同芯九游娱乐 九游娱乐官方片架构下的AI加速技术。通过这次论坛,我们希望集结顶尖智慧,共同推进AI系统技术的突破与发展,引领未来科技的变革。
林咏华,智源研究院副院长兼总工程师林咏华现任北京智源人工智能研究院副院长兼总工程师, 主管大模型研究中心、人工智能系统及基础软件研究、产业生态合作等重要方向。IEEE女工程师亚太区领导组成员,IEEE女工程师协会北京分会的创始人。曾任IBM中国研究院院长,同时也是IBM全球杰出工程师,在IBM内部引领全球人工智能系统的创新。从事近20年的系统架构、云计算、AI系统, 计算机视觉等领域的研究。本人有超过50个全球专利,并多次获得ACM/IEEE最佳论文奖。获评2019年福布斯中国50位科技领导女性。
袁进辉,2003年于西安电子科技大学(Xidian University)计算机专业获得学士学位,2008年于清华大学计算机系获得工学博士学位,清华大学优秀博士学位论文奖获得者,2008~2011年在清华博士后期间开展计算神经科学方面的研究,2013~2016年他任微软亚洲研究院主管研究员(Lead Researcher),负责研发大规模机器学习系统LightLDA并服务于微软产品。2016年~2023年,他发起和主导研发了开源深度学习框架OneFlow,在分布式深度学习系统编程易用性和高效性方向设计了一系列新方法,并为工业界广泛采用。目前他的研究领域为AI Infrastructure,致力于通过算法、系统、硬件协同设计研发大模型推理加速引擎,降低大模型应用成本和开发门槛。
负责AI算子库和编译器,加入智源之前曾在百度飞桨、西门子中国研究院、中科院深圳先进技术研究院、H2O和Teradata工作过,研究兴趣包括深度学习框架、并行编程与编译器、分布式数据库与机器学习系统,博士毕业于University of Rochester计算机科学专业。
赵捷本科毕业于清华大学计算机科学与技术系,并于2019年在法国巴黎高等师范学习和INRIA共同领导下的PARKAS实验室获得博士学位。他目前担任湖南大学信息科学工程学院教授,主要研究方向包括张量编译器、基于多面体模型的代码生成与优化以及基础数学函数库等,他也是华为MindSpore社区技术专家组成员,与华为2012实验室团队合作开发了AKG张量编译器。赵捷博士以第一作者身份在系统软件、体系结构和编译器领域的顶级会议和期刊上发表了多篇文章,包括ASE、CC、MICRO、MLSys、OSDI、PACT、PLDI、PPoPP等,2020年发表在MICRO-53会议上的论文获最佳论文提名。
敖玉龙,现北京智源人工智能研究院AI框架研发负责人,北京大学博士后,中国科学院博士,长期从事高性能计算、科学计算与人工智能等分布式系统与程序优化相关研究,曾任职于华为主任工程师和百度资深工程师,参与研制了相关大模型,有丰富大模型分布式系统产业研发与实践经验,于2016年共同获得美国计算机学会“戈登•贝尔”奖,在SC、IPDPS、ICPP、TPDS、TACO、Cluster、JCST等国际顶级会议与期刊发表论文10多篇,参与研制了IEEE 2941.1-2022国际算子接口标准,并获得多项国内专利和国际专利授权。
李士刚,北京邮电大学,计算机学院(国家示范性软件学院),“拔尖人才”教授,博士生导师,CCF、ACM及IEEE高级会员,获评CCF高性能计算“卓越青年”,入选国家高层次青年人才计划。深耕并行与分布式计算、异构计算、深度学习系统领域,主持国家级科研项目及课题多项,在SC、PPoPP、ICS、TPDS、NSDI等重要会议及期刊上发表论文60余篇,解决或缓解深度学习系统及大规模并行算法等高效并行可扩展难、通信瓶颈、计算瓶颈等关键问题。多次获得顶级学术会议最佳论文提名奖(SC、PPoPP等), 获MLSys21杰出论文奖,SC22最佳结果复现奖,CACM Research Highlights奖。担任SC、PPoPP等权威会议TPC委员40余次,ICS18研讨会主席,IISWC20出版主席,PPoPP23宣传主席,HPC China23 TPC Track主席,Cluster Computing编委, CCF THPC青年编委。
谢涛,北京大学讲席教授,北京大学计算机学院软件科学与工程系主任,高可信软件技术教育部重点实验室副主任。曾任美国UIUC计算机系正教授。当选欧洲科学院外籍院士、ACM/IEEE/AAAS/CCF会士。担任中国计算机学会系统软件专委会主任、RISC-V+AI算力生态(RACE)委员会主席、RISC-V国际基金会人工智能与机器学习技术专委会(AI/ML SIG)主席。
翟季冬,清华大学计算机系长聘教授,博士生导师。国家杰出青年科学基金获得者,国家重点研发计划项目负责人。清华大学计算机系高性能所副所长。CCF高性能计算专委副主任、CCF杰出会员、ACM中国高性能计算专家委员会秘书长。主要研究领域包括并行计算、编程模型与编译优化。在并行计算与系统领域顶级会议和期刊发表论文100余篇,出版专著1部。研究成果获IEEE TPDS 2021最佳论文奖、IEEE CLUSTER 2021最佳论文奖、ACM ICS 2021最佳学生论文奖等。担任NPC 2018程序委员会主席、IEEE CLUSTER 2021领域主席,IEEE Transactions on Computers等多个国际学术期刊编委。担任清华大学学生超算团队教练,指导的团队十三次获得世界冠军。获教育部科技进步一等奖、中国计算机学会自然科学一等奖、CCF-IEEE CS青年科学家奖。
9、 网络驱动的大规模 AI训练-阿里云可预期网络 HPN7.0 数据中心架构
报告简介:AI 训练场景(特别是大模型训练)算力扩展的核心是大规模、高性能的数据中心网络集群。近年来阿里云提出端网融合可预期网络的理念,并在智算领域创新设计出 HPN7.0 架构体系,基于 Ethernet 构建了超大规模、极致性能的集群网络互联,本次分享阿里云 HPN7.0 网络系统架构的设计思考和最佳实践。
席永青,阿里云资深网络架构师,在网络领域有十余篇授权专利,目前是数据中心网络架构负责人,主导设计和落地阿里云HPN智算集群网络架构。