第151章 比赛进行时

关灯 护眼     字体:

上一章 目录 下一页

『章节错误,点此举报』

  为了尽可能地保证比赛的公平公正,所以所有参赛队伍的比赛都会有各自的区域,用半透明的玻璃窗隔开,外面可以看到里面,但是里面看不到外面,这也是为了方便裁判的监督。

  和开发有关的事情,都必须在各自队伍的区域里完成,而且比赛期间,参赛队员不能和其他队伍互相交流,也不能请外援。

  开发大厅内,键盘敲击声此起彼伏,迁徙者的比赛区域内,这次获得线下赛资格的,一共十支队伍。

  在十支队伍里,有一支叫做星火的团队,编号07,团队一共四个人,张昊是队长,架构师,王琦是CUDA优化方面的专家,赵敏负责性能分析,刘博负责底层指令与调试。

  虽然线上赛的时候,他们的成绩并不算多好,但那不是因为他们的技术不行,而是经过阅读比赛规则之后,

  他们就猜到了后续可能还会有下一阶段的比赛,毕竟没有什么奖金这么多的比赛会仅仅用线上赛决出胜负的,

  所以他们做出了一个大胆的决定:利用线上赛的宝贵时间和实战环境,全力熟悉和深入Aetos生态。

  因此在整个线上赛期间,他们都在抓紧时间熟悉Aetos生态,对于这种新的东西,越了解它,之后的胜算就多一份,

  张昊系统地研究了Aetos的软件架构白皮书,着重理解其设计理念与CUDA的根本区别。

  王琦则是将大量精力投入研究Aetos提供的计算原语、内核编写规范,并尝试用Aetos的方式重写了一些经典的CUDA算法,亲身感受两种范式的差异。

  赵敏早早地就开始摸索Aetos平台上的性能剖析工具链,对比其与NVIDIANsight系列工具的异同,学习如何在这个新平台上快速定位性能热点。

  刘博专注于Aetos的编译器flags、调试接口以及与其他国产软硬件环境的兼容性问题,为线下可能遇到的各种意外情况做准备。

  就是有点类似于考研时候的408,对于很多基础性的开发场景,408的用处可能不大,

  但是随着技术的深入,就能越来越体现出基础的重要性,同理,Aetos也是如此,越了解其基础,才能在遇到各种问题的时候解决起来游刃有余。

  而比赛的第一天,他们之前的准备工作就已经体现出来了极大的优势。

  当同赛道其他队伍还在思考没有共享内存,NUFFT的优化该从何入手,并且反复查阅CUDA文档试图找到替代方案的时候,

  星火团队的隔间里,王琦已经在白板上画出了一个全新的计算流图,他一边画一边向张昊解释,

  “昊哥,按我们之前的分析,Aetos的统一内存虽然无法手动控制,但如果我们把每个非均匀数据点及其影响的网格区域定义为一个‘计算包’,

  利用它的aetos_task_chain原语显式声明依赖,或许能天然规避掉那些不规则访问带来的延迟。”

  张昊凝视着白板上逐渐成型的计算流图,手指点了点:“思路上倒是没什么问题,不过我担心的是,

  如果我们把每一个非均匀数据点都作为一个独立的‘计算包’起点,这会产生海量的初始任务,

  Aetos运行时虽然号称支持极细粒度并行,但其任务调度器本身存在固定开销,当任务数量远超核心数量时,调度开销可能会淹没实际的计算时间。”

  这就有点像是,如果全国十四亿人都参军,那战前点名可能都得好几天的时间。

  随后他转头看向一旁正在敲键盘的赵敏:“赵敏,线上赛后期,我们针对不规则稀疏矩阵向量乘设计的那套‘动态任务聚合’启发式算法,它的参数调优和模型验证完成了吗?”

  “已经基于线上赛收集的多种负载模式完成了校准,根据离线模拟和线上小规模测试的数据,

  在NUFFT这类问题中,通过合理的聚合阈值控制,我们有信心将任务调度开销从可能超过70%的灾难性水平,压制到总耗时的15%以内,

  不仅降低了调度器压力,更重要的是,复合任务内部更容易形成连续的内存访问模式,从而 宠神小说提供了我是躺赢狗创作的《科研系学霸》干净清新、无错版纯文字章节:第151章 比赛进行时在线免费阅读。

第151章 比赛进行时(第1/3页)

『加入书签,方便阅读』

上一章 目录 下一页