最新网址:www.wangshugu.info

加入书架 | 推荐本书 | 返回书页|手机阅读

望书阁 -> 都市言情 -> 重生的我只想当学霸-> 第977章 员工福利提升,新的一年发展规划

第977章 员工福利提升,新的一年发展规划

上一页        返回目录        下一页       章节报错

    王东来在会客厅里目送克里斯托弗一行人的背影消失在走廊尽头,梁松把那份签了字的意向书放进文件夹,抬头看了他一眼。

    王东来摇了摇头,重新坐回主位上,端起那杯早已凉透的龙井喝了一口。

    阿斯麦的事对他来说已经结束了,剩下的是法务和财务团队要忙的活,不需要他再操心。

    他放下茶杯,站起来对梁松说了一句话:“让指令集研发团队准备一下,下午我去实验室看进度。”

    银河半导体总部位于唐都高新区的最东端,与光刻工厂只隔了一条宽阔的银杏大道。

    指令集研发团队的实验室在大楼的第十一层,整层楼都被划为保密区域,进出需要双重身份认证。

    王东来刷开工牌穿过气闸门时,实验室里几十号人正围在一块巨大的白板前争论不休。

    白板上画满了密密麻麻的架构图,不同颜色的记号笔把数据通路、控制单元、缓存层级标注得层层迭迭,像一张被反复涂抹的作战地图。

    “王总来了。”

    不知道谁先喊了一声,争论声戛然而止。

    所有人都转过头看着他,眼神里有敬畏,有期待,还有一种压不住的焦灼,他们已经被一个问题卡了快两周了。

    “继续。”

    王东来拉了一把椅子在实验室角落坐下,示意他们不用管自己。

    但没有人继续争论了,所有人的目光都落在白板旁边那个头发花白的老工程师身上。

    他叫陈远洲,和负责鸿蒙生态的那个陈远洲同名同姓,但在半导体领域深耕的时间同样漫长。

    他从国家大规模集成电路研究所退休后被王东来亲自请到银河半导体,专门负责国产指令集的研发。

    陈远洲放下记号笔,转过身对着王东来,语气直接:“王总,你来得正好。我们卡在指令流水线的分支预测模块上,预测准确率卡在百分之九十几,怎么也上不去了。这个数字放在三年前是行业顶尖,但现在的鸿蒙系统对芯片的实时性要求太高,车机端要同时处理激光雷达点云和自动驾驶决策,手机端要在几十毫秒内完成语音助手的自然语言理解。流水线每预测错一次,就要清空重装,浪费好几个时钟周期。这些浪费累积起来,鸿蒙的分布式协同体验就会在低端芯片上大打折扣。”

    王东来站起来走到白板前,仔细看了几分钟那些架构图。

    然后他拿起一支黑色记号笔,在分支预测模块的旁边画了一个极简的示意图,一个极小的、独立于主流水线之外的辅助预测单元。

    “你们现在的思路是把分支预测的逻辑堆在主流水线前端,用深度学习模型做模式识别。思路没错,但放错了位置。主流水线太挤了,信号绕来绕去,绕一圈好几个时钟周期就没了。把这个辅助预测单元拆出来,直接挂在取指阶段后面。它不参与主流水线的任何运算,只做一件事,提前一个周期把分支目标地址算好,喂给取指单元。”

    他在辅助预测单元和取指单元之间画了一根粗粗的箭头,箭头旁边标注了几个关键的延迟参数。

    陈远洲盯着那根箭头看了很久,忽然摘下老花镜用袖口擦拭镜片。

    这个动作他重复了两次,然后重新戴上眼镜,拿起红色记号笔在辅助预测单元旁边飞快地写了一组数学公式。

    笔尖划过白板的沙沙声越来越快,写到最后一个等号时他的手微微发抖,不是紧张,是兴奋。

    “把预测逻辑拆出来独立运行,主流水线不用等,取指不用抢。王总,你这个思路不是优化,是直接改架构。但辅助单元和主流水线之间的数据同步怎么解决?预测单元跑得再快,如果和主流水线的状态不同步,预测结果就是废的。”

    王东来在辅助单元和主流水线之间补了一根虚线,旁边标注了同步锁存的时序图。

    “用异步FIFO缓冲,深度不用大,够存两次预测结果就行。预测单元提前算完就扔进去,取指单元到点自己取。主流水线永远不等预测,预测永远不拖主流水线,异步时钟域,各跑各的。娲之前在设计鸿蒙内核调度器时用过类似的异步缓冲思路,FIFO的深度参数可以直接调过来。”

    陈远洲把手里的红色记号笔搁在白板槽里,后退几步看着那张被画得密密麻麻的架构图,沉默了好一会儿。

    然后他转过身对着团队里一个戴眼镜的年轻人说:“小刘,把王总刚才画的辅助预测单元用Verilog搭一版原型,时钟约束按异步FIFO的方案来设,今天搭完直接跑仿真。王总,如果这版跑通,预测准确率应该能再往上提好几个百分点。”

    他又补了一句,语气很笃定:“不是线性提升,是直接把预测延迟砍掉。这套分支预测逻辑如果跑通,鸿蒙在低端芯片上的实时性至少能追上现在中高端芯片的水平。”

    王东来点了点头没有多说什么。

    他在实验室里又待了一段时间,逐项看了缓存一致性协议的优化方案和低功耗模式下的时钟门控设计,分别提了几个调整建议,然后离开了指令集实验室。

    走廊里灯光调得很暗,只有应急灯还亮着。

    他走进电梯按下另一层的按钮,那是AI芯片研发团队所在的楼层。

    AI芯片实验室里的气氛比指令集那边更凝重。

    长桌上摊着好几块测试板,每块板上都焊着不同版本的AI加速核心。

    测试板旁边堆着厚厚一摞功耗曲线报告,每一页的页脚都被翻得起了毛边。

    项目负责人姓周,是从英伟达挖过来的资深架构师,头发已经白了大半,但眼神极其锐利。

    “王总。”

    周工把他引到主测试台前,屏幕上正跑着一组AI推理任务的功耗曲线。

    “我们目前基于传统SIMD架构做的AI加速核心,在图象识别和自然语言处理上的性能已经追平了英伟达同级别产品,但功耗始终偏高。主要是数据搬运太频繁,神经网络每一层都要从外部DRAM里反复加载权重,加载一次能耗比算一次还高。这个问题不解决,我们的AI芯片就只能用在服务器端,塞不进车机和手机。”

    他把功耗曲线逐层拆解开来,每拆一层就在屏幕上标一个对应的数据搬运量。

    从卷积层到全连接层再到注意力机制,搬运量的峰值越来越高,整张图看上去就像一面正在倾斜的墙。

    王东来没有直接回答。

    他走到白板前拿起记号笔,画了一个全新的架构草图。

    不是传统的SIMD阵列,而是一种混合粒度的张量计算单元,粗粒度处理大规模矩阵乘法,细粒度处理稀疏化后的注意力计算。

    两者共用同一组片上缓存,但调度逻辑分开。

    “传统GPU用SIMD堆算力,靠暴力计算碾压神经网络。但AI推理任务的瓶颈不是算力,是数据搬运。每一层神经网络的权重都要从外部内存搬进计算单元,搬一次消耗的能量比算一次还多。你们的方案用大容量片上缓存来减少搬运次数,方向对,但片上缓存的容量终归有限,缓存再大,也装不下整个GPT模型的权重。”

    他在混合粒度张量计算单元的架构图上添了几笔,在片上缓存和外部DRAM之间加了一个极简的数据压缩引擎。

    “在数据进出片上缓存的时候加一层硬件压缩解压逻辑,不是软件压缩,是直接做在硅片上的专用压缩引擎。神经网络权重本身有大量冗余,稀疏化之后大部分权重是零,非零部分也有很强的规律性。用轻量级的差分编码把权重流压缩到原来的几分之一,数据搬运量就对应降下来了。”

    周工盯着那张架构图看了很久,眼神越来越亮。

    他拿起红色记号笔在数据压缩引擎旁边写了几行字,差分编码、零值压缩、自适应量化,每一行都是硬件压缩领域的前沿方向,但真正做成硅片的没有几家。

    看了一会儿,周工问了一个关键问题:压缩解压本身会带来延迟开销,如果延迟累积超过计算单元的空闲窗口,整体推理时间反而会被拖长。

    王东来的回答更是没有丝毫犹豫:压缩解压逻辑和计算流水线做并行化处理,不是先解压再计算,是边解压边计算。解压完一个数据块直接推进计算流水线,不等整个批次解压完成。延迟开销被计算流水线的吞吐率吃掉,净功耗下降,净延迟不增。

    他在白板上写下最后一行字,然后转过身把记号笔放回槽里。

    周工看着那行字沉默了很长时间。

    测试台上那组还在跑的功耗曲线在屏幕上缓慢波动着,每一层神经网络的计算功耗被拆解成数据搬运和矩阵运算两部分,前者占比高得惊人。

    他知道如果王东来提出的这个架构能跑通,国内AI芯片在车机端和手机端将实现从无到有的跨越。

    他转过身对团队说了一句话:“把王总的混合粒度计算单元方案做成RTL级仿真,三天之内出结果。另外,通知梁总,AI芯片流片排期提前,光刻工厂那边需要单独排产线。”

    实验室里顿时响起一片键盘敲击声。

    几个年轻工程师围在测试台前七嘴八舌地讨论着硬件压缩引擎的编码方案,有人调出娲之前做过的神经网络权重稀疏性分析报告,把差分编码的压缩比逐层标出来。

    那个从英伟达跟周工一起跳过来的年轻工程师对着屏幕看了很久,忽然说了一句:“如果我们真把这东西做出来,以后英伟达的GPU在端侧推理上就没法跟我们打了。不是价格战,是直接从架构上抄近路,他们还在用SIMD堆算力,我们已经切到数据流驱动的张量计算了。”

    周工没有回答。

    他只是看着白板上那张被画得密密麻麻的架构图,想起自己在英伟达时期曾经反复呼吁过用近存计算思路来打端侧AI芯片,但每次都被优先级更高的数据中心GPU项目压下去。

    现在他坐在唐都的实验室里,和一群年轻人一起重新做这件事,这条路终于有人肯认真走下去了。

    第二天,王东来坐在办公室里审阅AI芯片团队连夜跑出来的RTL仿真初版数据。

    功耗曲线在屏幕上平稳下滑,混合粒度计算单元的调度延迟优于设计指标。

    他拿起电容笔在报告上批了两行字,流片节点提前,光刻工厂单独排产线,优先保障AI芯片首批工程样片交付,然后把报告推给娲存档。

    “娲,把银河集团目前的员工总数和业务分布调出来。”

    屏幕上顿时跳出一组数据。

    总员工数正好突破了一百零一万,分布在星火快递、拼好饭、银河商超、银河能源、银河半导体、银河航天、银河生物等核心业务线上,以及分布在全国各地的人才公寓、社区食堂、产线培训中心和刚刚落成的员工子女托管站。

    一百多万的雇工规模,放到国内,已经是民营企业中的第一家了。

    就算是和国企相比,也差不了多少。

    并且,明眼人都能看得出来,以银河科技的发展势头,用工数量肯定还能再涨。

    比如说是遍地开花的银河商超、银河农业、银河家电等等。

    “做一份薪酬福利调整方案,要求全员底薪普遍上调,最低涨幅不少于百分之十。餐补、住房补贴、交通补贴同步优化。另外,核心岗位的长期激励翻倍,具体方案对接各部门负责人,一天之内汇总到我这里,我明天要用。”

    “人才公寓和员工子女托管站的建设进度,单独列一份报告出来,从总裁预备金里划一块专项资金,不要走常规预算审批流程。调整的具体方案你来拟,拟完直接发各部门负责人确认。”

    “最后,做一份年度预算,明年扩大银河教育的规模,成立从幼儿园到小学再到中学高中的全链条,初期以集团员工为主,要打造精品,初期可以赔钱,后期利润率控制在8%附近。”

    “加大银河农业的种植规模,配套我们的银河生物研发出来的新质品种,进行高质量高水平的种植。”

    王东来语速很快,娲一点都没有漏下,立即就动用超级算力进行了工作安排。
没看完?将本书加入收藏我是会员,将本书放入书架复制本书地址,传给QQ/MSN上的好友章节错误?点此举报