当前位置: 轮机 >> 轮机资源 >> 打开算力租赁全新增长极,恒润股份全链条落
(报告出品方/分析师:国盛证券张一鸣刘高畅陈芷婧)
01立足风电产业,开发AI算力全新增长极公司的前身为江阴市恒润法兰有限公司,成立于年,并于年上市。通过近二十年的发展,公司发展成为提供设计、锻造、精加工一站式服务的精密机械制造商,具体涵盖风电法兰、风电轴承、燃气轮机部件等产品。年8月,公司发布公告,宣布与上海六尺科技集团合资成立子公司,收购芜湖六尺%股权,进军算力租赁赛道。
1.1立足风电塔筒法兰,新布局轴承拓展风电产业链
公司主要从事辗制环形锻件、锻制法兰及其他自由锻件等产品的研发、生产和销售,产品主要应用于风电、石化、金属压力容器、机械、船舶、核电等多种行业。近十年以来,公司整体业绩稳步提升。年,受国内大环境影响,风电场开工审慎,实现营收19.45亿元,较年略有下滑。
目前,公司在制造业主要拥有三大类产品:辗制法兰等环形锻件、锻制法兰及其他自由锻件、以及风电轴承。前两者为公司多年投入的传统业务,后者为年新拓展的业务。年,这三类产品分别为公司带来9.98亿元、2.94亿元、1.12亿元的营业收入。
1.辗制环形锻件:
1)辗制环形锻件毛坯的可塑性较强,通过数控机床等精加工设备将其加工成法兰、齿轮、回转支承套圈以及其他环形锻件成品,应用范围较广。
2)技术层面,公司在年实现了风电塔筒法兰从7MW向9MW至12MW的技术升级。
3)年,公司自生产辗制法兰和其他辗制环形锻件.44吨,外购.79吨,实现销售.3吨;营收9.98亿,占据公司总营业收入的51.3%。
2.锻制法兰及其他自由锻件:
1)法兰(Flange)又叫法兰盘或突缘,主要应用于管状部件的连接,应用范围较广,主要应用于金属压力容器、石化及管道、机械、建筑、船舶等多种行业。
2)公司有较大比例锻制法兰出口德国、日本等国家和地区,主要由从事法兰管件产品批发、仓储、零售业务的当地采购商向公司直接采购。
3)年,公司自生产锻制法兰和其他自由锻件.75吨,外购.19吨,实现销售.45吨。
3.风电轴承:
1)轴承是一种被誉为“工业关节”的机械基础件,用于降低机械旋转体运行过程中的摩擦系数,保证机械旋转体的回转精度。
2)风力发电机组的轴承套组主要包括:偏航轴承、变浆轴承以及主轴轴承,属于风力发电的核心零部件。
3)技术层面,年风电轴承实现了从零到套/月的产能爬坡。
4)年,公司自生产风电轴承支(每3支风电轴承能组成1套风电机组用变桨轴承),实现销售量支。
1.2国资背景彰显资金实力,资质全面进入多供应商目录
公司控股股东为济宁市国资委,股权可以追溯至山东省财政厅。
在我国锻造行业中,国有大型综合性锻造企业拥有资金、设备和人才优势,且长期为国家生产重大装备配套锻件,经验非常丰富,在行业内处于主导地位。
在行业竞争格局中,公司有着国资背景带来的资金支持,且经营风格灵活,适应市场能力强,在细分的辗制环形锻件和锻制法兰行业形成了自身独特的竞争优势,建立多家子公司,逐步打通了通风电零部件下游高附加值产品客户端。
扎实的股东背景给公司带来了良好的现金流和资本结构,支持公司进一步扩充产能,发展下游市场。
1)近来年,公司资本结构逐渐改善,资本负债率从年的64.41%下降到了年的21.24%。
2)年,公司完成非公开发行推动业务战略转型升级,规划新建募集资金投资项目“年产5万吨12MW海上风电机组用大型精加工锻件扩能项目”、“年产4,套大型风电轴承生产线项目”、“年产10万吨齿轮深加工项目”。
锻造行业对相应的资质认证要求较高,且客户会根据产品的质量需求,对供应商的人员资质、设备水平、生产条件、检验检测水平和质量控制流程等进行全面评估。
截止至年底,公司已经取得国家质量监督检验检疫总局特种设备制造资格许可证(压力管道元件),还取得了莱茵技术(TUV)ISO:质量体系认证证书、莱茵技术(TUV)欧盟承压设备(PED97/23/EC和AD2)指令中法兰制造许可证(PED和AD证书)、日本JIS证书、法国BV风电法兰工厂认证。
公司同时拥有挪威(DNV)、美国(ABS)、法国(BV)、意大利(RINA)、中国(CCS)、日本(NK)、韩国(KR)和英国(LR)等船级社认证。在以上资质认证的加持下,公司已进入西门子歌美飒、通用电气、维斯塔斯等相关企业的供应商目录。
经过二十多年的发展,公司在企业经营管理、生产质量管理、采购销售管理方面积累了丰富的经验,拥有一支生产技术过硬、管理水平专业、研发能力突出、销售经验丰富的年轻化团队。
未来,公司将从境内外两条线路着手,一方面建设欧洲销售平台,使欧洲市场销售体系更加扁平化,提高公司产品在欧洲市场的竞争力;另一方面在国内通过招聘和引进优秀销售人才,扩大现有销售团队。
1.3多年积累研发制造优势,涉足算力打造全新增长极
作为辗制环形锻件和锻制法兰行业重要供应商,公司在国内同行业中具备较强装备工艺优势及研发优势。
近年来,公司加大研发力度,产品由“静态”锻件向“动态”轴承深加工进行转换,开发风电轴承新产品线。公司全资子公司恒润环锻获批设立“江阴市博士(后)工作站”,助力技术创新。
在雄厚资金实力的支持下,公司顺应数字经济浪潮,步入数字能源算力融合新赛道。
公司于年8月5日发布公告称,与上海六尺科技集团有限公司(简称“六尺科技”)签署《合资经营合同》,共同出资设立上海润六尺科技有限公司(简称“上海润六尺”),并计划于上海、福州经开区、安徽芜湖、山东济宁等地合作建立算力中心,并打造长三角GPU算力中心集群。
年8月31日,公司宣布收购六尺科技持有的芜湖六尺智算科技有限公司(简称“芜湖六尺”)。交易完成后,公司控股子公司上海润六尺将持有芜湖六尺%股权,芜湖六尺成为上海润六尺的全资子公司。
根据公司公告,上海六尺核心团队具有丰富的AI智算中心(GPU算力)建设、运营经验和算力市场资源。团队深耕GPU算力多年,与上游GPU供应厂商英伟达、新华三等有深度合作关系。
02AIGC叠加数字经济浪潮,智能算力已成重要发展基座2.1“东数西算”稳步推进,算力渐成数字经济增长新引擎
近年来,数字经济已成国家级战略规划。
1)数据要素作为数字经济最核心的资源之一,对于推动经济增长具有倍增效应。善用数据生产要素,解放和发展数字化生产力,有助于推动数字经济与实体经济深度融合,实现高质量发展。
2)年1月12日,国务院印发《“十四五”数字经济发展规划》的通知。规划中披露,年,我国数字经济核心产业增加值占国内生产总值(GDP)比重达到7.8%,而到年,数字经济迈向全面扩展期,数字经济核心产业增加值占GDP比重达到10%。
3)目前,数字经济政策加速落地,已成为我国顶层国家级战略规划,涵盖了基础设施、数据要素、产业数字化、数字产业化、公共服务数字化、治理体系、安全体系、国际合作等八大方面。其中,基础设施、数据要素的重要性排在前列的位置。
中央网络安全和信息化委员会于年底发布《“十四五”国家信息化规划》,明确-年将开启新一轮数字经济建设周期。
“东数西算”为数字经济首个抓手,构建全国8大算力枢纽节点。
1)年2月17日,国家发展改革委、中央网信办、工业和信息化部、国家能源局近日联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,并规划了张家口集群等10个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。
2)按照全国一体化大数据中心体系布局,8个国家算力枢纽节点将作为我国算力网络的骨干连接点,发展数据中心集群,开展数据中心与网络、云计算、大数据之间的协同建设,并作为国家“东数西算”工程的战略支点,推动算力资源有序向西转移,促进解决东西部算力供需失衡问题。
截至年9月底投资已超过4亿元,我国算力水平仍有较大提升空间。
1)年9月26日,国家发展改革委召开专题新闻发布会,介绍重大基础设施建设有关情况。国家发展改革委高技术司副司长张志华说,自年2月,国家发展改革委会同中央网信办、工业和信息化部、国家能源局等部门,启动实施了“东数西算”工程以来,项目总投资超过4亿元,算力集聚效应初步显现。
2)根据中国智能计算产业联盟牵头发布的《东数西算下新型算力基础设施发展白皮书》,我国人均算力约为GFLOPS,离高算力国家0GFLOPS以上的人均算力水平仍有接近1倍的提升空间。
智能算力顺应新科技发展要求,年渗透率将达到35%。
1)无论是智慧城市还是智能制造、无人驾驶、数字孪生等场景,除了要有数据支撑以外,还要和各领域、各场景的知识模型、机理模型甚至物理模型相叠加,形成基于人工智能的新应用和场景实现。复杂模型、复杂场景势必需要面向AI的算力基础设施,即智算中心。
2)年10月9日,工业和信息化部、中央网信办、教育部、国家卫生健康委、中国人民银行、国务院国资委等六部门近日联合印发《算力基础设施高质量发展行动计划》,提出到年,计算力方面,算力规模超过EFLOPS,智能算力占比达到35%,东西部算力平衡协调发展。
2.2AIGC引爆智算需求,集群式算力为大模型训练的核心基座
AIGC浪潮已至,进一步推动对芯片和算力的需求。当下,由于互联网公司、云计算提供商和企业客户都迫切希望将生成式AI应用到自身业务中,算力供应短缺的问题已经成为行业的普遍热点。根据福布斯新闻,马斯克预计,未来GPU需求量还会增至当前的3-5倍之多。
1、训练侧:需要对应数千张H、算力投入或为近亿美元,多模态需求再提升数倍至十倍。
对于大语言模型研发企业而言,其一般具备智能云算力租赁与自行购置算力设施两种方案。
1)算力租赁:据OneFlow测算,单次训练成本约为百万至千万美元/次;而为了模型能够达到理想效果,我们预计其至少需要数十次、近百次的训练,则对应算力总投入约为亿美元级别。
据OneFlow测算,GPT-3单次训练成本约为万美元;对于一些更大的LLM模型,训练成本单次约达到万美元。
基于参数数量和token数量,根据OneFlow估算,GPT-3训练一次的成本约为.8万美元:
每个token的训练成本通常约为6N(而推理成本约为2N),其中N是LLM的参数数量;
假设在训练过程中,模型的FLOPS利用率为46.2%,与在TPUv4芯片上进行训练的PaLM模型(拥有亿参数)一致。
对于一些更大的LLM模型(如拥有亿参数的Gopher和拥有亿参数的PaLM),采用同样的计算公式,可得出,训练成本介于万美元至1万美元之间。
2)自行算力建设:参考GPUUtils报道,GPT3.5同级别模型约需要数千张H;参考快科技给出的3-4万美元/张价格,对应算力投入仍约为近亿美元
GPT3.5同级别模型约需要数千张H进行训练。根据GPUUtils报道,Inflection表示,针对他们与GPT3.5相当的大语言模型,其使用了大约张H进行训练。2)同时,对于初创公司而言,其需要数千张H对大语言模型进行训练,需要几十张或者小几百张H做微调。
考虑H价格约为3-4万美元/张,对用算力投入约为近亿美元。根据快科技报道,H价格约合人民币24万元,对应3-4万美元/张。考虑以Inflection为代表的公司算力投入在张级别,对应总投入或约为近亿美元。
3)多模态:算力需求提升约数倍至十倍,根据GPUUtils报道,GPT4、5或需要数万张GPU芯片
GPT4或对应数万张A,GPT5或对应数万张H。1)根据GPUUtils报道,GPT4有可能是在00-25张A上训练的。而对于GPT5,其可能需要25-50张H进行训练。2)相比GPT3.5约数千张H的需求量,GPT4、GPT5等相对成熟的多模态模型算力需求提升约数倍至十倍级别。
2、推理侧:仅考虑文字问答场景,需要数万张H、对应算力投入数十亿美元。
1)每日访问量:6万。
6月6日,根据科创板日报报道,据SimilarWeb最新数据,4月OpenAI网站访问次数已达到18亿次,则对应每日访问量约为6万次。
2)用户平均访问时长:5分钟。
根据科创板日报报道,每次访问时长约为5分21秒。
3)单个token输出需要的时间:62.5ms;每秒生成token数量:16个。
根据百度智能云的部分案例,在BatchSize为1时,输出8个token大约需要ms;在BatchSize增加到16时,输出8个token大约需要ms。则输出8个token的时间中值约为ms(即0.5秒),即单个token所需要的计算时间约为62.5ms(即0.秒),对应每秒生成token数量约为16个。
4)平均实时并发:.33万个token/s。
6万*(5*60)s*16token/s/(24*60*60)s=.33万个token/s。
5)算力利用率:20%。
Transformer为自回归模型,这意味着在原始状态下,每生成1个新token,都需要将所有输入过的token再次计算。
根据百度智能云技术研究,以B的GPT-3模型,输入0个token,生成个token为例:
Context(即Encoder)阶段的激活Shape为[B,0,],其中B为batch_size,第二维为输入token数,第三位为hiddensize。
而对于Generation(Decoder)阶段,由于每次输入输出都是固定的1个token,是通过循环多次来产生多个输出token,所以Generation阶段的激活Shape的第二维始终为1,Generation的激活显存占用是远小于Context阶段的。
由此导致,Context是计算密集型的任务,而Generation是访存密集型的任务,这是由于Context的计算量大,但是Generation由于每次都只计算1个token,所以计算量远小于Context,但是权重的访存量确实一致的,所以Generation阶段反而是访存密集型的任务。
这也意味着,在推理阶段,硬件的算力利用率由于受到显存带宽等的限制,会显著较低。
根据百度智能云报道,一般情况下,在线服务的GPU使用率不高,在20%左右。另外,若部署其用户态方案,保证在线服务的SLA相同的情况下,可以将GPU资源利用率提升至35%。
6)峰值倍数:10倍
推理服务一个典型的负载模式是一天中峰谷波动明显,且会出现不可预期的短时间流量激增。根据百度智能云统计,我们假设峰值倍数约为10倍。
7)所需算力总量:5.83*10^19FLOPS。
2*0亿个参数*.33万个token/s*10倍/20%算力利用率=5.83*10^19FLOPS。
8)所需H数量:1.5-6万张。
根据英伟达
转载请注明:http://www.aideyishus.com/lkzp/9070.html