21世纪经济报道记者白杨 北京报道
在大模型时代,业界已经形成的共识是:模型的智能水平取决于其投入的数据、参数量及算力。模型参数量越大、投入训练的数据质量越高,模型泛化能力则越强。
但无论是提高模型参数量还是提升数据质量,算力依旧是支撑大模型智力水平提升的核心驱动力。所以过去一年,随着大模型的快速发展,算力市场也发生了较大的变化。
IDC和浪潮信息于11月29日联合发布的《2023-2024年中国人工智能计算力发展评估报告》(简称“报告”)显示,2022年中国智能算力规模为259.9EFLOPS(每秒百亿亿次浮点运算),而2023年将达到414.1EFLOPS,同比增长约59.3%。预计到2027年,中国智能算力规模将达1117.4EFLOPS,2022-2027年期间的年复合增长率为33.9%。
智能算力需求的激增,也带动算力上下游市场实现快速增长。在芯片方面,IDC预计,2023年中国人工智能芯片出货量将达到133.5万片,同比增长22.5%。
报告认为,算力需求的提升给中国本土芯片厂商的发展提供了较大的空间,带来新的机遇。但同时,中国芯片产业发展也面临着一些挑战,其中以技术突破、人才培养、知识产权保护等方面的问题尤为突出。
以封装技术为例,3D封装等技术的出现意味着高端芯片赛道上的竞争无须再仅围绕摩尔定律下的晶体管工艺能力展开,而是可以从新的角度切入,达成电路密度提升的目标,进而实现性能的升级,封装工艺突破正在成为中国芯片制造的新课题。
此外,芯片产业发展不仅依赖硬件能力,还需要构建与硬件匹配的软件生态,包括操作系统、中间件和工具链等,当下诸多本土芯片技术储备和生态能力仍围绕小模型时代的识别式人工智能展开,难以匹配大模型和生成式人工智能发展所需的软件生态、模型框架、性能需求,因此本土人工智能芯片仍需在发展、继承和竞争中成长。
另外,由于大模型对计算能力和数据的高需求,其所需要的服务器设施也将在人工智能基础设施市场中占据越来越大的份额。
IDC预计,全球人工智能硬件市场(服务器),将从2022年的195 亿美元增长到2026年的347亿美元,五年年复合增长率达17.3%;其中,用于运行生成式人工智能的服务器市场规模在整体人工智能服务器市场的占比将从2023年的11.9%增长至2026年的31.7%。
在中国市场,预计2023年的人工智能服务器市场规模将达到91亿美元,同比增长82.5%,2027年将达到134亿美元,五年年复合增长率达21.8%。
从工作负载来看,2023年,大模型的兴起推动了训练服务器的增长速度。IDC数据显示,在中国,2023上半年训练工作负载的服务器占比达到49.4%,预计全年的占比将达到58.7%。 而随着训练模型的完善与成熟,模型和应用产品逐步进入投产模式,处理推理工作负载的人工智能服务器占比将随之攀升。IDC预计,到2027年,用于推理的工作负载将达到72.6%。
报告指出,大模型的发展提升了智能算力的需求,中国的人工智能算力平台将呈现多元化发展趋势,整体市场也将充满机遇。同时,针对国内市场面临单芯片算力的瓶颈问题,以系统化思维构建算力基础设施平台,保障算力调度,优化大模型研发效率,成为破局之法和发展趋势。
而这,也将加速中国市场对智能算力供给能力衡量标准的演变:用户对算力供给能力的评估指标将从对基础设施硬件性能的关注,迁移以及扩展至与应用需求和结果相关的维度上,如单位时间可处理Token的数量、可靠性、时延、训练时间和资金成本、数据集质量等。
在这样的背景下,技术提供商则需要构建以应用为导向、系统为核心的算力供给能力,提高算力利用率,提升诸如卡间互联、多节点间互联等水平,支持灵活稳定扩展和弹性容错,积极打造通用的人工智能软件和硬件平台,以先进的系统性能力满足市场的应用需求。
版权声明
本文仅代表作者观点,不代表平台立场。
本文系作者授权平台发表,未经许可,不得转载。