欢迎您来到机电设备采购平台!

首页 采招类别/货物信息 正文

GPU高性能推理模块、软件采购

  • 收藏
  • 打印
  • 字小
  • 字大+
信息时间:
2024-11-14
招标文件下载
我要报名
项目名称 GPU高性能推理模块、软件采购
项目编号 SUSTech-JC-2024-01147
项目类型 货物类
成交方式 最低价成交
采购方式 公开竞采
公告开始时间 2024-11-14 10:16:33
公告结束时间 2024-11-21 10:16:33
预算(元) 700000.00
项目预算是否含税 国产含税
备注



序号 名称 数量 单位

1

GPU高性能推理模块(核心货物)

3

是否接受进口

拒绝进口

品牌

无推荐品牌

型号

无推荐型号

技术规格及参数

一、原厂全新未拆封产品;≥80G;核心频率≥765 MHz;Turbo频率 ≥1410 MHz;流处理单元≥ 6912 个;核心架构 Ampere 共≥67款;TDP功耗 ≥250W
内存参数:内存频率≥ 2.4 Gbps;内存类型 HBM2E;内存位宽≥ 5120 bit;显存≥ 80 GB;采用 C/S 架构设计,提供完全中文化显示界面,提供与服务器品牌一致的计算机软件著作权登记证书;所有主机的全局资源总览。提供过测试;包含 CPU 核数、GPU 个数、内存及硬盘容量大小;每个节点的资源信息。包含主机名称、主机状态、IP 地址,GPU 数量、CPU 核心数、内存大小、硬盘大小等信;GPU 信息采用仪表盘形式,其中包含 GPU 型号、GPU 使用率、GPU 温度、GPU 功率、GPU 显存使用率、GPU 风扇转速占比、GPU 编解码器使用率等信息;界面刷新频率为秒级 。(以上功能需在竞价文件里提供截图证明文件)
二、提供集群管理软件。
GPU 集群管理软件必须是国产可控,且提供与服务器品牌一致的计算机软件著作权登记证书。 支持通过中文显示系统概览,提供统一的中文 web 管理界面;提供 API 标准接口,方便二次开发;提供帐号系统:支持多用户登录。资源配额:支持对用户组和用户设置使用资源配额。包括 GPU 卡数、CPU 核心数量、内存、存储;多存储卷,支持基于 Lustre 的多个卷同时共存和使用。支持提供镜像中心(公有镜像和私有镜像中心)功能,主要存储集群软件相关镜像和用户自己提交的镜像,用户可以构建针对自己应用的镜像环境,以用于创建大型训练任务展示用户所拥有的容器资源列表,每个容器资源条目提供查看容器资源、删除容器资源、容器连接、提交为镜像共四项功能;可以在 web 界面上以图表方式查看用户操作历史信息;支持自定义任务、深度学习任务,每个任务都是独立的,相互隔离,深度学习任务需能够实现单机多卡模式和多机多卡并行模式,需要集成主流的深度学习框架,可视化调试工具Jupyter、Terminal 和远程桌面。支持任务一键提交,可以将自己创建的执行脚本上传并运行,要求在运行过程中可实时查看运行日志,可以实时监控运行的负载情况,包括 CPU、内存、GPU、硬盘、网络等配件的实时使用率;可以在 web 界面上进行物理主机的运维管理操作,一键连接 IPMI,重启、关机等功能;需要满足三级用户权限管理,可分配多个管理员权限,对相应的组用户进行管理;可以在 Web 界面查看到物理主机的 PCIE 插槽、内存和硬盘的使用情况,可以看到对应插槽是否使用,方便管理员快速定位到故障部件 。(以上功能需在竞价文件里提供截图证明文件)
三、提供相关深度学习的软件(1 套)。
1. GPU CUDA 编译环境 :CUDA Toolkit 11 ,GPU Driver;
2. 深度学习框架:Tensorflow,mxnet,pytorch, caffe 等;
3. NVIDIA DIGITS GPU 训练系统;
4. Deep Learning SDK : 深度学习原生库 CuDNN,深度学习推理引擎(TensorRT);
5. NVIDIA Docker 容器平台:包括编程、运行、系统工具、系统函数库等都打包到一个完整的文件系统中,可安装到任何一台服务器上;
6. 深度学习加速库:cuBLAS, cuSPARSE , NCCL。
该设备性能满足:
1.数值型计算。符合cplex,lingo等CPU密集型计算需求。用于课题组进行数值分析,优化算法、仿真等研究。
2.人工智能训练,大模型部署。符合GPU密集型计算需求,高显存运行需求。用于课题组进行机器学习,计算机视觉,自然语言处理等方向研究。
3.软件配置要求:
提供基于高性能计算物理集群的算力资源,不接受vCPU、vGPU、虚拟核心、逻辑核心(超线程)等虚拟化资源或云主机资源。采用的算力资源为基于高性能计算集群的物理CPU算力资源,非vCPU、虚拟核心、逻辑核心(超线程)等虚拟化资源或云主机资源。资源操作系统应采用CentOS Linux 7.8或以上版本;预装GPU驱动、CUDA、编译器、数学库、MPI、Anaconda等计算环境。支持用户联网在线安装部署相关计算软件;采用Slurm作业调度管理系统和Lustre并行文件系统,支持磁盘配额管理及按需在线扩容。操作系统为CentOS Linux 7.8或以上版本,并预装了GPU驱动、CUDA、编译器、数学库、MPI、Anaconda等计算环境。同时,我们支持用户联网在线安装部署相关计算软件。此外,我们采用Slurm作业调度管理系统和Lustre并行文件系统,支持磁盘配额管理及按需在线扩容,以确保用户在使用过程中的顺畅和灵活性。可见操作系统采用CentOS 7.9.2009;预置Intel/GNU编译器、MPI并行计算环境、MKL数学库、Anaconda科学计算工具包等并行计算环境(通过module工具统一管理,通过“module avail 软件/工具名称”查看已预装的工具软件及版本情况,通过“module load 软件/工具名称”加载和使用),采用Slurm作业调度管理系统分发计算任务,软件版本为21.08.8-2;采用Lustre存储系统且支持磁盘配额和动态扩容。操作系统:采用CentOS Linux release 7.9.2009,符合指标要求,预置并行计算环境:预置Intel/GNU编译器、MPI计算环境、MKL数学库、Anaconda科学计算工具包等计算环境,可通过module工具统一管理,通过“module avail 软件/工具名称”查看已预装的工具软件及版本情况,通过“module load 软件/工具名称”加载和使用;如版本不匹配也可联网在线安装。(需在竞价文件里提供以下功能截图证明)
作业调度系统:采用Slurm作业调度管理系统分发计算任务,软件版本为21.08.8-2文件系统:采用Lustre文件存储系统,总存储空间5.4PB,可为采购人提供足量的存储空间,支持磁盘配额和动态扩容。提供超算预警消息自助管理入口,支持用户通过Web和微信公众号自助设置消息通知开关及余额、作业运行时长、存储使用等消息的报警阈值。超算预警消息自助管理入口,用户可以通过Web和微信公众号自助设置消息通知开关,以及设置余额、作业运行时长、存储使用等消息的报警阈值,以便用户能够及时获得重要通知和预警。多种消息管理渠道,用户可通过超算服务控制台的自助中心(Web方式)以及“超算云服务”微信公众号自助设置超算预警消息通知开关,支持自定义设置余额、作业长时间运行、存储使用等预警消息的阈值;支持通过微信公众号接收上述预警消息。云桌面提供了超算预警消息自助消息管理工具,支持用户通过Web界面及微信公众号自助设置消息通知开关及余额、作业运行时长、存储使用等消息及报警阈值;可设置是否接收超算云服务提供的相关告警及提示消息,并支持自助设置余额、作业运行时长、存储使用等消息的报警阈值(提供验证材料),超算作业查询:供应商可提供可实时查询超算作业状态和消费记录超算服务微信小程序,提供超算服务微信小程序,用户可以通过它实时查询超算作业状态和消费记录,以便随时掌握作业进展和费用情况。在系统中绑定超算云账号后即可实时查询超算作业状态和消费记录(需在竞价文件里提供截图证明)。
免费提供7x24小时技术支持服务;并承诺5分钟内响应客户需求,提供必须的计算相关答疑服务和使用文档、免费协助安装开源软件及产权清晰的商业软件,提供硬盘邮寄等服务。免费协助安装开源软件及产权清晰的商业软件,提供硬盘邮寄等服务。
用户的程序计算过程中的CPU、GPU、内存、磁盘、网络、内存带宽等性能指标量化记录(如平均值、峰值等)形成图表,并在此基础上提供程序性能分析服务。

质保期

三年

售后要求

1.提供计算节点基础安装服务。货到验收时可以通过原厂网站查询验证保修信息,(要求提供官方查询验证网址);提供原厂工程师基础安装及培训服务;供应商如若中标,根据采购人的要求,2天内提供一套该设备到其指定地点对技术参数进行逐条测试,如果2天内无法提供,或提供样机有任何不符合参数要求的情况,采购人有权拒收该产品,并上报采购管理部门。 2.售后服务响应时间:提供报修电话及联系人,招标人报修后,【8】小时内响应,【24】小时内派员上门现场维护,并在【48】小时内解决问题。

2

软件

1

是否接受进口

拒绝进口

品牌

无推荐品牌

型号

无推荐型号

技术规格及参数

1、需与原服务器平台及显卡对接配套使用。
2、密钥管理启动/查询 产品密钥;系统检查:帶外管理(OOB)支持、资产信息、系統使用率、传感器数据;Service Calls(许可证:SFT-DCMS-SINGLE 和 SFT-DCMS-SVC-KEY)
系统PFA、内存健康检查、英特尔按需功能;Chassis Intrusion获取/更改/恢复 Fru 信息
BIOS 管理:Root-of-Trust (RoT) 管理、更新 BIOS 韧件、获取 BIOS 信息、获取当前/预设 BIOS 设定、更改 BIOS 设定、获取/更改/编辑 DMI 信息、设定 BIOS 密码BMC 管理:获取/设置锁定模式、Root-of-Trust (RoT) 管理、更新 BMC 韧件、获取 BMC 信息、获取/更改 BMC 配置、设定 BMC 密码Attestation:事件日志管理、获取/清理系统事件日志、获取/清理维护事件日志、获取崩溃转储资讯、GPU 管理、获取 GPU 信息、更新 GPU 固件、CPLD 管理、更新主机板 CPLD 韧体、获取 CPLD 信息、Root-of-Trust (RoT) 管理、获取开关板 CPLD 信息、更新开关板 CPLD 固件、风扇板 CPLD 信息、更新风扇板 CPLD 固件、储存管理、擦除RAID HDD1、擦除磁盘、更新 RAID 控制器韧体、获取 RAID 控制器訊息、获取/更改 RAID 配置、更新 PMem 韧体、获取 PMem 信息、获取 SATA 信息、获取 NVMe 信息、CMM 管理、更新 CMM 控制器韧体、获取 CMM 控制器信息、获取/更改 CMM 控制器配置、设定 CMM 密码、更新 BBP (Battery Backup Power) 韧体、获取 BBP 资讯、获取/更改 Blade 电源状态档案管理:开关信息、更新开关固件、应用程序、通用指令、Redfish API、远程执行带内命令、获取/设置USB访问模式、设定伺服器 UID、设定 HTTP BOOT、获取/更改系统配置、TPM 管理、准备TPM、获取/设置电源状态、PSU 管理、获取 PSU 信息、获取 / 设置电源状态、NIC 管理(仅支持 PLDM 设备)、获取 AOC NIC 资讯、更新 AOC NIC 控制器韧体、GPU 管理、GPU 卡信息、更新 GPU 卡固件;AIP 管理:AIP CPLD 信息、更新 AIP CPLD5CDU 管理:监控 CDU 状态、背板管理、背板 CPLD 信息、更新背板 CPLD 固件、多节点 EC 信息、更新多节点 EC 信息、PCIe 交换机管理、PCIe 交换机信息、更新 PCIe 交换机。(需提供相关截图证明文件)
3、GPU VCS软件:1年订阅授权+1年服务,应用于AI/HPC等计算场景,仅支持Linux系统,包含20 个VCS;通过持续监控安全漏洞和模型定制所有权来保护公司数据和知识产权;基于标准的容器化微服务已经过认证,可以运行于云端、数据中心和工作站之上;凭借可预测的 API 稳定性生产分支、管理软件和 NVIDIA Enterprise Support,帮助确保项目保持平稳进行;利用 NVIDIA NIM 推理微服务 (包括 NVIDIA NeMo Retriever) 以及 NVIDIA AI 工作流,加速生产就绪型 RAG 工作流的开发和部署。(需提供相关截图证明文件)
4.要求:提供基于高性能计算物理集群的算力资源,不接受vCPU、vGPU、虚拟核心、逻辑核心(超线程)等虚拟化资源或云主机资源。采用的算力资源为基于高性能计算集群的物理CPU算力资源,非vCPU、虚拟核心、逻辑核心(超线程)等虚拟化资源或云主机资源。资源操作系统应采用CentOS Linux 7.8或以上版本;预装GPU驱动、CUDA、编译器、数学库、MPI、Anaconda等计算环境。支持用户联网在线安装部署相关计算软件;采用Slurm作业调度管理系统和Lustre并行文件系统,支持磁盘配额管理及按需在线扩容。操作系统为CentOS Linux 7.8或以上版本,并预装了GPU驱动、CUDA、编译器、数学库、MPI、Anaconda等计算环境。同时,支持用户联网在线安装部署相关计算软件。此外,采用Slurm作业调度管理系统和Lustre并行文件系统,支持磁盘配额管理及按需在线扩容,以确保用户在使用过程中的顺畅和灵活性。可见操作系统采用CentOS 7.9.2009;预置Intel/GNU编译器、MPI并行计算环境、MKL数学库、Anaconda科学计算工具包等并行计算环境(通过module工具统一管理,通过“module avail 软件/工具名称”查看已预装的工具软件及版本情况,通过“module load 软件/工具名称”加载和使用),采用Slurm作业调度管理系统分发计算任务,软件版本为21.08.8-2;采用Lustre存储系统且支持磁盘配额和动态扩容。操作系统:采用CentOS Linux release 7.9.2009,符合指标要求,预置并行计算环境:预置Intel/GNU编译器、MPI计算环境、MKL数学库、Anaconda科学计算工具包等计算环境,可通过module工具统一管理,通过“module avail 软件/工具名称”查看已预装的工具软件及版本情况,通过“module load 软件/工具名称”加载和使用;如版本不匹配也可联网在线安装。(需在竞价文件里提供以上功能截图证明)
作业调度系统:采用Slurm作业调度管理系统分发计算任务,软件版本为21.08.8-2文件系统:采用Lustre文件存储系统,总存储空间5.4PB,可为采购人提供足量的存储空间,支持磁盘配额和动态扩容。提供超算预警消息自助管理入口,支持用户通过Web和微信公众号自助设置消息通知开关及余额、作业运行时长、存储使用等消息的报警阈值。超算预警消息自助管理入口,用户可以通过Web和微信公众号自助设置消息通知开关,以及设置余额、作业运行时长、存储使用等消息的报警阈值,以便用户能够及时获得重要通知和预警。多种消息管理渠道,用户可通过超算服务控制台的自助中心(Web方式)以及“超算云服务”微信公众号自助设置超算预警消息通知开关,支持自定义设置余额、作业长时间运行、存储使用等预警消息的阈值;支持通过微信公众号接收上述预警消息。云桌面提供了超算预警消息自助消息管理工具,支持用户通过Web界面及微信公众号自助设置消息通知开关及余额、作业运行时长、存储使用等消息及报警阈值;可设置是否接收超算云服务提供的相关告警及提示消息,并支持自助设置余额、作业运行时长、存储使用等消息的报警阈值(提供验证材料),超算作业查询:供应商可提供可实时查询超算作业状态和消费记录超算服务微信小程序,提供超算服务微信小程序,用户可以通过它实时查询超算作业状态和消费记录,以便随时掌握作业进展和费用情况。在系统中绑定超算云账号后即可实时查询超算作业状态和消费记录(需在竞价文件里提供截图证明)。
免费提供7x24小时技术支持服务;并承诺5分钟内响应客户需求,提供必须的计算相关答疑服务和使用文档、免费协助安装开源软件及产权清晰的商业软件,提供硬盘邮寄等服务。免费协助安装开源软件及产权清晰的商业软件,提供硬盘邮寄等服务。用户的程序计算过程中的CPU、GPU、内存、磁盘、网络、内存带宽等性能指标量化记录(如平均值、峰值等)形成图表,并在此基础上提供程序性能分析服务。

质保期

三年

售后要求

1.提供计算节点基础安装服务。货到验收时可以通过原厂网站查询验证保修信息,(要求提供官方查询验证网址);提供原厂工程师基础安装及培训服务;供应商如若中标,根据采购人的要求,2天内提供一套该设备到其指定地点对技术参数进行逐条测试,如果2天内无法提供,或提供样机软件有任何不符合参数要求的情况,采购人有权拒收该产品,并上报采购管理部门。 2.售后服务响应时间:提供报修电话及联系人,招标人报修后,【8】小时内响应,【24】小时内派员上门现场维护,并在【48】小时内解决问题。

付款方式 ******学校确认无质量问题后支付100%的货款。
交货期 ******学校要求提前3天(自然日)通知送货
查看项目详细信息

版权免责声明

【1】凡本网注明"来源:机电设备采购平台"的所有文字、图片和音视频稿件,版权均属于机电设备采购平台,转载请必须注明机机电设备采购平台,违反者本网将追究相关法律责任。

【2】本网转载并注明自其它来源的作品,是本着为读者传递更多信息之目的,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。

【3】如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系。

分享到朋友圈
一天内免费查看信息来源站点

分享成功后点击跳转

注册使用者、商机更精准
姓名:*
手机号:*
验证码:* 发送验证码 已发送(60s)
机构名称:
职位:
供应产品:
评标专家会员
商机会员
供采通会员

切换到支付宝支付

抱歉,您当前会员等级权限不够!

此功能只对更高等级会员开放,立即提升会员等级!享受更多权益及功能

请扫码添加客服微信或拨打客服热线 0571-28951270 提升会员等级
关注微信
关注微信
关注App
关注App
微信客服
微信客服
返回顶部