0755-3317 6650
在线询价品 牌:JCYK金超云控 | 产品名称:ZKP算力卡(加速卡) | 产品型号:ZKP-T4000 | 上市时间:待审批 |
产品类别:算力卡 | 产品毛重: KG | 产品尺寸(长*宽*高): 275*33.90*96.50mm | 认 证:CE、3C |
产品产地:中国·清溪 | 技术支持:支持 | 包装尺寸(长*宽*高): | 包装清单: |
ZKP T4000 加速卡(算力卡)由金超云控(JCYK)与智芯华玺(Accseal)联合生产制造,基于全球首颗零知识证明(ZKP)SOC 芯片 Leo Chip(12 纳米工艺)打造,是全球首款 ZKP 零知识证明的硬件加速卡,在密码学运算加速领域具备显著优势。
1. 芯片组合:集成 4 颗 Leo Chip 芯片,专注零知识证明运算加速,实现高性能计算能力。
2. 存储与接口
① 64GB LPDDR4 显存,保障数据高速存取。
② PCIe 4.0 x16 接口,支持拆分 4 个 x4 通道,灵活适配不同设备与系统需求。
1. 在区块链、隐私计算等领域,ZKP T4000 算力卡发挥关键作用:
① 隐私项目支持:在 Scroll、Zcash、Manta 等隐私项目中,可快速完成零知识证明的生成与验证,隐藏交易敏感信息,为用户隐私安全筑牢防线。
② 性能提升:通过硬件加速技术,显著提升复杂密码学运算效率,推动相关领域技术革新。
1. 结构设计
①采用双插槽、10.8 英寸全高全长设计,基于 ASIC LEO(DPU)架构,确保运行稳定可靠。
②被动式散热设计,依靠系统气流控温,提升硬件使用寿命与可靠性。
2. 功耗与性能:300W 热设计功耗下,可稳定处理高强度计算任务,实现高效能与低能耗的平衡。
1. 系统兼容:支持 Ubuntu 22.04、银河麒麟高级服务器操作系统 V10 SP3 等系统,适配多样化的软件环境。
2. 开发支持
①提供完整驱动、SDK 及 API 支持,降低开发者的使用门槛。
② 借助配套 SDK,开发者可实现关键运算 2^26 次方级加速,加速项目开发进程。
3. 半编程特性:芯片具备半编程特性,通过软件调整即可适配算法迭代,无需硬件改造,大幅缩短研发周期,降低开发成本。
MSM 作为密码学(如 pairing - based 密码体制)核心运算,用于高效计算多个标量与椭圆曲线点的线性组合。在不同曲线(BLS12 - 381、BN254 )及以 2^n 点表示运算维度的不同数据规模下,指标给出单卡含数据传输的计算耗时(ms) 。
例如,当数据规模为 2^{24} 点时,BLS12 - 381 曲线 MSM 处理需 84.4ms ,此数据体现芯片在多标量并行 / 串行运算中的硬件加速能力,直接影响聚合签名、零知识证明等密码协议的执行效率。
NTT 是多项式环快速运算关键,为格密码、FHE(全同态加密)等后量子密码与隐私计算场景提供支撑。指标覆盖 BLS12 - 381、BN254 曲线,以 2^n 点规模为维度,呈现单卡计算时间(含数据搬移) 。
如数据规模达 2^{26} 点时,BLS12 - 381 曲线 NTT 耗时 647.85ms ,反映芯片对大规模多项式环运算的处理能力,决定 CKKS 方案等基于多项式加密算法的性能上限。
围绕密码学常用有限域参数 BN254 曲线,细化两类向量模运算:
涵盖模加、模减、模乘,以 2^n 点规模为变量,统计单卡含数据传输的计算耗时 。这类运算属于密码算法的 “原子操作”,是椭圆曲线标量乘、多项式系数运算的基础单元。
例如,2^{20} 点规模下,Mod Add、Mod Mul 分别为 5.02ms、5.20ms ,体现芯片在有限域基础运算的硬件管线优化能力,直接影响上层复杂算法的延迟(latency)。
包含模乘加、模乘减、模乘乘,同样以 2^n 点规模为维度统计耗时。这类 “复合操作” 常见于密码协议优化实现(如减少运算轮次、硬件指令融合)。
例如,2^{22} 点规模时,Mod Mul - Add 耗时 12.88ms ,反映芯片对复杂有限域运算的硬件调度能力,可支撑优化后的零知识证明电路等更高效密码算法设计。
支持 MSM、NTT、INTT(NTT 逆变换,为多项式加密 / 解密等密码算法闭环必需操作 )、Cost NTT(优化型 NTT,面向低延迟 / 低资源场景定制加速 ),以及基础模运算(Mod Add/Sub/Mul )。覆盖密码学从 “基础有限域运算” 到 “高阶多项式 / 椭圆曲线运算” 全流程,适配后量子密码、传统公钥密码(如 pairing - based )算法需求。
聚焦 Web3.0 / 区块链(依赖高效签名、验证,MSM 加速聚合签名;NTT 支撑零知识证明电路编译 )、后量子密码(格密码、FHE 等依赖 NTT / 模运算 )、多方安全计算 / 联邦学习(隐私保护协议需基础模运算、多项式运算加速 )、同态加密(部分)(如基于多项式环的 CKKS 方案,依赖 NTT 与复杂模运算 )。通过硬件级运算加速,为上层隐私计算、分布式信任场景提供性能底座,破解密码运算 “高耗时、高资源” 瓶颈。
Leo Chip 以 密码学专用运算加速 为核心,通过 MSM、NTT 等高阶运算与基础模运算的性能优化,覆盖后量子密码、传统密码体系硬件需求。指标中 “含数据传输耗时” 设计,贴近运算与存储 IO 需协同优化的实际工程场景,可直接指导密码协议实现(如调整数据分块规模、算法参数选型 ),助力 Web3.0、隐私计算等领域突破 “密码运算性能瓶颈”,支撑更高效、更安全的分布式系统与隐私应用落地。
以下零知识证明(ZKP)场景下,不同硬件方案的多标量乘法(MSM)运算性能对比表,围绕 BLS12 - 377 曲线,从运算耗时、算力加速比、功耗等维度,展现各类硬件在密码学核心运算的技术差异:
1. MSM(多标量乘法)是零知识证明、椭圆曲线密码学的核心运算,直接决定 ZKP 证明生成 / 验证效率。表中以 2^n(n = 12~30 )表示运算规模(参与运算的标量 / 点数量),对比不同硬件方案的:
① 运算耗时(ms):完成 MSM 运算的时间,体现硬件加速能力;
②算力加速比:以 Accseal Leo chip(ASIC 单芯片)为基准(加速比 = 1 ),对比其他方案的相对性能;
③ 功耗(W):运算过程的电力消耗,反映能效比;
④单位算力功耗比:算力加速比与功耗的比值,衡量 “每瓦功耗带来的性能提升”。
表中覆盖 GPU、FPGA、ASIC 三类硬件,从单芯片到集群方案,适配不同场景需求:
①Zprize GPU Champion(3090 GPU)
基于 NVIDIA RTX 3090(通用 GPU ),在小规模运算(2^{20} 以下)有一定竞争力(如 2^{20} 耗时 23ms ),但大规模运算( 及以上)性能暴跌(2^{30} 耗时 13388ms )。原因是 GPU 依赖通用计算架构,对密码学专用运算的硬件管线优化不足,且显存带宽、并行调度效率难以支撑超大规模 MSM。能效比差(单位算力功耗比 46.21 ),适合对成本敏感、小规模运算的实验场景。
②Ingonyama PipeMSM(FPGA,1x U55C):
FPGA 方案通过硬件编程适配 MSM 运算,但性能波动极大(2^{16} 耗时 18ms,2^{30} 飙升至 279552ms )。虽小规模运算灵活,但大规模场景下,FPGA 逻辑资源、存储带宽的瓶颈凸显,且开发复杂度高(需定制 RTL 代码 )。
单位算力功耗比 227.91(全场景能效最差 ),仅适合极小众、定制化小批量场景。
③Cysic CysicMSM(FPGA,vu13p):
同样基于 FPGA(Xilinx vu13p ),性能优于 Ingonyama 方案(如 2^{20} 耗时 50ms vs 273ms ),但大规模运算仍显著落后于 ASIC(2^{24} 780ms vs ASIC 单芯片 295.5ms )。FPGA 作为半定制化硬件,在密码学专用运算的能效、规模适配性上,远不及 ASIC 专用架构。
ASIC 针对 MSM 运算定制硬件架构(如专用乘法器、有限域运算单元、数据通路优化 ),性能随规模提升优势指数级扩大:
①Accseal Leo chip(ASIC 单芯片):
单芯片方案在全规模下性能均衡(2^{26} 耗时 295.5ms ),算力加速比基准为 1 ,功耗仅 10W ,单位算力功耗比 1.00(能效最优 )。通过硬件固化 MSM 运算流程,规避通用架构的冗余开销,适合对成本、功耗敏感的单卡场景(如边缘节点、小规模验证集群 )。
② Accseal LeoMSM board(ASIC 单算力卡,4 芯片):
4 芯片集群方案,性能为单芯片的 4 倍(算力加速比 4 ),2^{24} 耗时 73.9ms ,功耗 50W 。通过多芯片并行调度(PCIe 协同、显存共享 ),突破单芯片算力上限,适配中等规模 ZKP 任务(如区块链节点、隐私计算网关 )。
③ Accseal LeoMSM board Pro(ASIC 阵列,8 算力卡):
8 算力卡集群方案,算力加速比达 32 ,2^{24} 耗时 9.2ms ,功耗 440W 。通过大规模 ASIC 阵列 + 512GB 共享内存,支撑超大规模 MSM 运算(如 zk-SNARK 证明生成、大规模联邦学习加密训练 ),适合数据中心级、高并发隐私计算场景。
1. ASIC 方案的*优势:
在大规模 MSM 运算中(2^{22} 及以上 ),ASIC 性能碾压 GPU/FPGA ,且能效比(单位算力功耗比)最优。这是因为 ASIC 为密码学运算 “量身定制” 硬件,去除通用架构的冗余逻辑,专注提升 MSM 运算的并行度、数据吞吐、有限域运算效率。
ZKP 技术因运算复杂度高,长期受限于 “证明生成慢、硬件成本高”。Accseal ASIC 方案通过专用硬件架构 + 集群化扩展,将 MSM 运算耗时从 “秒级” 压缩至 “毫秒级”,能效比提升数十倍:
①助力区块链(如 Scroll、Zcash )实现高频次、大规模零知识证明验证,突破 TPS 瓶颈;
② 推动隐私计算(联邦学习、数据共享 )从 “理论可行” 走向 “工程可用”,降低密文运算的时间 / 成本门槛;
③加速后量子密码、抗量子 ZKP 方案的落地,通过硬件加速应对量子计算威胁。
通过以上测试对比表清晰展现了 “通用计算架构(GPU/FPGA)→ ASIC 专用架构” 的性能跨越,ASIC 方案在 ZKP 核心运算(MSM )中展现出 “高性能、高能效、高扩展性” 的技术优势。Accseal Leo 系列通过单芯片、算力卡、集群的梯度设计,覆盖从边缘到数据中心的全场景需求,为零知识证明产业化落地提供了关键硬件支撑,推动隐私计算、区块链等领域进入 “硬件加速时代”。
类别 | 技术指标 | 参数 |
处理器/芯片组 | ZKP芯片 | 4 颗Accseal Leo Chip SOC 定制芯片,12 纳米工艺 |
显存 | 显存容量 | 64GB LPDDR4 |
Pcie接口 | PCIe X16支持 | PCIe 4.0 x16(支持拆分为 4 个 PCIe x4 通道) |
实例适配 | DPU | 单卡提供 4 个 DPU 实例,多卡协同可扩展至 32 个 DPU 实例 |
运算性能 | MSM&NTT | MSM(2^24 点)处理时间 84.4ms;NTT(2^26 点)处理时间 162.57ms |
电源接口 | PCIe供电 | 1 个 PCIe 8 针补助电源连接器 |
显示输出 | PCI 分类 | 非 VGA 未分类(Non-VGA unclassified)无显示输出接口 |
散热方式 | 风冷 | 被动散热 |
软件支持 | Eon.ko&SDK/API | eon.ko驱动、SDK/API:提供完整开发文档 |
支持系统 | 适配操作系统 | Ubuntu、CentOS、银河麒麟、中标麒麟 其他Linux操作系统 |
CPU支持 | 适配CPU | 兆芯、海光、龙芯、飞腾(适配中)、熠知电子、Intel、AMD |
服务器要求 | 硬件&软件要求 | 支持 PCIe 分支功能的主板,CPU 需直连 PCIe 接口,且BIOS支持PCIe拆分 |
服务器风扇要求 | 转速建议 | 暴力风扇全速的60%-70%(根据ZKP加速卡的工作温度而定) |
加速卡尺寸 | 尺寸类型 | 双插槽,全高全长设计,长度 10.8 英寸 |
长*宽*高 | 275.00mm(长)*33.90mm(宽)96.50mm(高) | |
工作环境 | 工作温度 | 18℃ - 28℃ |
存储温度 | -40℃ - 75℃ | |
工作湿度 | 40% - 55%(无凝结) | |
存储湿度 | 30% - 70% |
金超云控正在从当前文档、用户界面和代码中移除非包容性语言。请注意,有些更改可能不具追溯力,某些非包容性语言可能仍存留在旧的文档、用户界面和代码中。
Jcyk Corporation; Postal code 710000; 70 Jinyao Road, Sanzhong Village, Qingxi Town, Dongguan City, China