服务热线:0755-3317 6650

ZKP算力卡

在区块链、隐私计算领域表现突出,支持 Scroll、Zcash、Manta 等项目,快速完成零知识证明生成与验证,保护用户隐私。适用于区块链、隐私计算、身份验证、云计算与大数据、物联网等领域,满足不同场景下的隐私保护、计算加速、安全验证、数据要素、AI智能体互信等需求。
产品详情您现在的位置:网站首页 >产品中心 > 产品详情
ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
Left
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
  • ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000
Right

ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000

  • ▶芯片:4 颗 Leo Chip 芯片,专注零知识证明运算加速
  • ▶存储:64GB LPDDR4 显存
  • ▶接口:PCIe 4.0 x16 接口(可拆 4 个 x4 通道)
  • ▶ 架构:双插槽、10.8 英寸全高全长设计,ASIC LEO(DPU)架构,运行稳定
▶ 散热:被动式散热,系统气流控温 ▶ 功耗:300W 热设计功耗,稳定处理高强度任务 ▶ 应用场景:在区块链、隐私计算领域表现突出,支持 Scroll、Zcash、Manta 等项目,快速完成零知识证明生成与验证,保护用户隐私。适用于区块链、隐私计算、身份验证、云计算与大数据、物联网等领域,满足不同场景下的隐私保护、计算加速、安全验证等需求。 应用领域:金融、通信、政务、电力、教育 .
咨询热线

0755-3317 6650

在线询价

  • 产品介绍:

    品       牌:JCYK金超云控产品名称:ZKP算力卡(加速卡)产品型号:ZKP-T4000上市时间:待审批
    产品类别:算力卡产品毛重:  KG产品尺寸(长*宽*高): 275*33.90*96.50mm认       证:CE、3C
    产品产地:中国·清溪技术支持:支持包装尺寸(长*宽*高)包装清单:


  • 技术介绍:

    ZKP T4000 算力卡技术介绍


    ZKP T4000 加速卡(算力卡)由金超云控(JCYK)与智芯华玺(Accseal)联合生产制造,基于全球首颗零知识证明(ZKPSOC 芯片 Leo Chip12 纳米工艺)打造,是全球首款 ZKP 零知识证明的硬件加速卡,在密码学运算加速领域具备显著优势。


     

      1750485946858844.png



    一、核心技术架构


    1.            芯片组合:集成 4 Leo Chip 芯片,专注零知识证明运算加速,实现高性能计算能力。


    2.            存储与接口


      64GB LPDDR4 显存,保障数据高速存取。


      PCIe 4.0 x16 接口,支持拆分 4 x4 通道,灵活适配不同设备与系统需求。


    二、应用领域与技术突破


              1. 在区块链、隐私计算等领域,ZKP T4000 算力卡发挥关键作用:


                ①  隐私项目支持:在 ScrollZcashManta 等隐私项目中,可快速完成零知识证明的生成与验证,隐藏交易敏感信息,为用户隐私安全筑牢防线。


                ②   性能提升:通过硬件加速技术,显著提升复杂密码学运算效率,推动相关领域技术革新。



    三、硬件设计优势


    1.            结构设计


    采用双插槽、10.8 英寸全高全长设计,基于 ASIC LEODPU)架构,确保运行稳定可靠。


    被动式散热设计,依靠系统气流控温,提升硬件使用寿命与可靠性。


    2.            功耗与性能300W 热设计功耗下,可稳定处理高强度计算任务,实现高效能与低能耗的平衡。


    四、软件生态支持


    1.            系统兼容:支持 Ubuntu 22.04、银河麒麟高级服务器操作系统 V10 SP3 等系统,适配多样化的软件环境。


    2.            开发支持


    提供完整驱动、SDK API 支持,降低开发者的使用门槛。


      借助配套 SDK,开发者可实现关键运算 2^26 次方级加速,加速项目开发进程。


    3.            半编程特性:芯片具备半编程特性,通过软件调整即可适配算法迭代,无需硬件改造,大幅缩短研发周期,降低开发成本。


  • 技术指标:

    1750485860917441.png


    一、核心运算性能(MSM & NTT


    (一)多标量乘法(MSM


    MSM 作为密码学(如 pairing - based 密码体制)核心运算,用于高效计算多个标量与椭圆曲线点的线性组合。在不同曲线(BLS12 - 381BN254  )及以 2^n 点表示运算维度的不同数据规模下,指标给出单卡含数据传输的计算耗时(ms 


    例如,当数据规模为 2^{24} 点时,BLS12 - 381 曲线 MSM 处理需 84.4ms ,此数据体现芯片在多标量并行 / 串行运算中的硬件加速能力,直接影响聚合签名、零知识证明等密码协议的执行效率。


    (二)数论变换(NTT


    NTT 是多项式环快速运算关键,为格密码、FHE(全同态加密)等后量子密码与隐私计算场景提供支撑。指标覆盖 BLS12 - 381BN254 曲线,以 2^n 点规模为维度,呈现单卡计算时间(含数据搬移) 


    如数据规模达 2^{26} 点时,BLS12 - 381 曲线 NTT 耗时 647.85ms ,反映芯片对大规模多项式环运算的处理能力,决定 CKKS 方案等基于多项式加密算法的性能上限。


    二、基础模运算性能(向量模操作)


    围绕密码学常用有限域参数 BN254 曲线,细化两类向量模运算:


    (一)二元模运算(Mod Add/Sub/Mul


    涵盖模加、模减、模乘,以 2^n 点规模为变量,统计单卡含数据传输的计算耗时 。这类运算属于密码算法的 “原子操作,是椭圆曲线标量乘、多项式系数运算的基础单元。


    例如,2^{20} 点规模下,Mod AddMod Mul 分别为 5.02ms5.20ms ,体现芯片在有限域基础运算的硬件管线优化能力,直接影响上层复杂算法的延迟(latency)。


    (二)三元模运算(Mod Mul - Add/Sub/Mul


    包含模乘加、模乘减、模乘乘,同样以 2^n 点规模为维度统计耗时。这类 “复合操作” 常见于密码协议优化实现(如减少运算轮次、硬件指令融合)。


    例如,2^{22} 点规模时,Mod Mul - Add 耗时 12.88ms ,反映芯片对复杂有限域运算的硬件调度能力,可支撑优化后的零知识证明电路等更高效密码算法设计。


    三、功能与领域适配性


    (一)功能覆盖


    支持 MSMNTTINTTNTT 逆变换,为多项式加密 / 解密等密码算法闭环必需操作 )、Cost NTT(优化型 NTT,面向低延迟 / 低资源场景定制加速 ),以及基础模运算(Mod Add/Sub/Mul )。覆盖密码学从 “基础有限域运算”  “高阶多项式 / 椭圆曲线运算” 全流程,适配后量子密码、传统公钥密码(如 pairing - based )算法需求。


    (二)领域支撑


    聚焦 Web3.0 / 区块链(依赖高效签名、验证,MSM 加速聚合签名;NTT 支撑零知识证明电路编译 )、后量子密码(格密码、FHE 等依赖 NTT / 模运算 )、多方安全计算 / 联邦学习(隐私保护协议需基础模运算、多项式运算加速 )、同态加密(部分)(如基于多项式环的 CKKS 方案,依赖 NTT 与复杂模运算 )。通过硬件级运算加速,为上层隐私计算、分布式信任场景提供性能底座,破解密码运算 “高耗时、高资源” 瓶颈。


    四、技术价值总结


    Leo Chip  密码学专用运算加速 为核心,通过 MSMNTT 等高阶运算与基础模运算的性能优化,覆盖后量子密码、传统密码体系硬件需求。指标中 “含数据传输耗时” 设计,贴近运算与存储 IO 需协同优化的实际工程场景,可直接指导密码协议实现(如调整数据分块规模、算法参数选型 ),助力 Web3.0、隐私计算等领域突破 “密码运算性能瓶颈,支撑更高效、更安全的分布式系统与隐私应用落地。


    五、推动零知识证明产业化落地


    以下零知识证明(ZKP)场景下,不同硬件方案的多标量乘法(MSM)运算性能对比表,围绕 BLS12 - 377 曲线,从运算耗时、算力加速比、功耗等维度,展现各类硬件在密码学核心运算的技术差异:


    1750486049174831.png


    六、核心对比维度:MSM 运算性能


            1. MSM(多标量乘法)是零知识证明、椭圆曲线密码学的核心运算,直接决定 ZKP 证明生成 / 验证效率。表中以 2^nn = 12~30 )表示运算规模(参与运算的标量 / 点数量),对比不同硬件方案的:


     运算耗时(ms:完成 MSM 运算的时间,体现硬件加速能力;


    算力加速比:以 Accseal Leo chipASIC 单芯片)为基准(加速比 = 1 ),对比其他方案的相对性能;


     功耗(W:运算过程的电力消耗,反映能效比;


    单位算力功耗比:算力加速比与功耗的比值,衡量每瓦功耗带来的性能提升


    七、硬件方案分类与性能拆解


    表中覆盖 GPUFPGAASIC 三类硬件,从单芯片到集群方案,适配不同场景需求:


    1. 通用计算方案(GPU/FPGA


    Zprize GPU Champion3090 GPU

    基于 NVIDIA RTX 3090(通用 GPU ),在小规模运算(2^{20} 以下)有一定竞争力(如 2^{20} 耗时 23ms ),但大规模运算(  及以上)性能暴跌2^{30} 耗时 13388ms )。原因是 GPU 依赖通用计算架构,对密码学专用运算的硬件管线优化不足,且显存带宽、并行调度效率难以支撑超大规模 MSM能效比差(单位算力功耗比 46.21 ),适合对成本敏感、小规模运算的实验场景。


    Ingonyama PipeMSMFPGA1x U55C

    FPGA 方案通过硬件编程适配 MSM 运算,但性能波动极大2^{16} 耗时 18ms2^{30} 飙升至 279552ms )。虽小规模运算灵活,但大规模场景下,FPGA 逻辑资源、存储带宽的瓶颈凸显,且开发复杂度高(需定制 RTL 代码 )。

    单位算力功耗比 227.91(全场景能效最差 ),仅适合极小众、定制化小批量场景。


    Cysic CysicMSMFPGAvu13p

    同样基于 FPGAXilinx vu13p ),性能优于 Ingonyama 方案(如 2^{20} 耗时 50ms vs 273ms ),但大规模运算仍显著落后于 ASIC2^{24} 780ms vs ASIC 单芯片 295.5ms )。FPGA 作为半定制化硬件,在密码学专用运算的能效、规模适配性上,远不及 ASIC 专用架构。

    2. ASIC 专用方案(Accseal 系列)

                ASIC 针对 MSM 运算定制硬件架构(如专用乘法器、有限域运算单元、数据通路优化 ),性能随规模提升优势指数级扩大


    Accseal Leo chipASIC 单芯片)

                 单芯片方案在全规模下性能均衡(2^{26} 耗时 295.5ms ),算力加速比基准为 1 ,功耗仅 10W ,单位算力功耗比 1.00(能效最优 )。通过硬件固化 MSM 运算流程,规避通用架构的冗余开销,适合对成本、功耗敏感的单卡场景(如边缘节点、小规模验证集群 )。


     Accseal LeoMSM boardASIC 单算力卡,4 芯片)

                4 芯片集群方案,性能为单芯片的 4 倍(算力加速比 4 ),2^{24} 耗时 73.9ms ,功耗 50W 。通过多芯片并行调度(PCIe 协同、显存共享 ),突破单芯片算力上限,适配中等规模 ZKP 任务(如区块链节点、隐私计算网关 )。


     Accseal LeoMSM board ProASIC 阵列,8 算力卡)

                8 算力卡集群方案,算力加速比达 32 2^{24} 耗时 9.2ms ,功耗 440W 。通过大规模 ASIC 阵列 + 512GB 共享内存,支撑超大规模 MSM 运算(如 zk-SNARK 证明生成、大规模联邦学习加密训练 ),适合数据中心级、高并发隐私计算场景。


    八、技术价值


    1.            ASIC 方案的*优势

                在大规模 MSM 运算中(2^{22} 及以上 ),ASIC 性能碾压 GPU/FPGA ,且能效比(单位算力功耗比)最优。这是因为 ASIC 为密码学运算量身定制硬件,去除通用架构的冗余逻辑,专注提升 MSM 运算的并行度、数据吞吐、有限域运算效率


    九、行业影响:推动 ZKP 产业化落地


    ZKP 技术因运算复杂度高,长期受限于证明生成慢、硬件成本高Accseal ASIC 方案通过专用硬件架构 + 集群化扩展,将 MSM 运算耗时从秒级压缩至毫秒级,能效比提升数十倍:


    助力区块链(如 ScrollZcash )实现高频次、大规模零知识证明验证,突破 TPS 瓶颈;

     推动隐私计算(联邦学习、数据共享 )从理论可行走向工程可用,降低密文运算的时间 / 成本门槛;

    加速后量子密码、抗量子 ZKP 方案的落地,通过硬件加速应对量子计算威胁。


    总结

    通过以上测试对比表清晰展现了 通用计算架构(GPU/FPGA→ ASIC 专用架构 的性能跨越,ASIC 方案在 ZKP 核心运算(MSM )中展现出高性能、高能效、高扩展性的技术优势。Accseal Leo 系列通过单芯片、算力卡、集群的梯度设计,覆盖从边缘到数据中心的全场景需求,为零知识证明产业化落地提供了关键硬件支撑,推动隐私计算、区块链等领域进入硬件加速时代

  • 产品参数:

    类别

    技术指标

    参数

    处理器/芯片组

    ZKP芯片

    4 颗Accseal Leo Chip SOC 定制芯片,12 纳米工艺

    显存

    显存容量

    64GB LPDDR4

    Pcie接口

    PCIe X16支持

    PCIe 4.0 x16(支持拆分为 4 个 PCIe x4 通道)

    实例适配

    DPU

    单卡提供 4 个 DPU 实例,多卡协同可扩展至 32 个 DPU 实例

    运算性能

    MSM&NTT

    MSM(2^24 点)处理时间   84.4ms;NTT(2^26 点)处理时间 162.57ms

    电源接口

    PCIe供电

    1 个 PCIe 8 针补助电源连接器

    显示输出

    PCI 分类

    非 VGA 未分类(Non-VGA unclassified)无显示输出接口

    散热方式

    风冷

    被动散热

    软件支持

    Eon.ko&SDK/API

    eon.ko驱动、SDK/API:提供完整开发文档

    支持系统

    适配操作系统

    Ubuntu、CentOS、银河麒麟、中标麒麟 其他Linux操作系统

    CPU支持

    适配CPU

    兆芯、海光、龙芯、飞腾(适配中)、熠知电子、Intel、AMD

    服务器要求

    硬件&软件要求

    支持 PCIe 分支功能的主板,CPU 需直连 PCIe 接口,且BIOS支持PCIe拆分

    服务器风扇要求

    转速建议

    暴力风扇全速的60%-70%(根据ZKP加速卡的工作温度而定)

    加速卡尺寸

    尺寸类型

    双插槽,全高全长设计,长度 10.8 英寸

    长*宽*高

    275.00mm(长)*33.90mm(宽)96.50mm(高)

     

     

    工作环境

    工作温度

    18℃ - 28℃

    存储温度

    -40℃ - 75℃

    工作湿度

    40% - 55%(无凝结)

    存储湿度

    30% - 70%

     


     

    • 免责声明1



      产品和性能信息

    • 1

      金超云控正在从当前文档、用户界面和代码中移除非包容性语言。请注意,有些更改可能不具追溯力,某些非包容性语言可能仍存留在旧的文档、用户界面和代码中。



    • Jcyk Corporation; Postal code 710000; 70 Jinyao Road, Sanzhong Village, Qingxi Town, Dongguan City, China

    • ® 金超云控公司 – 法律信息 – www.godspm.com
    • 金超云控是金超云控公司或其子公司在中国和其它国家(地区)的注册商标。
    • *其它名称和品牌可能是其它公司的财产。



在线询价

产品:
数量:
姓名:
公司:
地址:
电话:
传 真:
邮箱:
验证码:
粤公网安备44030002002429号 | 营业执照   |   诚信企业