产品中心

产品详情您现在的位置：网站首页 >产品中心 > 产品详情

ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000

▶芯片：4 颗 Leo Chip 芯片，专注零知识证明运算加速
▶存储：64GB LPDDR4 显存
▶接口：PCIe 4.0 x16 接口（可拆 4 个 x4 通道）
▶ 架构：双插槽、10.8 英寸全高全长设计，ASIC LEO（DPU）架构，运行稳定

▶ 散热：被动式散热，系统气流控温 ▶ 功耗：300W 热设计功耗，稳定处理高强度任务 ▶ 应用场景：在区块链、隐私计算领域表现突出，支持 Scroll、Zcash、Manta 等项目，快速完成零知识证明生成与验证，保护用户隐私。适用于区块链、隐私计算、身份验证、云计算与大数据、物联网等领域，满足不同场景下的隐私保护、计算加速、安全验证等需求。应用领域：金融、通信、政务、电力、教育 .

附件下载：

SJ01-JCYK ZKP T4000算力加速卡技术白皮书TO-文件编码：YK00CA11001TOV1.0.pdf

咨询热线

0755-3317 6650

在线询价

产品介绍：

品牌：JCYK金超云控	产品名称：ZKP算力卡（加速卡）	产品型号：ZKP-T4000	上市时间：待审批
产品类别：算力卡	产品毛重： KG	产品尺寸(长宽高)： 27533.9096.50mm	认证：CE、3C
产品产地：中国·清溪	技术支持：支持	包装尺寸(长宽高)：	包装清单：

技术介绍：

ZKP T4000 算力卡技术介绍

ZKP T4000 加速卡（算力卡）由金超云控（JCYK）与智芯华玺（Accseal）联合生产制造，基于全球首颗零知识证明（ZKP）SOC 芯片 Leo Chip（12 纳米工艺）打造，是全球首款 ZKP 零知识证明的硬件加速卡，在密码学运算加速领域具备显著优势。



一、核心技术架构

1.            芯片组合：集成 4 颗 Leo Chip 芯片，专注零知识证明运算加速，实现高性能计算能力。

2.            存储与接口

①  64GB LPDDR4 显存，保障数据高速存取。

②  PCIe 4.0 x16 接口，支持拆分 4 个 x4 通道，灵活适配不同设备与系统需求。

二、应用领域与技术突破

1. 在区块链、隐私计算等领域，ZKP T4000 算力卡发挥关键作用：

① 隐私项目支持：在 Scroll、Zcash、Manta 等隐私项目中，可快速完成零知识证明的生成与验证，隐藏交易敏感信息，为用户隐私安全筑牢防线。

② 性能提升：通过硬件加速技术，显著提升复杂密码学运算效率，推动相关领域技术革新。

三、硬件设计优势

1.            结构设计

①采用双插槽、10.8 英寸全高全长设计，基于 ASIC LEO（DPU）架构，确保运行稳定可靠。

②被动式散热设计，依靠系统气流控温，提升硬件使用寿命与可靠性。

2.            功耗与性能：300W 热设计功耗下，可稳定处理高强度计算任务，实现高效能与低能耗的平衡。

四、软件生态支持

1.            系统兼容：支持 Ubuntu 22.04、银河麒麟高级服务器操作系统 V10 SP3 等系统，适配多样化的软件环境。

2.            开发支持

①提供完整驱动、SDK 及 API 支持，降低开发者的使用门槛。

②  借助配套 SDK，开发者可实现关键运算 2^26 次方级加速，加速项目开发进程。

3.            半编程特性：芯片具备半编程特性，通过软件调整即可适配算法迭代，无需硬件改造，大幅缩短研发周期，降低开发成本。
技术指标:

一、核心运算性能（MSM & NTT）

（一）多标量乘法（MSM）

MSM 作为密码学（如 pairing - based 密码体制）核心运算，用于高效计算多个标量与椭圆曲线点的线性组合。在不同曲线（BLS12 - 381、BN254 ）及以 2^n 点表示运算维度的不同数据规模下，指标给出单卡含数据传输的计算耗时（ms）。

例如，当数据规模为 2^{24} 点时，BLS12 - 381 曲线 MSM 处理需 84.4ms ，此数据体现芯片在多标量并行 / 串行运算中的硬件加速能力，直接影响聚合签名、零知识证明等密码协议的执行效率。

（二）数论变换（NTT）

NTT 是多项式环快速运算关键，为格密码、FHE（全同态加密）等后量子密码与隐私计算场景提供支撑。指标覆盖 BLS12 - 381、BN254 曲线，以 2^n 点规模为维度，呈现单卡计算时间（含数据搬移） 。

如数据规模达 2^{26} 点时，BLS12 - 381 曲线 NTT 耗时 647.85ms ，反映芯片对大规模多项式环运算的处理能力，决定 CKKS 方案等基于多项式加密算法的性能上限。

二、基础模运算性能（向量模操作）

围绕密码学常用有限域参数 BN254 曲线，细化两类向量模运算：

（一）二元模运算（Mod Add/Sub/Mul）

涵盖模加、模减、模乘，以 2^n 点规模为变量，统计单卡含数据传输的计算耗时 。这类运算属于密码算法的 “原子操作”，是椭圆曲线标量乘、多项式系数运算的基础单元。

例如，2^{20} 点规模下，Mod Add、Mod Mul 分别为 5.02ms、5.20ms ，体现芯片在有限域基础运算的硬件管线优化能力，直接影响上层复杂算法的延迟（latency）。

（二）三元模运算（Mod Mul - Add/Sub/Mul）

包含模乘加、模乘减、模乘乘，同样以 2^n 点规模为维度统计耗时。这类 “复合操作” 常见于密码协议优化实现（如减少运算轮次、硬件指令融合）。

例如，2^{22} 点规模时，Mod Mul - Add 耗时 12.88ms ，反映芯片对复杂有限域运算的硬件调度能力，可支撑优化后的零知识证明电路等更高效密码算法设计。

三、功能与领域适配性

（一）功能覆盖

支持 MSM、NTT、INTT（NTT 逆变换，为多项式加密 / 解密等密码算法闭环必需操作）、Cost NTT（优化型 NTT，面向低延迟 / 低资源场景定制加速），以及基础模运算（Mod Add/Sub/Mul ）。覆盖密码学从 “基础有限域运算” 到 “高阶多项式 / 椭圆曲线运算” 全流程，适配后量子密码、传统公钥密码（如 pairing - based ）算法需求。

（二）领域支撑

聚焦 Web3.0 / 区块链（依赖高效签名、验证，MSM 加速聚合签名；NTT 支撑零知识证明电路编译）、后量子密码（格密码、FHE 等依赖 NTT / 模运算）、多方安全计算 / 联邦学习（隐私保护协议需基础模运算、多项式运算加速）、同态加密（部分）（如基于多项式环的 CKKS 方案，依赖 NTT 与复杂模运算）。通过硬件级运算加速，为上层隐私计算、分布式信任场景提供性能底座，破解密码运算 “高耗时、高资源” 瓶颈。

四、技术价值总结

Leo Chip 以 密码学专用运算加速 为核心，通过 MSM、NTT 等高阶运算与基础模运算的性能优化，覆盖后量子密码、传统密码体系硬件需求。指标中 “含数据传输耗时” 设计，贴近运算与存储 IO 需协同优化的实际工程场景，可直接指导密码协议实现（如调整数据分块规模、算法参数选型），助力 Web3.0、隐私计算等领域突破 “密码运算性能瓶颈”，支撑更高效、更安全的分布式系统与隐私应用落地。

五、推动零知识证明产业化落地

以下零知识证明（ZKP）场景下，不同硬件方案的多标量乘法（MSM）运算性能对比表，围绕 BLS12 - 377 曲线，从运算耗时、算力加速比、功耗等维度，展现各类硬件在密码学核心运算的技术差异：

六、核心对比维度：MSM 运算性能

1. MSM（多标量乘法）是零知识证明、椭圆曲线密码学的核心运算，直接决定 ZKP 证明生成 / 验证效率。表中以 2^n（n = 12~30 ）表示运算规模（参与运算的标量 / 点数量），对比不同硬件方案的：

① 运算耗时（ms）：完成 MSM 运算的时间，体现硬件加速能力；

②算力加速比：以 Accseal Leo chip（ASIC 单芯片）为基准（加速比 = 1 ），对比其他方案的相对性能；

③ 功耗（W）：运算过程的电力消耗，反映能效比；

④单位算力功耗比：算力加速比与功耗的比值，衡量 “每瓦功耗带来的性能提升”。

七、硬件方案分类与性能拆解

表中覆盖 GPU、FPGA、ASIC 三类硬件，从单芯片到集群方案，适配不同场景需求：

1. 通用计算方案（GPU/FPGA）

①Zprize GPU Champion（3090 GPU）
基于 NVIDIA RTX 3090（通用 GPU ），在小规模运算（2^{20} 以下）有一定竞争力（如 2^{20} 耗时 23ms ），但大规模运算（ 及以上）性能暴跌（2^{30} 耗时 13388ms ）。原因是 GPU 依赖通用计算架构，对密码学专用运算的硬件管线优化不足，且显存带宽、并行调度效率难以支撑超大规模 MSM。能效比差（单位算力功耗比 46.21 ），适合对成本敏感、小规模运算的实验场景。

②Ingonyama PipeMSM（FPGA，1x U55C）：
FPGA 方案通过硬件编程适配 MSM 运算，但性能波动极大（2^{16} 耗时 18ms，2^{30} 飙升至 279552ms ）。虽小规模运算灵活，但大规模场景下，FPGA 逻辑资源、存储带宽的瓶颈凸显，且开发复杂度高（需定制 RTL 代码）。
单位算力功耗比 227.91（全场景能效最差），仅适合极小众、定制化小批量场景。

③Cysic CysicMSM（FPGA，vu13p）：
同样基于 FPGA（Xilinx vu13p ），性能优于 Ingonyama 方案（如 2^{20} 耗时 50ms vs 273ms ），但大规模运算仍显著落后于 ASIC（2^{24} 780ms vs ASIC 单芯片 295.5ms ）。FPGA 作为半定制化硬件，在密码学专用运算的能效、规模适配性上，远不及 ASIC 专用架构。
2. ASIC 专用方案（Accseal 系列）
ASIC 针对 MSM 运算定制硬件架构（如专用乘法器、有限域运算单元、数据通路优化），性能随规模提升优势指数级扩大：

①Accseal Leo chip（ASIC 单芯片）：
单芯片方案在全规模下性能均衡（2^{26} 耗时 295.5ms ），算力加速比基准为 1 ，功耗仅 10W ，单位算力功耗比 1.00（能效最优）。通过硬件固化 MSM 运算流程，规避通用架构的冗余开销，适合对成本、功耗敏感的单卡场景（如边缘节点、小规模验证集群）。

② Accseal LeoMSM board（ASIC 单算力卡，4 芯片）：
4 芯片集群方案，性能为单芯片的 4 倍（算力加速比 4 ），2^{24} 耗时 73.9ms ，功耗 50W 。通过多芯片并行调度（PCIe 协同、显存共享），突破单芯片算力上限，适配中等规模 ZKP 任务（如区块链节点、隐私计算网关）。

③ Accseal LeoMSM board Pro（ASIC 阵列，8 算力卡）：
8 算力卡集群方案，算力加速比达 32 ，2^{24} 耗时 9.2ms ，功耗 440W 。通过大规模 ASIC 阵列 + 512GB 共享内存，支撑超大规模 MSM 运算（如 zk-SNARK 证明生成、大规模联邦学习加密训练），适合数据中心级、高并发隐私计算场景。

八、技术价值

1. ASIC 方案的*优势：
在大规模 MSM 运算中（2^{22} 及以上），ASIC 性能碾压 GPU/FPGA ，且能效比（单位算力功耗比）最优。这是因为 ASIC 为密码学运算 “量身定制” 硬件，去除通用架构的冗余逻辑，专注提升 MSM 运算的并行度、数据吞吐、有限域运算效率。

九、行业影响：推动 ZKP 产业化落地

ZKP 技术因运算复杂度高，长期受限于 “证明生成慢、硬件成本高”。Accseal ASIC 方案通过专用硬件架构 + 集群化扩展，将 MSM 运算耗时从 “秒级” 压缩至 “毫秒级”，能效比提升数十倍：

①助力区块链（如 Scroll、Zcash ）实现高频次、大规模零知识证明验证，突破 TPS 瓶颈；
② 推动隐私计算（联邦学习、数据共享）从 “理论可行” 走向 “工程可用”，降低密文运算的时间 / 成本门槛；
③加速后量子密码、抗量子 ZKP 方案的落地，通过硬件加速应对量子计算威胁。

总结
通过以上测试对比表清晰展现了 “通用计算架构（GPU/FPGA）→ ASIC 专用架构” 的性能跨越，ASIC 方案在 ZKP 核心运算（MSM ）中展现出 “高性能、高能效、高扩展性” 的技术优势。Accseal Leo 系列通过单芯片、算力卡、集群的梯度设计，覆盖从边缘到数据中心的全场景需求，为零知识证明产业化落地提供了关键硬件支撑，推动隐私计算、区块链等领域进入 “硬件加速时代”。

产品参数：

类别	技术指标	参数
处理器/芯片组	ZKP芯片	4 颗Accseal Leo Chip SOC 定制芯片，12 纳米工艺
显存	显存容量	64GB LPDDR4
Pcie接口	PCIe X16支持	PCIe 4.0 x16（支持拆分为 4 个 PCIe x4 通道）
实例适配	DPU	单卡提供 4 个 DPU 实例，多卡协同可扩展至 32 个 DPU 实例
运算性能	MSM&NTT	MSM（2^24 点）处理时间 84.4ms；NTT（2^26 点）处理时间 162.57ms
电源接口	PCIe供电	1 个 PCIe 8 针补助电源连接器
显示输出	PCI 分类	非 VGA 未分类（Non-VGA unclassified）无显示输出接口
散热方式	风冷	被动散热
软件支持	Eon.ko&SDK/API	eon.ko驱动、SDK/API：提供完整开发文档
支持系统	适配操作系统	Ubuntu、CentOS、银河麒麟、中标麒麟其他Linux操作系统
CPU支持	适配CPU	兆芯、海光、龙芯、飞腾（适配中）、熠知电子、Intel、AMD
服务器要求	硬件&软件要求	支持 PCIe 分支功能的主板，CPU 需直连 PCIe 接口，且BIOS支持PCIe拆分
服务器风扇要求	转速建议	暴力风扇全速的60%-70%（根据ZKP加速卡的工作温度而定）
加速卡尺寸	尺寸类型	双插槽，全高全长设计，长度 10.8 英寸
加速卡尺寸	长宽高	275.00mm（长）*33.90mm（宽）96.50mm（高）
工作环境	工作温度	18℃ - 28℃
	存储温度	-40℃ - 75℃
	工作湿度	40% - 55%（无凝结）
	存储湿度	30% - 70%

免责声明1

产品和性能信息
1
金超云控正在从当前文档、用户界面和代码中移除非包容性语言。请注意，有些更改可能不具追溯力，某些非包容性语言可能仍存留在旧的文档、用户界面和代码中。

Jcyk Corporation; Postal code 710000; 70 Jinyao Road, Sanzhong Village, Qingxi Town, Dongguan City, China
® 金超云控公司 – 法律信息 – www.godspm.com
金超云控是金超云控公司或其子公司在中国和其它国家（地区）的注册商标。
*其它名称和品牌可能是其它公司的财产。

ZKP算力卡

产品中心

ZKP零知识证明硬件加速卡(算力卡) / ZKP-T4000

产品介绍：

技术介绍：

ZKP T4000 算力卡技术介绍

一、核心技术架构

二、应用领域与技术突破

三、硬件设计优势

四、软件生态支持

技术指标:

一、核心运算性能（MSM & NTT）

（一）多标量乘法（MSM）

（二）数论变换（NTT）

二、基础模运算性能（向量模操作）

（一）二元模运算（Mod Add/Sub/Mul）

（二）三元模运算（Mod Mul - Add/Sub/Mul）

三、功能与领域适配性

（一）功能覆盖

（二）领域支撑

四、技术价值总结

五、推动零知识证明产业化落地

六、核心对比维度：MSM 运算性能

七、硬件方案分类与性能拆解

1. 通用计算方案（GPU/FPGA）

2. ASIC 专用方案（Accseal 系列）

八、技术价值

九、行业影响：推动 ZKP 产业化落地

总结

产品参数：

免责声明1

产品和性能信息

在线询价

版权logo

0755-3317 6650

产品中心

技术支持

新闻资讯

关于JCYK

扫码了解更多