RWKV

Apple 和其他硬件

RWKV 在 Apple Silicon 和摩尔线程等其他硬件上的推理性能,包括 Apple Silicon、MTT-S4000 等硬件

Apple M2 8-core

RWKV 模型在 Apple M2 8-core 上的性能表现:

推理工具Model精度每秒生成的 Token 数显存用量
web-rwkvRWKV7-G1 2.9Bfp1614.75-
web-rwkvRWKV7-G1 2.9Bint823.21-
web-rwkvRWKV7-G1 2.9Bnf421.65-
llama.cpp (Metal,BLAS,4 threads)RWKV7-G1 2.9Bfp1611.26-
llama.cpp (Metal,BLAS,4 threads)RWKV7-G1 2.9BQ8_018.24-
llama.cpp (Metal,BLAS,4 threads)RWKV7-G1 2.9BQ4_K25.92-

数据来源:issue #22

M4 Pro 12-core

RWKV 模型在 Apple M4 Pro 12-core 上的性能表现:

推理工具Model精度每秒生成的 Token 数显存用量
web-rwkvRWKV7-G1 2.9Bfp1633.98-
web-rwkvRWKV7-G1 2.9Bint847.70-
web-rwkvRWKV7-G1 2.9Bnf432.95-
llama.cpp (Metal,BLAS,8 threads)RWKV7-G1 2.9Bfp1632.08-
llama.cpp (Metal,BLAS,8 threads)RWKV7-G1 2.9BQ8_046.20-
llama.cpp (Metal,BLAS,8 threads)RWKV7-G1 2.9BQ4_K56.60-

数据来源:issue #22

摩尔线程 MTT-S4000

RWKV 模型在摩尔线程 MTT-S4000 上的性能表现:

ModelPrecision每秒生成的 Token 数显存用量 (GB)
RWKV-6-1B6-v2.1fp1657.313.42
RWKV-6-1B6-v2.1fp3230.456.30
RWKV-6-3B-v2.1fp1636.096.27
RWKV-6-3B-v2.1fp3230.0311.99
RWKV-6-7B-v2.1fp1630.3914.43
RWKV-6-7B-v2.1fp3216.6228.71
RWKV-6-14B-v2.1fp1616.1926.57

表格中的参数解释:

  • Model:代表不同参数量的 RWKV-6 模型。
  • Precision:代表不同量化策略或计算精度。
这份文档对您有帮助吗?

意见反馈

联系方式(可选)

© 2026 RWKV. All rights reserved.粤ICP备2024242518号-1