RWKV 模型的种类和下载方法

视频教程

高画质视频请跳转到 B 站观看。

如何选择最好的模型？

1️⃣ 选择最新的架构，例如 RWKV7 > RWKV6
2️⃣ 选择数据集更好的模型，数据集质量排序：G1b > G1a3 > G1a2 > G1a > G1 > G0a2 > G0
3️⃣ 看模型名称中的日期，相同的参数，模型越新越好！比如同样是 1.5B 模型，发布于 251005 的 G1a2 版本必定优于 250429 的 G1 版本

RWKV7-G1 推理模型

RWKV7-G1 系列模型拥有杰出的推理能力，且原生支持世界 100+ 种语言和代码。即使是最小的 0.1B 也能回答开放性和创造性问题。

G0/G1/G1a2/G1b 是什么?

RWKV 模型名称中的 G0a/G1a/G1a2 等字段是训练数据的版本，数据质量排序：G1b > G1a3 > G1a2 > G1a > G1 > G0a2 > G0 。

RWKV7-G1 推理模型基于 World v3.5 数据集（包含更多小说、网页、数学、代码和 reasoning 数据，共 5.16T tokens）继续训练 RWKV-7 "Goose" World 系列模型。

RWKV7-G1a 模型是在 RWKV7-G1 模型的基础上继续训练了 1T 优质推理和指令数据，RWKV7-G1a2 则是在 RWKV7-G1a 模型的基础上继续添加数据训练，以此类推。

RWKV7-G1 的整体 prompt 格式与 RWKV-7 模型类似，但可选使用 <think> 标签开启 reasoning 功能：

User: USER_PROMPT

Assistant: <think

也可以使用快思考 prompt（使用空 think 标签跳过思考过程，但获得更高质量的回答）：

User: USER_PROMPT

Assistant: <think>
</think

RWKV-7-World 基底模型【过时】

已过时，请使用效果更好的 RWKV7-G1 系列模型。

RWKV-7-World 系列模型均为基底模型（base model ，又称预训练模型）。基底模型在自然语言处理等领域的大规模数据集上进行了训练，具备较强的泛化能力和丰富的知识储备。

但为了保持泛化能力和通用性，基底模型通常不会针对任何一类任务作优化。针对一些垂直的下游任务，可能需要微调 RWKV 基底模型才能获得更好的任务效果。

Hugging Face 主站

ModelScope 仓库

ST 格式模型

RWKV-6-World 基底模型【过时】

已过时，请使用效果更好的 RWKV7-G1 系列模型。

RWKV-6-World 系列模型均为基底模型（base model ，又称预训练模型）。基底模型在自然语言处理等领域的大规模数据集上进行了训练，具备较强的泛化能力和丰富的知识储备。

在寻找其他格式（safetensors、gguf）的 RWKV-6-World 模型？请查阅：

下载 .st 格式 RWKV-6-World 模型

RWKV-6 中文小说模型【过时】

已过时，请使用效果更好的 RWKV7-G1 系列模型。

RWKV-6-ChnNovel 系列中文小说模型基于 RWKV-6-World 模型微调而来，在小说续写、小说扩写、角色扮演方面有非常好的效果。

小说模型的具体用法，请参考 RWKV-6-ChnNovel 中文小说模型教程

Hugging Face 主站

Hugging Face 镜像站（国内可访问）

ModelScope 仓库（国内可访问）

WiseModel 仓库（国内可访问）

RWKV-6 日文模型

RWKV-6-Jpn 系列日语模型基于 RWKV-6-World 模型微调而来，在日语任务和基准测试上表现良好。

Hugging Face 主站

Hugging Face 镜像

RWKV-6 State 文件【过时】

作为 RNN 模型，RWKV 拥有固定大小的隐藏状态（State）。可通过加载 State 文件强化 RWKV 模型在特定任务的表现（类似于模型增强插件）。

State 文件具体用法请查看： RWKV state 介绍和用法。RWKV 也支持微调 State 文件。

可以从以下链接下载 .pth 格式的 RWKV State 文件：

下载 RWKV-6-World-v2.1/RWKV-6-ChnNovel 模型的 State 文件（Hugging Face 镜像站）
下载 RWKV-6-World-v3 模型的 State 文件（Hugging Face 镜像站）

注意： State 文件需要搭配同尺寸的 RWKV 模型，方可正常使用。

HF 仓库中包含以下几种 State 文件：

chn-single-round：中文单轮对话增强，更符合人类语言习惯，带丰富的 Emoji 表情
eng-single-round：英文单轮对话增强，更符合人类语言习惯，带丰富的 Emoji 表情
chn-小说扩写-single-round：中文单轮对话，会根据用户输入进行小说扩写
chn-打油诗-single-round：中文单轮对话，会根据用户输入创作打油诗
chn-文言文-single-round：中文单轮对话，回答的风格会偏向文言文
chn-文言文和古典名著-single-round：中文单轮对话，回答的风格会偏向文言文和古典名著
OnlyForChnNovel_小说扩写 State：用于扩写中文小说，适用于同尺寸的 RWKV-6-ChnNovel 模型

除了 OnlyForChnNovel 系列，其他 State 文件均适用于 RWKV-6-World 模型。

RWKV-5、RWKV-4 等过时模型

由于老旧架构导致的性能问题， RWKV-5、RWKV-4 全系列（Raven / World / Pile ...）和更早的 RWKV 版本均已结束生命周期，现有模型仅作为存档。

可以在以下链接找到存档的 RWKV 模型：

RWKV-5-World
RWKV-4-World
RWKV-4-Raven
其他 RWKV 系列请在 HF 仓库中查看。

RWKV 模型的种类和下载方法

On this page