首页-所有书签-训练模型-正文

StableVicuna

3个月前

297

368

1.63K

389

StableVicuna

理由: 第一个通过RLHF训练的大规模开源聊天机器人

语言: 英文 English

分类: 训练模型(44)

标签: StableVicuna(1), 训练模型(44)

StableVicuna 是由 Stable Diffusion 背后的 StabilityAI 推出的第一个通过基于人类反馈的强化学习（RLHF）训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本，它是一个指令微调的 LLaMA 130亿模型。

标签：

本文原创，作者：龙霄，其版权均为龙霄所有。如需转载，请注明出处：https://lx.yfdxs.com/bookmark/6904.html

龙霄

Lv1Rec2

以 Nuxt.js 之力，焕新 WordPress 体验

1.30K6.59M32.97W63.79W13.98W1W

加载中…

分享：

OpenBMB上一篇

挖错网下一篇

相关导航

总数：43

书生大模型

书生大模型

3个月前

975

185

4.70K

Watsonx.ai

Watsonx.ai

3个月前

899

483

8.73K

Gemma

Gemma

3个月前

891

271

4.13K

PaLM 2

PaLM 2

3个月前

876

133

7.56K

Scale AI

Scale AI

3个月前

986

302

6.99K

文心大模型

文心大模型

3个月前

423

173

7.96K

DeepSpeed

DeepSpeed

3个月前

867

375

9.51K

GPT-4

GPT-4

3个月前

669

47

2.35K

HuggingFace

HuggingFace

3个月前

583

1

1.61K

Llama 3

Llama 3

3个月前

34

391

1.46K

Gen-2

Gen-2

3个月前

383

376

1.10K

Sora

Sora

3个月前

364

118

7.64K

评论表单游客您好，欢迎参与讨论。

加载中…

评论列表

总数：0

没有相关内容