英伟达开源Nemotron-4 340B 可用合成数据训出特定开源通用模型英伟达发布全新开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式——或许以后各行各业都不再需要昂贵的真实世界数据集了

英伟达开源Nemotron-4 340B 可用合成数据训出特定开源通用模型

英伟达发布全新开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式——或许以后各行各业都不再需要昂贵的真实世界数据集了。

根据英伟达官方发文，Nemotron-4 340B包括基础模型Base、指令模型Instruct和奖励模型Reward，并构建了一个高质量合成数据生成的完整流程。模型支持4K上下文窗口、50多种自然语言和40多种编程语言。训练数据方面，英伟达采用了高达9万亿个token。其中，8万亿用于预训练，1万亿用于继续训练以提高质量。

Nemotron-4 340B指令模型可以帮助开发者生成合成训练数据。这些多样化的合成数据，模仿了真实世界的数据特征，因而数据质量明显提升，从而提升了各领域定制LLM的性能和稳定性。而且，为了进一步提高AI生成数据的质量，开发者还可以用Nemotron-4 340B 奖励模型，来筛选高质量的响应。此外，为了提高模型质量，开发者可以使用NeMo Aligner和由Nemotron-4 340B奖励模型标注的数据集来对齐模型。

根据大模型竞技场LMSYS的消息，Nemotron-4 340B已直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2。

新智元｜NVIDIA｜Hugging Face

关注频道 @ZaiHuaPd
频道爆料 @ZaiHuabot

via 软件新闻频道📮投稿爆料 - Telegram Channel