用一种新的方式对LLMs 性能比较和评估

⚜️ arxiv.org/abs/2304.00457

论文对 BLOOM, GPT-3, ChatGPT, LLaMa-13B 在物理、化学、生物、天文学、地球科学以及子领域上的评分。

ChatGPT稳居第一,LLaMa-13B 也不错。目前ChatGPT简中使用有一定门槛,然而LLaMa可算是近期最活跃的开源项目了,单机部署运行门槛越来越低,而且有不同参数规模版本。
-- 来源

via chatGPT中文社区 - Telegram Channel
 
 
Back to Top