----------------------
阿里AI专家交流纪要20230401.docx
18.2 KB
----------------------
阿里AI专家交流纪要
1. 阿里去年已经发布了自然语言理解的大模型,一个叫m6,一个叫 plug。m6的自然语言理解的能力,与GPT3.5有一年半左右差距。今年下半年云栖大会会有m6的新的模型发布或进展,大概在GPT2.5左右的水平。
2. 文心一言至少可以达到GPT-2.5水平,基于Bert。阿里大模型架构基于Transformer;百度的优势是百度搜索和百度知道的数据积累。
3. 阿里国内AI算力储备最多,然后以次为:字节、百度、腾讯。阿里云现在云上至少应该有上万片的A100,整体至少能够达到10万片,集团应该会是阿里云5倍。
4. 腾讯大模型基于混元继续迭代,大概100人左右做GPT复现以及自我模型迭代。
5. 阿里目前对于AI大模型是稳扎稳打。ChatGPT的一个推理的任务,大概所需要消耗的这个能力是5张A100在2秒钟之内做一次推理,大规模应用起来成本很高,冲击也很大。(source)
🤖 投稿:@ZaiHuabot
📣 频道:@TestFlightCN
via 🆕 Testflight 科技新闻投稿📮 - Telegram Channel (author: ㅤ)
阿里AI专家交流纪要20230401.docx
18.2 KB
----------------------
阿里AI专家交流纪要
1. 阿里去年已经发布了自然语言理解的大模型,一个叫m6,一个叫 plug。m6的自然语言理解的能力,与GPT3.5有一年半左右差距。今年下半年云栖大会会有m6的新的模型发布或进展,大概在GPT2.5左右的水平。
2. 文心一言至少可以达到GPT-2.5水平,基于Bert。阿里大模型架构基于Transformer;百度的优势是百度搜索和百度知道的数据积累。
3. 阿里国内AI算力储备最多,然后以次为:字节、百度、腾讯。阿里云现在云上至少应该有上万片的A100,整体至少能够达到10万片,集团应该会是阿里云5倍。
4. 腾讯大模型基于混元继续迭代,大概100人左右做GPT复现以及自我模型迭代。
5. 阿里目前对于AI大模型是稳扎稳打。ChatGPT的一个推理的任务,大概所需要消耗的这个能力是5张A100在2秒钟之内做一次推理,大规模应用起来成本很高,冲击也很大。(source)
🤖 投稿:@ZaiHuabot
📣 频道:@TestFlightCN
via 🆕 Testflight 科技新闻投稿📮 - Telegram Channel (author: ㅤ)