富士康于3月10日宣布推出其首个大型语言模型“FoxBrain”,计划用于改进制造和供应链管理。该模型基于Meta的Llama 3.1架构,使用120个Nvidia H100 GPU训练,耗时约四周完成。它是台湾首个针对繁体中文和台湾语言风格优化的、具有推理能力的大型语言模型。“FoxBrain”初期主要用于内部应用,涵盖数据分析、决策支持、文档协作、数学、推理、问题解决和代码生成等。富士康计划与技术伙伴合作,扩大模型应用范围,并分享其开源信息。Nvidia通过其在台湾的超级计算机“Taipei-1”提供了支持。富士康将在3月中旬的Nvidia GTC开发者大会上公布更多细节。
(路透社)
via 茶馆 - Telegram Channel