为什么LLM做数学题会出错？这两天参加活动的分享嘉宾也反复提到类似问题，我也终于搞懂了仅看Tokenization（分词）阶段，如果数学表达式不能被正确的token化，...用户昵称：雅芳afUsername：761f27e7-baea-415a-9608-679859d7d7eb为什么LLM做数学题会出错？这两天参加活动的分享嘉宾也反复提到类似问题，我也终于搞懂了仅看Tokenization（分词）阶段，如果数学表达式不能被正确的token化，那么就会导致计算出错

为什么LLM做数学题会出错？这两天参加活动的分享嘉宾也反复提到类似问题，我也终于搞懂了仅看Tokenization（分词）阶段，如果数学表达式不能被正确的token化，...

用户昵称：雅芳af
Username：761f27e7-baea-415a-9608-679859d7d7eb

为什么LLM做数学题会出错？这两天参加活动的分享嘉宾也反复提到类似问题，我也终于搞懂了

仅看Tokenization（分词）阶段，如果数学表达式不能被正确的token化，那么就会导致计算出错。

举个例子（这个算式比较简单，只做理解，不算bad case）假设有一个数学表达式：3 + (5 * 2) - 8 / 4。如果LLM将其错误地token化为["3", "+", "(", "5", "*", "2", ")", "-", "8", "/", "4"]，LLM可能会把这些符号和数字当作独立的字符来看待，而不是一个整体的数学表达式。

这样，LLM就可能会忽略运算的优先级，错误地先进行加法和减法操作，而不是先进行括号内的乘法和除法运算。于是就会导致计算出错。

via 人工智能讨论组 - 即刻圈子 (author: 雅芳af)