为什么LLM做数学题会出错?这两天参加活动的分享嘉宾也反复提到类似问题,我也终于搞懂了 仅看Tokenization(分词)阶段,如果数学表达式不能被正确的token化,...
用户昵称:雅芳af
Username:761f27e7-baea-415a-9608-679859d7d7eb
为什么LLM做数学题会出错?这两天参加活动的分享嘉宾也反复提到类似问题,我也终于搞懂了
仅看Tokenization(分词)阶段,如果数学表达式不能被正确的token化,那么就会导致计算出错。
举个例子(这个算式比较简单,只做理解,不算bad case)假设有一个数学表达式:3 + (5 * 2) - 8 / 4。如果LLM将其错误地token化为["3", "+", "(", "5", "*", "2", ")", "-", "8", "/", "4"],LLM可能会把这些符号和数字当作独立的字符来看待,而不是一个整体的数学表达式。
这样,LLM就可能会忽略运算的优先级,错误地先进行加法和减法操作,而不是先进行括号内的乘法和除法运算。于是就会导致计算出错。
via 人工智能讨论组 - 即刻圈子 (author: 雅芳af)
用户昵称:雅芳af
Username:761f27e7-baea-415a-9608-679859d7d7eb
为什么LLM做数学题会出错?这两天参加活动的分享嘉宾也反复提到类似问题,我也终于搞懂了
仅看Tokenization(分词)阶段,如果数学表达式不能被正确的token化,那么就会导致计算出错。
举个例子(这个算式比较简单,只做理解,不算bad case)假设有一个数学表达式:3 + (5 * 2) - 8 / 4。如果LLM将其错误地token化为["3", "+", "(", "5", "*", "2", ")", "-", "8", "/", "4"],LLM可能会把这些符号和数字当作独立的字符来看待,而不是一个整体的数学表达式。
这样,LLM就可能会忽略运算的优先级,错误地先进行加法和减法操作,而不是先进行括号内的乘法和除法运算。于是就会导致计算出错。
via 人工智能讨论组 - 即刻圈子 (author: 雅芳af)