论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks

adding：计算各子项之和。如上式结果求和为"23400 + 4680 + 1404 = 28080 + 1404 = 29484"即为最后结果（对应上表中可学习任务-Adding+Copying）.
针对除法，多位数除以一位数的任务是可学习任务，现在我们考虑多位数除以多位数的任务。为此，我们通过慢除法来进行循环计算：

R_j - D\times (q_{n-(j+1)} \times 10^j) = R_{j + 1}

，其中

n

表示被除数的位数，

R_j

表示上一轮的商，

q_{n-(j+1)}

表示模型需要计算的值，要满足

D\times q_{n-(j+1)} \times 10^j \le R_j

，

D

表示除数。上式迭代的终止条件为

R_{j + 1} < D

。考虑8914/64，首先第一轮的

R_j=8914, D=64

，我们找到最大的可以使得

64 \times q_{n-(j+1)} \times 10^j \le 8914

的

j

，得到

j = 2

，对应的最大的

q = 1

，即得到

\times (1 \times 10^2) = 2514

；接下来

R_j = 2514\ge D

，则唏嘘找到最大的可以使得

64 \times q_{n-(j+1)} \times 10^j \le 2514

的

j

，得到

j = 1

，对应最大的

q = 3

，即得到

\times (3 \times 10^1) = 594

；接下来

R_j = 594\ge D

，则继续找到最大的可以使得

64 \times q_{n-(j+1)} \times 10^j \le 594

的

j

，得到

j = 0

，对应最大的

q = 9

，即得到

\times (9 \times 10^0) = 18

；最后

R_j< D=64

，终止判断。最后得到的商由上面所有的

q_{n-(j+1)} \times 10^j

组成，即

1*10^2 + 3 * 10^1 + 9 * 10^0=139

（相当于split的反向操作），余数为剩下的

R_j = 18

。注意到上述整个过程只采用了基本的可学习任务，包括Copyting, Subtraction, Comparison, Multiplication(nD*1D), 反向split。

秒客网

论文笔记--Goat: Fine-tuned LLaMA Outperforms GPT-4 on Arithmetic Tasks

相关文章