本文汇总语言模型各组件参数量以及计算量。

Tokenizer

将字符串分割成 token array,并查表找到各 token 的 embedding。

参数量为 token 总量 x embedding 维度。

模型Token 总量Embedding 维度参数总量
Llama 3.1 70b12800081921048576000

未完