词表大小 (Vocab_Size)
层数 (Layers)
头数 (Heads)
隐藏维度 (Hidden_Dim)
上下文长度 (Context)
参数量 (Param_Count)