
tokens形状(batch_size, sequence_length),里面存的是每个batch重复的向量,每个batch都是一个token-index向量
现在要计算的是这些tokens在context中的位置,那么自然就是先生成range然后加上之前已有的context作为偏移,然后用expand_tile扩展一个维度到
(batch_size, sequence_length)
就获得了positions_for_ctx!

tokens形状(batch_size, sequence_length),里面存的是每个batch重复的向量,每个batch都是一个token-index向量
现在要计算的是这些tokens在context中的位置,那么自然就是先生成range然后加上之前已有的context作为偏移,然后用expand_tile扩展一个维度到
(batch_size, sequence_length)
就获得了positions_for_ctx!
comment 评论区
star_outline 咱快来抢个沙发吧!