Pytorch中的self.register_buffer

在PyTorch中,self.register_buffer()是一个用于注册buffer的方法,它通常用于注册不需要求梯度的tensors。

class Test(nn.Module):
  def __init__(self):
    pe = torch.rand((3,4))
    self.register_buffer('pe', pe)

self.register_buffer的作用主要有:

所以注册pe为buffer的好处是pe不需要优化,可以随模块一起保存和加载,forward时直接访问,也可以方便地放到GPU上,而无需手动处理。

总之,register_buffer为我们提供了一个注册tensor的简单方法,使其成为模块状态的一部分,并自动处理与优化、保存相关的问题。