Warning: Grad strides do not match bucket view strides. 可能影响DDP性能

1. transpose或permute造成内存不连续。2. 切片操作造成内存不连续。

billbliss · 2023-06-08 23:12:35 发布

1. transpose或permute造成内存不连续。

# before
output_tensor = in_tensor.transpose(1, 3)

# after
output_tensor = in_tensor.transpose(1, 3).contiguous()

2. 切片操作造成内存不连续。

# before
input_tensor = input_tensor[:, :H, :W, :]

#after
input_tensor = input_tensor[:, :H, :W, :].contiguous()

一站式 AI 云服务平台

更多推荐

国内低代码平台：2025 年国内主流平台盘点

从零开始搭建个人RAG知识库：RAGFlow+DeepSeek保姆级教程！

5分钟搞定！MySQL/PostgreSQL 到 Elasticsearch 的实时同步

查看更多评论

已为社区贡献1条内容