AMD и PyTorch организовали эффективное обучение MoE-моделей на 1024 AMD GPU с TorchTitan