#bert.inf.tf32.pt.mb64_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 24576x1024:1024x1024:24576x1024n"bert.inf.tf32.pt.mb64_pvc*96"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 1024x384x64:1024x64x384:1024x384x384n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=abc --dtag=abc 1024x384x384:1024x384x64:1024x384x64n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab --attr-post-ops=gelu_tanh 24576x1024:1024x4096:24576x4096n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 24576x4096:4096x1024:24576x1024n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 24576x1024:1024x2:24576x2n"bert.inf.tf32.pt.mb64_pvc*1"
#resnet-50.tr.tf32.pt.mb16_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16x2048:2048x1000:16x1000n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x1000:1000x2048:16x2048n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1000x16:16x2048:1000x2048n"resnet-50.tr.tf32.pt.mb16_pvc*1"
#resnet-50.tr.tf32.pt.mb128_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 128x2048:2048x1000:128x1000n"resnet-50.tr.tf32.pt.mb128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x1000:1000x2048:128x2048n"resnet-50.tr.tf32.pt.mb128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1000x128:128x2048:1000x2048n"resnet-50.tr.tf32.pt.mb128_pvc*1"
#resnet-50.tr.tf32.pt.mb16_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16x2048:2048x1000:16x1000n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x1000:1000x2048:16x2048n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1000x16:16x2048:1000x2048n"resnet-50.tr.tf32.pt.mb16_pvc*1"
#lqcd.tr.tf32.pt.mb1024_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1024x3:3x2:1024x2n"lqcd.tr.tf32.pt.mb1024_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1024x2:2x3:1024x3n"lqcd.tr.tf32.pt.mb1024_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 1024x3:3x2:1024x2n"lqcd.tr.tf32.pt.mb1024_pvc*1"
#3dgan.tr.tf32.tf.mb256
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 32x200:200x3136:32x3136n"3dgan.tr.tf32.tf.mb256*8"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 256x10648:10648x1:256x1n"3dgan.tr.tf32.tf.mb256*8"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 256x1:1x10648:256x10648n"3dgan.tr.tf32.tf.mb256*8"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 256x200:200x3136:256x3136n"3dgan.tr.tf32.tf.mb256*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 200x256:256x3136:200x3136n"3dgan.tr.tf32.tf.mb256*2"
#bert.tr.tf32.tf.mb128_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16384x2:2x768:16384x768n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16384x768:768x768:16384x768n"bert.tr.tf32.tf.mb128_pvc*96"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abcd --wtag=abdc --dtag=abcd 128x12x128x64:128x12x64x128:128x12x128x128n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abcd --wtag=abcd --dtag=abcd 128x12x128x128:128x12x128x64:128x12x128x64n"bert.tr.tf32.tf.mb128_pvc*48"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16384x768:768x3072:16384x3072n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16384x3072:3072x768:16384x768n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=tanh 128x768:768x768:128x768n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 128x768:768x2:128x2n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x2:2x768:128x768n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x768:768x768:128x768n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x768:768x3072:16384x3072n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x3072:3072x768:16384x768n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x768:768x768:16384x768n"bert.tr.tf32.tf.mb128_pvc*96"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abcd --wtag=abdc --dtag=abcd 128x12x128x64:128x12x64x128:128x12x128x128n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abdc --wtag=abcd --dtag=abcd 128x12x128x128:128x12x128x64:128x12x128x64n"bert.tr.tf32.tf.mb128_pvc*48"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 2x16384:16384x768:2x768n"bert.tr.tf32.tf.mb128_pvc*2"
#deepfusion.tr.tf32.tf.m128_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*1024"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x14:14x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x14:14x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 16384x200:200x1:16384x1n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x1:1x200:16384x200n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*1528"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 200x128:128x200:200x200n"deepfusion.tr.tf32.tf.m128_pvc*1536"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 14x128:128x200:14x200n"deepfusion.tr.tf32.tf.m128_pvc*508"
#deepfusion.tr.tf32.tf.m128_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*1024"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x14:14x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x14:14x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 16384x200:200x1:16384x1n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x1:1x200:16384x200n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x200:200x200:128x200n"deepfusion.tr.tf32.tf.m128_pvc*1528"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 200x128:128x200:200x200n"deepfusion.tr.tf32.tf.m128_pvc*1536"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 14x128:128x200:14x200n"deepfusion.tr.tf32.tf.m128_pvc*508"
#pointnet-atlas.tr.tf32.pt.mb4
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x512x3:4x3x15000:4x512x15000n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x128x3:4x3x512:4x128x512n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x512x3:4x3x128:4x512x128n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x15000x3:4x3x512:4x15000x512n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x512x3:2x3x15000:2x512x15000n"pointnet-atlas.tr.tf32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x128x3:2x3x512:2x128x512n"pointnet-atlas.tr.tf32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x512x3:2x3x128:2x512x128n"pointnet-atlas.tr.tf32.pt.mb4*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x15000x3:2x3x512:2x15000x512n"pointnet-atlas.tr.tf32.pt.mb4*1"
#pointnet.tr.tf32.pt.mb16
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x1024:1024x512:16x512n"pointnet.tr.tf32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x512:512x256:16x256n"pointnet.tr.tf32.pt.mb16*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x256:256x49:16x49n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 16x7x7:16x7x15000:16x7x15000n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x256:256x4096:16x4096n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 16x64x64:16x64x15000:16x64x15000n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x256:256x4:16x4n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=acb --wtag=acb --dtag=abc 16x64x64:16x64x15000:16x64x15000n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=acb --wtag=abc --dtag=abc 16x64x15000:16x15000x64:16x64x64n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x4096:4096x256:16x256n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 4096x16:16x256:4096x256n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x256:256x512:16x512n"pointnet.tr.tf32.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 256x16:16x512:256x512n"pointnet.tr.tf32.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x512:512x1024:16x1024n"pointnet.tr.tf32.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 512x16:16x1024:512x1024n"pointnet.tr.tf32.pt.mb16*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=acb --wtag=abc --dtag=abc 16x7x15000:16x15000x7:16x7x7n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x49:49x256:16x256n"pointnet.tr.tf32.pt.mb16*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 49x16:16x256:49x256n"pointnet.tr.tf32.pt.mb16*1"
#uno_convergence.tr.tf32.tf.mb128_pvc
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x5270:5270x1000:128x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x1000:1000x1000:128x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*16"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x942:942x1000:128x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x2000:2000x1000:128x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 128x1000:1000x1:128x1n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x1:1x1000:128x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x1000:1000x1000:128x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*8"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x1000:1000x2000:128x2000n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 942x128:128x1000:942x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 5270x128:128x1000:5270x1000n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
#dcrnn.tr.tf32.tf.mb64
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x32:11456x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x16:11456x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x32:11456x32n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x16:11456x16n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x32:11456x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x16:11456x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 11456x16:16x1:11456x1n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 16x11456:11456x1:16x1n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x1:1x16:11456x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x96:11456x96n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x96:11456x96n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x51:11456x51n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x51:11456x51n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x54:11456x54n"dcrnn.tr.tf32.tf.mb64*11"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x54:11456x54n"dcrnn.tr.tf32.tf.mb64*11"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x16:54x16n"dcrnn.tr.tf32.tf.mb64*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x32:54x32n"dcrnn.tr.tf32.tf.mb64*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x54:54x32:179x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x54:54x16:179x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x96:96x32:179x32n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x96:96x16:179x16n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x51:51x32:179x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x51:51x16:179x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 179x16:16x1:179x1n"dcrnn.tr.tf32.tf.mb64*12"
#dcrnn.tr.tf32.tf.mb64
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x32:11456x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x16:11456x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x32:11456x32n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x16:11456x16n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x32:11456x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x16:11456x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 11456x16:16x1:11456x1n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x1:1x16:11456x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 16x11456:11456x1:16x1n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x96:11456x96n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x96:11456x96n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x51:11456x51n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x51:11456x51n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x54:11456x54n"dcrnn.tr.tf32.tf.mb64*11"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x54:11456x54n"dcrnn.tr.tf32.tf.mb64*11"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x16:54x16n"dcrnn.tr.tf32.tf.mb64*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x32:54x32n"dcrnn.tr.tf32.tf.mb64*1"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x54:54x32:179x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x54:54x16:179x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x96:96x32:179x32n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x96:96x16:179x16n"dcrnn.tr.tf32.tf.mb64*24"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x51:51x32:179x32n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x51:51x16:179x16n"dcrnn.tr.tf32.tf.mb64*12"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 179x16:16x1:179x1n"dcrnn.tr.tf32.tf.mb64*12"
#mma.tr.tf32.tf.mb32
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 32x1856:1856x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 32x128:128x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=tanh 32x128:128x1:32x1n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x1:128x1n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x1:1x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x128:128x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 1856x32:32x128:1856x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x1856:32x1856n"mma.tr.tf32.tf.mb32*3"
#mma.tr.tf32.tf.mb32
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 32x1856:1856x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 32x128:128x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=tanh 32x128:128x1:32x1n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x1:128x1n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x1:1x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x128:128x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x128:32x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 1856x32:32x128:1856x128n"mma.tr.tf32.tf.mb32*3"
--reset --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x1856:32x1856n"mma.tr.tf32.tf.mb32*3"
