# f32 wino
--reset --cfg=f32_wino --alg=wino
--match=.*kh3[^0-9].*       # only 3x3 convolutions so far
--allow-unimpl=true         # allow unimplemented for groups > 1
--mb=2                      # for fwd and bwd_d reduce mb
--dir=FWD_I,FWD_B,BWD_D,BWD_WB --batch=set_conv_all

--reset
--cfg=f32_wino --alg=wino
--allow-unimpl=true         # allow unimplemented for groups > 1
--match=.*kh3[^0-9].*       # only 3x3 convolutions so far
--dir=FWD_B,BWD_D,BWD_WB  --batch=shapes_tails
