Sync optimizations
Compare changes
+ 25
− 13
@@ -191,6 +192,7 @@ pub fn gpu_codegen<W: Write>(
@@ -221,6 +223,7 @@ struct GPUContext<'a> {
@@ -277,8 +280,6 @@ impl GPUContext<'_> {
@@ -327,6 +328,8 @@ impl GPUContext<'_> {
@@ -575,16 +578,25 @@ namespace cg = cooperative_groups;
@@ -1344,7 +1356,7 @@ namespace cg = cooperative_groups;
@@ -1806,7 +1818,7 @@ namespace cg = cooperative_groups;