Sync optimizations
Compare changes
+ 88
− 16
@@ -170,6 +171,62 @@ pub fn gpu_codegen<W: Write>(
@@ -191,6 +248,8 @@ pub fn gpu_codegen<W: Write>(
@@ -221,6 +280,8 @@ struct GPUContext<'a> {
@@ -277,8 +338,6 @@ impl GPUContext<'_> {
@@ -327,6 +386,8 @@ impl GPUContext<'_> {
@@ -575,16 +636,25 @@ namespace cg = cooperative_groups;
@@ -1344,7 +1414,7 @@ namespace cg = cooperative_groups;
@@ -1803,10 +1873,12 @@ namespace cg = cooperative_groups;