inducer · a-alveyblanc · Jul 25, 2024 · Jul 25, 2024 · Jul 26, 2024 · Aug 31, 2024
diff --git a/examples/advection/weak.py b/examples/advection/weak.py
@@ -32,11 +32,11 @@
 import pyopencl as cl
 import pyopencl.tools as cl_tools
 from arraycontext import flatten
-from meshmode.mesh import BTAG_ALL
+from meshmode.mesh import BTAG_ALL, TensorProductElementGroup
 
 import grudge.dof_desc as dof_desc
 import grudge.op as op
-from grudge.array_context import PyOpenCLArrayContext
+from grudge.array_context import NumpyArrayContext, PytatoPyOpenCLArrayContext
 
 
 logger = logging.getLogger(__name__)
@@ -96,24 +96,27 @@ def __call__(self, evt, basename, overwrite=True):
 # }}}
 
 
-def main(ctx_factory, dim=2, order=4, visualize=False):
+def main(ctx_factory, dim=1, order=2, lazy=False,
+         visualize=False, group_cls=TensorProductElementGroup):
     cl_ctx = ctx_factory()
     queue = cl.CommandQueue(cl_ctx)
-    actx = PyOpenCLArrayContext(
-        queue,
-        allocator=cl_tools.MemoryPool(cl_tools.ImmediateAllocator(queue)),
-        force_device_scalars=True,
-    )
+
+    if lazy is False:
+        actx = NumpyArrayContext()
+    else:
+        actx = PytatoPyOpenCLArrayContext(
+            queue,
+            allocator=cl_tools.MemoryPool(cl_tools.ImmediateAllocator(queue)),)
 
     # {{{ parameters
 
     # domain [-d/2, d/2]^dim
     d = 1.0
     # number of points in each dimension
-    npoints = 20
+    npoints = 10
 
     # final time
-    final_time = 1.0
+    final_time = 0.5
 
     # velocity field
     c = np.array([0.5] * dim)
@@ -129,7 +132,8 @@ def main(ctx_factory, dim=2, order=4, visualize=False):
     from meshmode.mesh.generation import generate_box_mesh
     mesh = generate_box_mesh(
             [np.linspace(-d/2, d/2, npoints) for _ in range(dim)],
-            order=order)
+            order=order,
+            group_cls=group_cls)
 
     from grudge.discretization import make_discretization_collection
 
@@ -163,7 +167,10 @@ def u_analytic(x, t=0):
     def rhs(t, u):
         return adv_operator.operator(t, u)
 
-    dt = actx.to_numpy(adv_operator.estimate_rk4_timestep(actx, dcoll, fields=u))
+    rhs_compiled = actx.compile(rhs)
+
+    # dt = actx.to_numpy(adv_operator.estimate_rk4_timestep(actx, dcoll, fields=u))
+    dt = 0.01
 
     logger.info("Timestep size: %g", dt)
 
@@ -172,7 +179,7 @@ def rhs(t, u):
     # {{{ time stepping
 
     from grudge.shortcuts import set_up_rk4
-    dt_stepper = set_up_rk4("u", float(dt), u, rhs)
+    dt_stepper = set_up_rk4("u", float(dt), u, rhs_compiled)
     plot = Plotter(actx, dcoll, order, visualize=visualize,
             ylim=[-1.1, 1.1])
 
@@ -200,13 +207,16 @@ def rhs(t, u):
     import argparse
 
     parser = argparse.ArgumentParser()
-    parser.add_argument("--dim", default=2, type=int)
-    parser.add_argument("--order", default=4, type=int)
+    parser.add_argument("--dim", default=1, type=int)
+    parser.add_argument("--order", default=2, type=int)
     parser.add_argument("--visualize", action="store_true")
+    parser.add_argument("--lazy", action="store_true")
+    parser.add_argument("--tp-elements", action="store_true")
     args = parser.parse_args()
 
     logging.basicConfig(level=logging.INFO)
     main(cl.create_some_context,
          dim=args.dim,
          order=args.order,
-         visualize=args.visualize)
+         visualize=args.visualize,
+         lazy=args.lazy)
diff --git a/examples/euler/acoustic_pulse.py b/examples/euler/acoustic_pulse.py
@@ -29,12 +29,16 @@
 
 import pyopencl as cl
 import pyopencl.tools as cl_tools
-from arraycontext import ArrayContext
-from meshmode.mesh import BTAG_ALL
+from arraycontext import ArrayContext, NumpyArrayContext
+from meshmode.discretization.poly_element import (
+    InterpolatoryEdgeClusteredGroupFactory,
+    QuadratureGroupFactory,
+)
+from meshmode.mesh import BTAG_ALL, SimplexElementGroup, TensorProductElementGroup
 from pytools.obj_array import make_obj_array
 
 import grudge.op as op
-from grudge.array_context import PyOpenCLArrayContext, PytatoPyOpenCLArrayContext
+from grudge.array_context import PytatoPyOpenCLArrayContext
 from grudge.models.euler import ConservedEulerField, EulerOperator, InviscidWallBC
 from grudge.shortcuts import rk4_step
 
@@ -106,7 +110,8 @@ def run_acoustic_pulse(actx,
                        final_time=1,
                        resolution=16,
                        overintegration=False,
-                       visualize=False):
+                       visualize=False,
+                       tensor_product_elements=False):
 
     # eos-related parameters
     gamma = 1.4
@@ -115,18 +120,19 @@ def run_acoustic_pulse(actx,
 
     from meshmode.mesh.generation import generate_regular_rect_mesh
 
+    if tensor_product_elements:
+        group_cls = TensorProductElementGroup
+    else:
+        group_cls = SimplexElementGroup
+
     dim = 2
     box_ll = -0.5
     box_ur = 0.5
     mesh = generate_regular_rect_mesh(
         a=(box_ll,)*dim,
         b=(box_ur,)*dim,
-        nelements_per_axis=(resolution,)*dim)
-
-    from meshmode.discretization.poly_element import (
-        QuadratureSimplexGroupFactory,
-        default_simplex_group_factory,
-    )
+        nelements_per_axis=(resolution,)*dim,
+        group_cls=group_cls)
 
     from grudge.discretization import make_discretization_collection
     from grudge.dof_desc import DISCR_TAG_BASE, DISCR_TAG_QUAD
@@ -141,9 +147,8 @@ def run_acoustic_pulse(actx,
     dcoll = make_discretization_collection(
         actx, mesh,
         discr_tag_to_group_factory={
-            DISCR_TAG_BASE: default_simplex_group_factory(
-                base_dim=mesh.dim, order=order),
-            DISCR_TAG_QUAD: QuadratureSimplexGroupFactory(2*order)
+            DISCR_TAG_BASE: InterpolatoryEdgeClusteredGroupFactory(order=order),
+            DISCR_TAG_QUAD: QuadratureGroupFactory(2*order)
         }
     )
 
@@ -182,12 +187,20 @@ def rhs(t, q):
 
     # {{{ time stepping
 
+    import time
+
     step = 0
     t = 0.0
+    elapsed = 0.0
     while t < final_time:
         if step % 10 == 0:
             norm_q = actx.to_numpy(op.norm(dcoll, fields, 2))
-            logger.info("[%04d] t = %.5f |q| = %.5e", step, t, norm_q)
+            if step != 0:
+                logger.info("[%04d] t = %.5f |q| = %.5e time per step = %.5f",
+                            step, t, norm_q, elapsed / step)
+            else:
+                logger.info("[%04d] t = %.5f |q| = %.5e time per step = %.5f",
+                            step, t, norm_q, 0)
             if visualize:
                 vis.write_vtk_file(
                     f"{exp_name}-{step:04d}.vtu",
@@ -199,16 +212,19 @@ def rhs(t, q):
                 )
             assert norm_q < 5
 
+        start = time.time()
         fields = actx.thaw(actx.freeze(fields))
         fields = rk4_step(fields, t, dt, compiled_rhs)
+        elapsed += time.time() - start
         t += dt
         step += 1
 
     # }}}
 
 
 def main(ctx_factory, order=3, final_time=1, resolution=16,
-         overintegration=False, visualize=False, lazy=False):
+         overintegration=False, visualize=False, lazy=False,
+         tensor_product_elements=False):
     cl_ctx = ctx_factory()
     queue = cl.CommandQueue(cl_ctx)
 
@@ -218,29 +234,27 @@ def main(ctx_factory, order=3, final_time=1, resolution=16,
             allocator=cl_tools.MemoryPool(cl_tools.ImmediateAllocator(queue)),
         )
     else:
-        actx = PyOpenCLArrayContext(
-            queue,
-            allocator=cl_tools.MemoryPool(cl_tools.ImmediateAllocator(queue)),
-            force_device_scalars=True,
-        )
+        actx = NumpyArrayContext()
 
     run_acoustic_pulse(
         actx,
         order=order,
         resolution=resolution,
         overintegration=overintegration,
         final_time=final_time,
-        visualize=visualize
+        visualize=visualize,
+        tensor_product_elements=tensor_product_elements
     )
 
 
 if __name__ == "__main__":
     import argparse
 
     parser = argparse.ArgumentParser()
-    parser.add_argument("--order", default=3, type=int)
+    parser.add_argument("--tpe", action="store_true")
+    parser.add_argument("--order", default=2, type=int)
     parser.add_argument("--tfinal", default=0.1, type=float)
-    parser.add_argument("--resolution", default=16, type=int)
+    parser.add_argument("--resolution", default=4, type=int)
     parser.add_argument("--oi", action="store_true",
                         help="use overintegration")
     parser.add_argument("--visualize", action="store_true",
@@ -256,4 +270,5 @@ def main(ctx_factory, order=3, final_time=1, resolution=16,
          resolution=args.resolution,
          overintegration=args.oi,
          visualize=args.visualize,
-         lazy=args.lazy)
+         lazy=args.lazy,
+         tensor_product_elements=args.tpe)