Clean example and test

TheDisorderedOrganization · Feb 10, 2025 · e2a9203 · e2a9203
1 parent 8bd44d7
commit e2a9203
Show file tree

Hide file tree

Showing 10 changed files with 50 additions and 427 deletions.
diff --git a/Project.toml b/Project.toml
@@ -3,7 +3,6 @@ uuid = "07692032-97b4-4f8d-80d7-e18df88d31a9"
 version = "0.1.0"
 
 [deps]
-ConcreteStructs = "2569d6c7-a4a2-43d3-a901-331e8e4be471"
 Coverage = "a2441757-f6aa-5fb2-8edb-039e3f45d037"
 Dates = "ade2ca70-3891-5945-98fb-dc099432e06a"
 Distributions = "31c24e10-a181-5473-b8eb-7969acd0382f"

diff --git a/example/particle_1d/harmonic_oscillator/MC_harmonic_oscillator.jl b/example/particle_1d/harmonic_oscillator/MC_harmonic_oscillator.jl
@@ -9,16 +9,25 @@ seed = 42
 rng = Xoshiro(seed)
 β = 2.0
 M = 10
-chains = [Particle(4rand(rng) - 2, β) for _ in 1:M]
+chains = [System(4rand(rng) - 2, β) for _ in 1:M]
 pools = [(Move(Displacement(0.0), StandardGaussian(), ComponentArray(σ=0.1), 1.0),) for _ in 1:M]
 steps = 10^5
 burn = 1000
 block = [0, 10]
-sampletimes = scheduler(steps, burn, block)
+sampletimes = build_schedule(steps, burn, block)
 path = "data/MC/particle_1d/Harmonic/beta$β/M$M/seed$seed"
-simulation = Simulation(chains, pools, steps; sampletimes=sampletimes, seed=seed, parallel=false, verbose=true, store_trajectory=true, path=path)
-callbacks = (callback_energy, callback_acceptance)
-run!(simulation, callbacks...)
+
+algorithms = (
+    Metropolis(chains, pools; seed=seed, parallel=false),
+    StoreCallbacks((callback_energy, callback_acceptance), path),
+    StoreTrajectories(chains, path),
+    StoreLastFrames(chains, path),
+    PrintTimeSteps(),
+)
+schedulers = [build_schedule(steps, 0, 1), sampletimes, sampletimes, [0, steps], build_schedule(steps, burn, steps ÷ 10)]
+simulation = Simulation(chains, algorithms, steps; schedulers=schedulers, path=path, verbose=true)
+
+run!(simulation)
 
 ## PLOT RESULTS
 using Plots, Statistics, Measures, DelimitedFiles

diff --git a/example/particle_1d/harmonic_oscillator/PGMC_harmonic_oscillator.jl b/example/particle_1d/harmonic_oscillator/PGMC_harmonic_oscillator.jl
@@ -9,21 +9,37 @@ seed = 42
 rng = Xoshiro(seed)
 β = 2.0
 M = 10
-chains = [Particle(4rand(rng) - 2, β) for _ in 1:M]
+chains = [System(4rand(rng) - 2, β) for _ in 1:M]
 pools = [(
-    Move(Displacement(0.0), StandardGaussian(), ComponentArray(σ=0.1), 0.6),
+    Move(Displacement(0.0), StandardGaussian(), ComponentArray(σ=0.2), 0.6),
     Move(Displacement(0.0), StandardGaussian(), ComponentArray(σ=0.1), 0.4),
 ) for _ in 1:M]
 optimisers = (Static(), VPG(0.001))
 steps = 10^5
 burn = 1000
 block = [0, 10]
-sampletimes = scheduler(steps, burn, block)
+sampletimes = build_schedule(steps, burn, block)
 path = "data/PGMC/particle_1d/Harmonic/beta$β/M$M/seed$seed"
-simulation = Simulation(chains, pools, optimisers, steps;
-    sampletimes=sampletimes, seed=seed, store_trajectory=true, store_parameters=true, parallel=false, verbose=true, path=path)
-callbacks = (callback_energy, callback_acceptance)
-run!(simulation, callbacks...)
+
+metropolis = Metropolis(chains, pools; seed=seed, parallel=false)
+pge = PolicyGradientEstimator(chains, pools, optimisers)
+pgu = PolicyGradientUpdate(chains, pge)
+learn_ids = [k for k in eachindex(optimisers) if !isa(optimisers[k], Static)]
+
+algorithms = (
+    metropolis,
+    pge,
+    pgu,
+    StoreCallbacks((callback_energy, callback_acceptance), path),
+    StoreTrajectories(chains, path),
+    StoreLastFrames(chains, path),
+    PrintTimeSteps(),
+    StoreParameters(pools[1], path; ids=learn_ids),
+)
+schedulers = [build_schedule(steps, 0, 1), build_schedule(steps, 0, 1), build_schedule(steps, 0, 2), sampletimes, sampletimes, [0, steps], build_schedule(steps, burn, steps ÷ 10), sampletimes]
+simulation = Simulation(chains, algorithms, steps; schedulers=schedulers, path=path, verbose=true)
+
+run!(simulation)
 
 
 ## PLOT RESULTS

diff --git a/example/particle_1d/harmonic_oscillator/density.png b/example/particle_1d/harmonic_oscillator/density.png
diff --git a/example/particle_1d/harmonic_oscillator/learning.png b/example/particle_1d/harmonic_oscillator/learning.png
diff --git a/example/particle_1d/particle_1d.jl b/example/particle_1d/particle_1d.jl
@@ -1,4 +1,4 @@
-# using MonteCarlo
+using MonteCarlo
 using Random
 using Distributions
 using ComponentArrays

diff --git a/src/MonteCarlo.jl b/src/MonteCarlo.jl
@@ -5,7 +5,6 @@ using Distributions
 using Statistics
 using LinearAlgebra
 using Transducers
-using ConcreteStructs
 using Dates
 
 include("simulation.jl")
@@ -30,20 +29,4 @@ include("pgmc/pgmc.jl")
 export Static, VPG, BLPG, BLAPG, NPG, ANPG, BLANPG, reward
 export PolicyGradientEstimator, PolicyGradientUpdate
 
-# export Simulation, MonteCarloSimulation
-# export scheduler, run!
-
-
-
-
-# include("pgmc/gradients.jl")
-# include("pgmc/learning.jl")
-# include("pgmc/pgmc_simulation.jl")
-
-# export PolicyGradient, Static, VPG, BLPG, BLAPG, NPG, ANPG, BLANPG
-# export PolicyGuidedMonteCarloSimulation, GradientData, pgmc_estimate, reward
-
-
-
-
 end
diff --git a/src/pgmc/pgmc.jl b/src/pgmc/pgmc.jl
@@ -150,264 +150,4 @@ function write_algorithm(io, algorithm::PolicyGradientUpdate, scheduler)
     for (k, opt) in enumerate(algorithm.optimisers)
         println(io, "\t\t\tMove $k: " * replace(string(opt), r"\{[^\{\}]*\}" => ""))
     end
-end
-
-
-# if t == simulation.learning_scheduler[nl]
-#                 for (k, lid) in enumerate(simulation.learn_ids)
-#                     gd = average(simulation.gradients_data[k])
-#                     learning_step!(simulation.parameters_list[lid], gd, simulation.optimisers[lid])
-#                     simulation.gradients_data[k] = initialise_gradient_data(simulation.parameters_list[lid])
-#                 end
-#                 nl += 1
-#             end
-
-# @concrete mutable struct PolicyGuidedMonteCarloSimulation <: Simulation
-#     chains                  # Vector of independent systems
-#     pools                   # Vector of independent pools (one for each system)
-#     optimisers              # List of optimisers (one for each move)
-#     steps                   # Number of MC sweeps
-#     sampletimes             # Time steps at which we store data 
-#     sweepstep               # Number of mc steps per mc sweep
-#     learn_ids               # List of learnable moves
-#     q_batch_size            # Number of independent samples generated from proposal distributions
-#     sweeps_per_gradient     # Number of mc sweeps per gradient sampling
-#     sweeps_per_learning     # Number of mc sweeps per learning step
-#     sampling_scheduler      # Time steps at which we sample gradients
-#     learning_scheduler      # Time steps at which we update parameters
-#     policy_list             # List of policies (one for each move)
-#     parameters_list         # List of current parameters values (one array for each move)
-#     objectives              # Cache for estimated objective functions Ĵ (one for each move)
-#     gradients_data          # Gradient information (one for each move)
-#     chains_shadow           # Copy of chains (for Enzyme)
-#     ∇logqs_forward          # Preallocated forward gradients (one array for each move)
-#     ∇logqs_backward         # Preallocated backward gradients (one array for each move)
-#     ad_backend              # Backend for automatic differentiation (Enzyme or Zygote)
-#     path                    # Simulation path
-#     seed                    # Random number seed
-#     store_trajectory        # Flag to store trajectories at each measurement
-#     store_parameters        # Flag to store parameters at each measurement
-#     parallel                # Flag to parallelise over different threads
-#     verbose                 # Flag for verbose
-# end
-
-# function Simulation(
-#     chains,
-#     pools,
-#     optimisers,
-#     steps::Int;
-#     sampletimes::Vector{Int}=scheduler(steps, 0, 1),
-#     sweepstep::Int=1,
-#     q_batch_size::Int=1,
-#     sweeps_per_gradient::Int=1,
-#     sweeps_per_learning::Int=1,
-#     ad_backend::AD_Backend=Enzyme_Backend(),
-#     path::AbstractString="data",
-#     seed::Int=1,
-#     store_trajectory::Bool=false,
-#     store_parameters::Bool=false,
-#     parallel::Bool=false,
-#     verbose::Bool=false
-# )
-#     # Safety checks
-#     @assert length(chains) == length(pools)
-#     @assert all(k -> all(move -> move.parameters == getindex.(pools, k)[1].parameters, getindex.(pools, k)), eachindex(pools[1]))
-#     @assert all(k -> all(move -> move.policy == getindex.(pools, k)[1].policy, getindex.(pools, k)), eachindex(pools[1]))
-#     @assert all(k -> all(move -> move.weight == getindex.(pools, k)[1].weight, getindex.(pools, k)), eachindex(pools[1]))
-#     # Find learnable actions
-#     learn_ids = [k for k in eachindex(optimisers) if !isa(optimisers[k], Static)]
-#     # Define schedulers
-#     sampling_scheduler = scheduler(steps, sampletimes[1], sweeps_per_gradient)
-#     learning_scheduler = scheduler(steps, sampletimes[1], sweeps_per_learning)
-#     # Make sure that all policies and parameters across chains refer to the same objects
-#     policy_list = [move.policy for move in pools[1]]
-#     parameters_list = [move.parameters for move in pools[1]]
-#     for pool in pools
-#         for k in eachindex(policy_list)
-#             pool[k].policy = policy_list[k]
-#             pool[k].parameters = parameters_list[k]
-#         end
-#     end
-#     # Create objectives and gradients caches
-#     objectives = zeros(eltype(pools[1][1].parameters), length(learn_ids))
-#     gradients_data = map(k -> initialise_gradient_data(parameters_list[k]), learn_ids)
-#     # Create shadows for Enzyme
-#     chains_shadow = deepcopy(chains)
-#     ∇logqs_forward = map(zero, parameters_list)
-#     ∇logqs_backward = map(zero, parameters_list)
-#     # Return simulation
-#     return PolicyGuidedMonteCarloSimulation(chains, pools, optimisers, steps, sampletimes, sweepstep,
-#         learn_ids, q_batch_size, sweeps_per_gradient, sweeps_per_learning, sampling_scheduler, learning_scheduler,
-#         policy_list, parameters_list, objectives, gradients_data, chains_shadow, ∇logqs_forward, ∇logqs_backward, ad_backend,
-#         path, seed, store_trajectory, store_parameters, parallel, verbose)
-# end
-
-# function write_summary(simulation::PolicyGuidedMonteCarloSimulation, ::InitialiseSummary)
-#     open(joinpath(simulation.path, "summary.log"), "w") do file
-#         println(file, "POLICY-GUIDED MONTE CARLO SIMULATION")
-#         println(file)
-#         println(file, "System:")
-#         write_system(file, simulation.chains[1])
-#         println(file)
-#         println(file, "Moves:")
-#         for (k, move) in enumerate(simulation.pools[1])
-#             println(file, "\tMove $k:")
-#             println(file, "\t\tAction: " * replace(string(typeof(move.action)), r"\{.*" => ""))
-#             println(file, "\t\tPolicy: " * replace(string(typeof(move.policy)), r"\{.*" => ""))
-#             println(file, "\t\tParameters: " * write_parameters(move.policy, move.parameters))
-#             println(file, "\t\tWeight: $(move.weight)")
-#             println(file, "\t\tLearnable: $(!isa(simulation.optimisers[k], Static))")
-#             if !isa(simulation.optimisers[k], Static)
-#                 println(file, "\t\tOptimiser: " * replace(string(simulation.optimisers[k]), r"\{[^\{\}]*\}" => ""))
-#             end
-#         end
-#         println(file)
-#         println(file, "Simulation:")
-#         println(file, "\tSeed: $(simulation.seed)")
-#         println(file, "\tNumber of chains: $(length(simulation.chains))")
-#         println(file, "\tMC sweeps: $(simulation.steps)")
-#         println(file, "\tMC steps per MC sweep: $(simulation.sweepstep)")
-#         println(file, "\tBurn-in sweeps: $(simulation.sampletimes[1])")
-#         println(file, "\tNumber of measurements: $(length(simulation.sampletimes) - (simulation.sampletimes[end] > simulation.steps))")
-#         println(file, "\tMC sweeps per samplig step: $(simulation.sweeps_per_gradient)")
-#         println(file, "\tMC sweeps per learning step: $(simulation.sweeps_per_learning)")
-#         println(file, "\tQ batch size: $(simulation.q_batch_size)")
-#         println(file, "\tP batch size: $(Int(fld(simulation.sweeps_per_learning * length(simulation.chains), simulation.sweeps_per_gradient)))")
-#         println(file, "\tAD backend: $(typeof(simulation.ad_backend))")
-#         println(file, "\tStore trajectory: $(simulation.store_trajectory)")
-#         println(file, "\tStore parameters: $(simulation.store_trajectory)")
-#         println(file, "\tParallel: $(simulation.parallel)")
-#         if simulation.parallel
-#             println(file, "\tThreads: $(Threads.nthreads())")
-#         end
-#         println(file, "\tVerbose: $(simulation.verbose)")
-#     end
-# end
-
-# function save_data(trj_files, prms_files, cb_files, callbacks, t::Int, simulation::PolicyGuidedMonteCarloSimulation)
-#     simulation.store_trajectory && for c in eachindex(simulation.chains)
-#         store_trajectory(trj_files[c], simulation.chains[c], t)
-#     end
-#     simulation.store_parameters && for k in eachindex(simulation.learn_ids)
-#         println(prms_files[k], "$t $(collect(simulation.parameters_list[simulation.learn_ids[k]]))")
-#     end
-#     for k in eachindex(cb_files)
-#         println(cb_files[k], "$t $(callbacks[k](simulation))")
-#     end
-#     return nothing
-# end
-
-# function run!(simulation::PolicyGuidedMonteCarloSimulation, callbacks...)
-#     # INISIALISATION
-#     simulation.verbose && println("INISIALISATION")
-#     ## Define random number generator
-#     seeds = [simulation.seed + c - 1 for c in eachindex(simulation.chains)]
-#     rngs = [Xoshiro(s) for s in seeds]
-#     ## Define transducers reducer and collecter
-#     reducer = simulation.parallel ? Transducers.foldxt : Transducers.foldxl
-#     collecter = simulation.parallel ? Transducers.tcollect : collect
-#     ## Create simulation path
-#     mkpath(simulation.path)
-#     ## Initialise summary
-#     write_summary(simulation, InitialiseSummary())
-#     ## Burn initial configurations
-#     simulation.verbose && println("Burn-in...")
-#     burn_time = @elapsed collecter(
-#         eachindex(simulation.chains) |> Map(c -> begin
-#             for t in 1:simulation.sampletimes[1]
-#                 mc_sweep!(simulation.chains[c], simulation.pools[c], rngs[c]; mc_steps=simulation.sweepstep)
-#             end
-#         end)
-#     )
-#     simulation.verbose && println("Burn-in completed in $burn_time s")
-#     ## Update summary with burn-in time
-#     write_summary(simulation, UpdateBurnTime(burn_time))
-#     ## Create files for trajectories, parameters and callbacks
-#     simulation.verbose && println("Opening files...")
-#     trj_paths = joinpath.(simulation.path, "trajectories", ["$c" for c in eachindex(simulation.chains)])
-#     mkpath.(trj_paths)
-#     trj_files = simulation.store_trajectory ? open.(joinpath.(trj_paths, "trajectory.xyz"), "w") : nothing
-#     simulation.verbose && simulation.store_trajectory && println("$(length(trj_files)) trajectory files created")
-#     prms_paths = joinpath.(simulation.path, "parameters", ["$k" for k in simulation.learn_ids])
-#     simulation.store_parameters && mkpath.(prms_paths)
-#     prms_files = simulation.store_parameters ? open.(joinpath.(prms_paths, "parameters.dat"), "w") : nothing
-#     simulation.verbose && simulation.store_parameters && println("$(length(prms_files)) parameters files created")
-#     cb_paths = joinpath.(simulation.path, [replace(string(cb), "callback_" => "") * ".dat" for cb in callbacks])
-#     cb_files = open.(cb_paths, "w")
-#     simulation.verbose && println("$(length(cb_files)) callback files created")
-#     try
-#         ## Initial measurement
-#         save_data(trj_files, prms_files, cb_files, callbacks, simulation.sampletimes[1], simulation)
-#         ## Initialise schedulers 
-#         n, ns, nl = 2, 2, 2
-#         # MAIN LOOP
-#         simulation.verbose && println("RUN...")
-#         sim_time = @elapsed for t in simulation.sampletimes[1]+1:simulation.steps+simulation.sampletimes[1]
-#             ## When scheduled, sample gradient for each learnable move and add it to gradient data
-#             if t == simulation.sampling_scheduler[ns]
-#                 for (k, lid) in enumerate(simulation.learn_ids)
-#                     gd = reducer(+,
-#                         eachindex(simulation.chains) |> Map(c -> begin
-#                             1:simulation.q_batch_size |> Map(_ -> begin
-#                                 sample_gradient_data(
-#                                     simulation.pools[c][lid].action,
-#                                     simulation.policy_list[lid],
-#                                     simulation.parameters_list[lid],
-#                                     simulation.chains[c],
-#                                     rngs[c];
-#                                     ∇logq_forward=simulation.∇logqs_forward[lid],
-#                                     ∇logq_backward=simulation.∇logqs_backward[lid],
-#                                     shadow=simulation.chains_shadow[c],
-#                                     ad_backend=simulation.ad_backend
-#                                     )
-#                             end)
-#                         end) |> Cat()
-#                     )
-#                     simulation.gradients_data[k] = simulation.gradients_data[k] + gd
-#                     simulation.objectives[k] = simulation.gradients_data[k].j / simulation.gradients_data[k].n
-#                 end
-#                 ns += 1
-#             end
-#             ## When scheduled, average gradient and update parameters for each learnable move
-#             if t == simulation.learning_scheduler[nl]
-#                 for (k, lid) in enumerate(simulation.learn_ids)
-#                     gd = average(simulation.gradients_data[k])
-#                     learning_step!(simulation.parameters_list[lid], gd, simulation.optimisers[lid])
-#                     simulation.gradients_data[k] = initialise_gradient_data(simulation.parameters_list[lid])
-#                 end
-#                 nl += 1
-#             end
-#             ## One mc sweep for each chain
-#             collecter(
-#                 eachindex(simulation.chains) |> Map(c -> begin
-#                     mc_sweep!(simulation.chains[c], simulation.pools[c], rngs[c]; mc_steps=simulation.sweepstep)
-#                 end)
-#             )
-#             ## Save data when scheduled
-#             if t == simulation.sampletimes[n]
-#                 simulation.verbose && println("t = $t")
-#                 save_data(trj_files, prms_files, cb_files, callbacks, t, simulation)
-#                 n += 1
-#             end
-#         end
-#         ## Update summary
-#         simulation.verbose && println("Simulation completed in $sim_time s")
-#         write_summary(simulation, UpdateSimTime(sim_time))
-#     finally
-#         ## Make sure to close all files
-#         simulation.store_trajectory && close.(trj_files)
-#         simulation.store_parameters && close.(prms_files)
-#         close.(cb_files)
-#         # Save last snapshots
-#         for c in eachindex(simulation.chains)
-#             open(joinpath(trj_paths[c], "lastframe.xyz"), "w") do trj
-#                 store_trajectory(trj, simulation.chains[c], simulation.steps)
-#             end
-#         end
-#         ## Finalise
-#         simulation.verbose && println("DONE")
-#         write_summary(simulation, FinalReport())
-#     end
-# end
-
-# nothing
+end