Nth-iteration-labs
diff --git a/‎R/policy_cmab_lin_ucb_disjoint.R‎
Lines changed: 4 additions & 0 deletions b/‎R/policy_cmab_lin_ucb_disjoint.R‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎R/policy_cmab_lin_ucb_disjoint_optimized.R‎
Lines changed: 4 additions & 0 deletions b/‎R/policy_cmab_lin_ucb_disjoint_optimized.R‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎R/policy_cmab_lin_ucb_hybrid.R‎
Lines changed: 4 additions & 0 deletions b/‎R/policy_cmab_lin_ucb_hybrid.R‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎R/policy_cmab_lin_ucb_hybrid_optimized.R‎
Lines changed: 4 additions & 0 deletions b/‎R/policy_cmab_lin_ucb_hybrid_optimized.R‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎docs/404.html‎
Lines changed: 215 additions & 0 deletions b/‎docs/404.html‎
Lines changed: 215 additions & 0 deletions
@@ -51,6 +51,10 @@ LinUCBDisjointPolicy <- R6::R6Class(
 
 #' Policy: LinUCB with unique linear models
 #'
+#' LinUCBDisjointPolicy is an R implementation of
+#' "Algorithm 1 LinUCB" from Li (2010) "A contextual-bandit approach to
+#' personalized news article recommendation.".
+#'
 #' Each time step t, \code{LinUCBDisjointPolicy} runs a linear regression per arm that produces coefficients
 #' for each context feature \code{d}.
 #' Next,  \code{LinUCBDisjointPolicy} observes the new context, and generates a predicted payoff or reward
 
@@ -50,6 +50,10 @@ LinUCBDisjointOptimizedPolicy <- R6::R6Class(
 
 #' Policy: LinUCB with unique linear models
 #'
+#' LinUCBDisjointOptimizedPolicy is an optimized R implementation of
+#' "Algorithm 1 LinUCB" from Li (2010) "A contextual-bandit approach to
+#' personalized news article recommendation.".
+#'
 #' Each time step t, \code{LinUCBDisjointPolicy} runs a linear regression per arm that produces coefficients
 #' for each context feature \code{d}.
 #' Next,  \code{LinUCBDisjointPolicy} observes the new context, and generates a predicted payoff or reward
 
@@ -115,6 +115,10 @@ LinUCBHybridPolicy <- R6::R6Class(
 
 #' Policy: LinUCB with hybrid linear models
 #'
+#' LinUCBHybridPolicy is an R implementation of
+#' "Algorithm 2 LinUCB" from Li (2010) "A contextual-bandit approach to
+#' personalized news article recommendation.".
+#'
 #' Each time step t, \code{LinUCBHybridOptimizedPolicy} runs a linear regression per arm that produces
 #' coefficients for each context feature \code{d}. Next, it observes the new context, and generates a
 #' predicted payoff or reward together with a confidence interval for each available arm. It then proceeds
 
@@ -119,6 +119,10 @@ LinUCBHybridOptimizedPolicy <- R6::R6Class(
 
 #' Policy: LinUCB with hybrid linear models
 #'
+#' LinUCBHybridOptimizedPolicy is an optimized R implementation of
+#' "Algorithm 2 LinUCB" from Li (2010) "A contextual-bandit approach to
+#' personalized news article recommendation.".
+#'
 #' Each time step t, \code{LinUCBHybridOptimizedPolicy} runs a linear regression per arm that produces
 #' coefficients for each context feature \code{d}. Next, it observes the new context, and generates a
 #' predicted payoff or reward together with a confidence interval for each available arm. It then proceeds