cpp/8.8.1/expreplay_8h_source.html

 #pragma once
 #include "learner.h"
 #include "vw.h"
 #include "parse_args.h"
 #include "rand48.h"
 #include <memory>

 namespace ExpReplay
 {
 template <label_parser& lp>
 struct expreplay
 {
   vw* all;
   std::shared_ptr<rand_state> _random_state;
   size_t N;             // how big is the buffer?
   example* buf;         // the deep copies of examples (N of them)
   bool* filled;         // which of buf[] is filled
   size_t replay_count;  // each time er.learn() is called, how many times do we call base.learn()? default=1 (in which
                         // case we're just permuting)
   LEARNER::single_learner* base;

   ~expreplay()
   {
     for (size_t n = 0; n < N; n++)
     {
       lp.delete_label(&buf[n].l);
       VW::dealloc_example(NULL, buf[n], NULL);  // TODO: need to free label
     }
     free(buf);
     free(filled);
   }
 };

 template <bool is_learn, label_parser& lp>
 void predict_or_learn(expreplay<lp>& er, LEARNER::single_learner& base, example& ec)
 {  // regardless of what happens, we must predict
   base.predict(ec);
   // if we're not learning, that's all that has to happen
   if (!is_learn || lp.get_weight(&ec.l) == 0.)
     return;

   for (size_t replay = 1; replay < er.replay_count; replay++)
   {
     size_t n = (size_t)(er._random_state->get_and_update_random() * (float)er.N);
     if (er.filled[n])
       base.learn(er.buf[n]);
   }

   size_t n = (size_t)(er._random_state->get_and_update_random() * (float)er.N);
   if (er.filled[n])
     base.learn(er.buf[n]);

   er.filled[n] = true;
   VW::copy_example_data(er.all->audit, &er.buf[n], &ec);  // don't copy the label
   if (lp.copy_label)
     lp.copy_label(&er.buf[n].l, &ec.l);
   else
     er.buf[n].l = ec.l;
 }

 template <label_parser& lp>
 void multipredict(expreplay<lp>&, LEARNER::single_learner& base, example& ec, size_t count, size_t step,
     polyprediction* pred, bool finalize_predictions)
 {
   base.multipredict(ec, count, step, pred, finalize_predictions);
 }

 template <label_parser& lp>
 void end_pass(expreplay<lp>& er)
 {  // we need to go through and learn on everyone who remains
   // also need to clean up remaining examples
   for (size_t n = 0; n < er.N; n++)
     if (er.filled[n])
     {  // TODO: if er.replay_count > 1 do we need to play these more?
       er.base->learn(er.buf[n]);
       er.filled[n] = false;
     }
 }

 template <char er_level, label_parser& lp>
 LEARNER::base_learner* expreplay_setup(VW::config::options_i& options, vw& all)
 {
   std::string replay_string = "replay_";
   replay_string += er_level;
   std::string replay_count_string = replay_string;
   replay_count_string += "_count";

   auto er = scoped_calloc_or_throw<expreplay<lp>>();
   VW::config::option_group_definition new_options("Experience Replay");
   new_options
       .add(VW::config::make_option(replay_string, er->N)
                .keep()
                .help("use experience replay at a specified level [b=classification/regression, m=multiclass, c=cost "
                      "sensitive] with specified buffer size"))
       .add(VW::config::make_option(replay_count_string, er->replay_count)
                .default_value(1)
                .help("how many times (in expectation) should each example be played (default: 1 = permuting)"));
   options.add_and_parse(new_options);

   if (!options.was_supplied(replay_string) || er->N == 0)
     return nullptr;

   er->all = &all;
   er->_random_state = all.get_random_state();
   er->buf = VW::alloc_examples(1, er->N);
   er->buf->interactions = &all.interactions;

   if (er_level == 'c')
     for (size_t n = 0; n < er->N; n++) er->buf[n].l.cs.costs = v_init<COST_SENSITIVE::wclass>();

   er->filled = calloc_or_throw<bool>(er->N);

   if (!all.quiet)
     std::cerr << "experience replay level=" << er_level << ", buffer=" << er->N << ", replay count=" << er->replay_count
               << std::endl;

   er->base = LEARNER::as_singleline(setup_base(options, all));
   LEARNER::learner<expreplay<lp>, example>* l =
       &init_learner(er, er->base, predict_or_learn<true, lp>, predict_or_learn<false, lp>);
   l->set_end_pass(end_pass<lp>);

   return make_base(*l);
 }
 }  // namespace ExpReplay
LEARNER::learner::predict
void predict(E &ec, size_t i=0)
Definition: learner.h:169

ExpReplay::end_pass
void end_pass(expreplay< lp > &er)
Definition: expreplay.h:69

ExpReplay::predict_or_learn
void predict_or_learn(expreplay< lp > &er, LEARNER::single_learner &base, example &ec)
Definition: expreplay.h:35

ExpReplay::expreplay::buf
example * buf
Definition: expreplay.h:16

VW::copy_example_data
void copy_example_data(bool audit, example *dst, example *src)
Definition: example.cc:72

ExpReplay::expreplay::_random_state
std::shared_ptr< rand_state > _random_state
Definition: expreplay.h:14

VW::dealloc_example
void dealloc_example(void(*delete_label)(void *), example &ec, void(*delete_prediction)(void *))
Definition: example.cc:219

ExpReplay::expreplay::N
size_t N
Definition: expreplay.h:15

LEARNER::make_base
base_learner * make_base(learner< T, E > &base)
Definition: learner.h:462

VW::config::option_group_definition
Definition: options.h:85

vw::quiet
bool quiet
Definition: global_data.h:487

VW::config::options_i::add_and_parse
virtual void add_and_parse(const option_group_definition &group)=0

LEARNER::learner
Definition: cb_explore.h:11

ExpReplay::expreplay::replay_count
size_t replay_count
Definition: expreplay.h:18

VW::alloc_examples
example * alloc_examples(size_t, size_t count=1)
Definition: example.cc:204

vw
Definition: global_data.h:369

vw::get_random_state
std::shared_ptr< rand_state > get_random_state()
Definition: global_data.h:553

LEARNER::as_singleline
single_learner * as_singleline(learner< T, E > *l)
Definition: learner.h:476

ExpReplay::expreplay::~expreplay
~expreplay()
Definition: expreplay.h:22

ExpReplay
Definition: expreplay.h:8

LEARNER::init_learner
learner< T, E > & init_learner(free_ptr< T > &dat, L *base, void(*learn)(T &, L &, E &), void(*predict)(T &, L &, E &), size_t ws, prediction_type::prediction_type_t pred_type)
Definition: learner.h:369

polyprediction
Definition: example.h:43

VW::config::options_i::was_supplied
virtual bool was_supplied(const std::string &key)=0

VW::config::options_i
Definition: options.h:107

rand48.h

example
Definition: example.h:54

ExpReplay::expreplay_setup
LEARNER::base_learner * expreplay_setup(VW::config::options_i &options, vw &all)
Definition: expreplay.h:81

ExpReplay::expreplay
Definition: expreplay.h:11

add
int add(svm_params &params, svm_example *fec)
Definition: kernel_svm.cc:546

example::l
polylabel l
Definition: example.h:57

VW::config::make_option
typed_option< T > make_option(std::string name, T &location)
Definition: options.h:80

ExpReplay::expreplay::filled
bool * filled
Definition: expreplay.h:17

learner.h

LEARNER::learner::set_end_pass
void set_end_pass(void(*f)(T &))
Definition: learner.h:286

vw.h

vw::interactions
std::vector< std::string > interactions
Definition: global_data.h:457

LEARNER::learner::multipredict
void multipredict(E &ec, size_t lo, size_t count, polyprediction *pred, bool finalize_predictions)
Definition: learner.h:178

vw::audit
bool audit
Definition: global_data.h:486

setup_base
LEARNER::base_learner * setup_base(options_i &options, vw &all)
Definition: parse_args.cc:1222

LEARNER::learner::learn
void learn(E &ec, size_t i=0)
Definition: learner.h:160

ExpReplay::expreplay::base
LEARNER::single_learner * base
Definition: expreplay.h:20

parse_args.h

ExpReplay::expreplay::all
vw * all
Definition: expreplay.h:13

ExpReplay::multipredict
void multipredict(expreplay< lp > &, LEARNER::single_learner &base, example &ec, size_t count, size_t step, polyprediction *pred, bool finalize_predictions)
Definition: expreplay.h:62