cpp/8.8.1/mwt_8cc_source.html

 /*
 Copyright (c) by respective owners including Yahoo!, Microsoft, and
 individual contributors. All rights reserved.  Released under a BSD (revised)
 license as described in the file LICENSE.
  */
 #include "vw.h"
 #include "reductions.h"
 #include "gd.h"
 #include "cb_algs.h"
 #include "io_buf.h"

 using namespace LEARNER;
 using namespace CB_ALGS;
 using namespace VW::config;

 namespace MWT
 {
 struct policy_data
 {
   double cost;
   uint32_t action;
   bool seen;
 };

 struct mwt
 {
   bool namespaces[256];        // the set of namespaces to evaluate.
   v_array<policy_data> evals;  // accrued losses of features.
   CB::cb_class* observation;
   v_array<uint64_t> policies;
   double total;
   uint32_t num_classes;
   bool learn;

   v_array<namespace_index> indices;  // excluded namespaces
   features feature_space[256];
   vw* all;

   ~mwt()
   {
     evals.delete_v();
     policies.delete_v();
     for (auto& i : feature_space) i.delete_v();
     indices.delete_v();
   }
 };

 inline bool observed_cost(CB::cb_class* cl)
 {
   // cost observed for this action if it has non zero probability and cost != FLT_MAX
   if (cl != nullptr)
     if (cl->cost != FLT_MAX && cl->probability > .0)
       return true;
   return false;
 }

 CB::cb_class* get_observed_cost(CB::label& ld)
 {
   for (auto& cl : ld.costs)
     if (observed_cost(&cl))
       return &cl;
   return nullptr;
 }

 void value_policy(mwt& c, float val, uint64_t index)  // estimate the value of a single feature.
 {
   if (val < 0 || floor(val) != val)
     std::cout << "error " << val << " is not a valid action " << std::endl;

   uint32_t value = (uint32_t)val;
   uint64_t new_index = (index & c.all->weights.mask()) >> c.all->weights.stride_shift();

   if (!c.evals[new_index].seen)
   {
     c.evals[new_index].seen = true;
     c.policies.push_back(new_index);
   }

   c.evals[new_index].action = value;
 }

 template <bool learn, bool exclude, bool is_learn>
 void predict_or_learn(mwt& c, single_learner& base, example& ec)
 {
   c.observation = get_observed_cost(ec.l.cb);

   if (c.observation != nullptr)
   {
     c.total++;
     // For each nonzero feature in observed namespaces, check it's value.
     for (unsigned char ns : ec.indices)
       if (c.namespaces[ns])
         GD::foreach_feature<mwt, value_policy>(c.all, ec.feature_space[ns], c);
     for (uint64_t policy : c.policies)
     {
       c.evals[policy].cost += get_cost_estimate(c.observation, c.evals[policy].action);
       c.evals[policy].action = 0;
     }
   }
   if (exclude || learn)
   {
     c.indices.clear();
     uint32_t stride_shift = c.all->weights.stride_shift();
     uint64_t weight_mask = c.all->weights.mask();
     for (unsigned char ns : ec.indices)
       if (c.namespaces[ns])
       {
         c.indices.push_back(ns);
         if (learn)
         {
           c.feature_space[ns].clear();
           for (features::iterator& f : ec.feature_space[ns])
           {
             uint64_t new_index = ((f.index() & weight_mask) >> stride_shift) * c.num_classes + (uint64_t)f.value();
             c.feature_space[ns].push_back(1, new_index << stride_shift);
           }
         }
         std::swap(c.feature_space[ns], ec.feature_space[ns]);
       }
   }

   // modify the predictions to use a vector with a score for each evaluated feature.
   v_array<float> preds = ec.pred.scalars;

   if (learn)
   {
     if (is_learn)
       base.learn(ec);
     else
       base.predict(ec);
   }

   if (exclude || learn)
     while (!c.indices.empty())
     {
       unsigned char ns = c.indices.pop();
       std::swap(c.feature_space[ns], ec.feature_space[ns]);
     }

   // modify the predictions to use a vector with a score for each evaluated feature.
   preds.clear();
   if (learn)
     preds.push_back((float)ec.pred.multiclass);
   for (uint64_t index : c.policies) preds.push_back((float)c.evals[index].cost / (float)c.total);

   ec.pred.scalars = preds;
 }

 void print_scalars(int f, v_array<float>& scalars, v_array<char>& tag)
 {
   if (f >= 0)
   {
     std::stringstream ss;

     for (size_t i = 0; i < scalars.size(); i++)
     {
       if (i > 0)
         ss << ' ';
       ss << scalars[i];
     }
     for (size_t i = 0; i < tag.size(); i++)
     {
       if (i == 0)
         ss << ' ';
       ss << tag[i];
     }
     ss << '\n';
     ssize_t len = ss.str().size();
     ssize_t t = io_buf::write_file_or_socket(f, ss.str().c_str(), (unsigned int)len);
     if (t != len)
       std::cerr << "write error: " << strerror(errno) << std::endl;
   }
 }

 void finish_example(vw& all, mwt& c, example& ec)
 {
   float loss = 0.;
   if (c.learn)
     if (c.observation != nullptr)
       loss = get_cost_estimate(c.observation, (uint32_t)ec.pred.scalars[0]);
   all.sd->update(ec.test_only, c.observation != nullptr, loss, 1.f, ec.num_features);

   for (int sink : all.final_prediction_sink) print_scalars(sink, ec.pred.scalars, ec.tag);

   if (c.learn)
   {
     v_array<float> temp = ec.pred.scalars;
     ec.pred.multiclass = (uint32_t)temp[0];
     CB::print_update(all, c.observation != nullptr, ec, nullptr, false);
     ec.pred.scalars = temp;
   }
   VW::finish_example(all, ec);
 }

 void save_load(mwt& c, io_buf& model_file, bool read, bool text)
 {
   if (model_file.files.empty())
     return;

   std::stringstream msg;

   // total
   msg << "total: " << c.total;
   bin_text_read_write_fixed_validated(model_file, (char*)&c.total, sizeof(c.total), "", read, msg, text);

   // policies
   size_t policies_size = c.policies.size();
   bin_text_read_write_fixed_validated(model_file, (char*)&policies_size, sizeof(policies_size), "", read, msg, text);

   if (read)
   {
     c.policies.resize(policies_size);
     c.policies.end() = c.policies.begin() + policies_size;
   }
   else
   {
     msg << "policies: ";
     for (feature_index& policy : c.policies) msg << policy << " ";
   }

   bin_text_read_write_fixed_validated(
       model_file, (char*)c.policies.begin(), policies_size * sizeof(feature_index), "", read, msg, text);

   // c.evals is already initialized nicely to the same size as the regressor.
   for (feature_index& policy : c.policies)
   {
     policy_data& pd = c.evals[policy];
     if (read)
       msg << "evals: " << policy << ":" << pd.action << ":" << pd.cost << " ";
     bin_text_read_write_fixed_validated(model_file, (char*)&c.evals[policy], sizeof(policy_data), "", read, msg, text);
   }
 }
 }  // namespace MWT
 using namespace MWT;

 base_learner* mwt_setup(options_i& options, vw& all)
 {
   auto c = scoped_calloc_or_throw<mwt>();
   std::string s;
   bool exclude_eval = false;
   option_group_definition new_options("Multiworld Testing Options");
   new_options.add(make_option("multiworld_test", s).keep().help("Evaluate features as a policies"))
       .add(make_option("learn", c->num_classes).help("Do Contextual Bandit learning on <n> classes."))
       .add(make_option("exclude_eval", exclude_eval).help("Discard mwt policy features before learning"));
   options.add_and_parse(new_options);

   if (!options.was_supplied("multiworld_test"))
     return nullptr;

   for (char i : s) c->namespaces[(unsigned char)i] = true;
   c->all = &all;

   calloc_reserve(c->evals, all.length());
   c->evals.end() = c->evals.begin() + all.length();

   all.delete_prediction = delete_scalars;
   all.p->lp = CB::cb_label;
   all.label_type = label_type::cb;

   if (c->num_classes > 0)
   {
     c->learn = true;

     if (!options.was_supplied("cb"))
     {
       std::stringstream ss;
       ss << c->num_classes;
       options.insert("cb", ss.str());
     }
   }

   learner<mwt, example>* l;
   if (c->learn)
     if (exclude_eval)
       l = &init_learner(c, as_singleline(setup_base(options, all)), predict_or_learn<true, true, true>,
           predict_or_learn<true, true, false>, 1, prediction_type::scalars);
     else
       l = &init_learner(c, as_singleline(setup_base(options, all)), predict_or_learn<true, false, true>,
           predict_or_learn<true, false, false>, 1, prediction_type::scalars);
   else
     l = &init_learner(c, as_singleline(setup_base(options, all)), predict_or_learn<false, false, true>,
         predict_or_learn<false, false, false>, 1, prediction_type::scalars);

   l->set_save_load(save_load);
   l->set_finish_example(finish_example);
   return make_base(*l);
 }
MWT::mwt::all
vw * all
Definition: mwt.cc:37

v_array::resize
void resize(size_t length)
Definition: v_array.h:69

example::tag
v_array< char > tag
Definition: example.h:63

vw::length
size_t length()
Definition: global_data.h:513

example_predict::indices
v_array< namespace_index > indices
Definition: example_predict.h:40

polyprediction::multiclass
uint32_t multiclass
Definition: example.h:49

MWT::mwt::~mwt
~mwt()
Definition: mwt.cc:39

vw::weights
parameters weights
Definition: global_data.h:537

MWT::mwt::indices
v_array< namespace_index > indices
Definition: mwt.cc:35

LEARNER::learner::predict
void predict(E &ec, size_t i=0)
Definition: learner.h:169

vw::delete_prediction
void(* delete_prediction)(void *)
Definition: global_data.h:485

io_buf.h

v_array::pop
T pop()
Definition: v_array.h:58

stride_shift
uint64_t stride_shift(const stagewise_poly &poly, uint64_t idx)
Definition: stagewise_poly.cc:81

MWT::policy_data::action
uint32_t action
Definition: mwt.cc:21

features::push_back
void push_back(feature_value v, feature_index i)
Definition: feature_group.h:336

MWT::policy_data::cost
double cost
Definition: mwt.cc:20

MWT::print_scalars
void print_scalars(int f, v_array< float > &scalars, v_array< char > &tag)
Definition: mwt.cc:149

io_buf::write_file_or_socket
static ssize_t write_file_or_socket(int f, const void *buf, size_t nbytes)
Definition: io_buf.cc:140

gd.h

MWT::get_observed_cost
CB::cb_class * get_observed_cost(CB::label &ld)
Definition: mwt.cc:57

MWT::mwt::learn
bool learn
Definition: mwt.cc:33

polylabel::cb
CB::label cb
Definition: example.h:31

MWT::mwt::feature_space
features feature_space[256]
Definition: mwt.cc:36

vw::label_type
label_type::label_type_t label_type
Definition: global_data.h:550

vw::final_prediction_sink
v_array< int > final_prediction_sink
Definition: global_data.h:518

features
the core definition of a set of features.
Definition: feature_group.h:241

CB::label::costs
v_array< cb_class > costs
Definition: cb.h:27

MWT::mwt::policies
v_array< uint64_t > policies
Definition: mwt.cc:30

bin_text_read_write_fixed_validated
size_t bin_text_read_write_fixed_validated(io_buf &io, char *data, size_t len, const char *read_message, bool read, std::stringstream &msg, bool text)
Definition: io_buf.h:335

LEARNER::make_base
base_learner * make_base(learner< T, E > &base)
Definition: learner.h:462

VW::config::option_group_definition
Definition: options.h:85

MWT::mwt
Definition: mwt.cc:25

MWT::policy_data::seen
bool seen
Definition: mwt.cc:22

MWT::value_policy
void value_policy(mwt &c, float val, uint64_t index)
Definition: mwt.cc:65

VW::config::options_i::add_and_parse
virtual void add_and_parse(const option_group_definition &group)=0

LEARNER::learner::set_save_load
void set_save_load(void(*sl)(T &, io_buf &, bool, bool))
Definition: learner.h:257

loss
float loss(cbify &data, uint32_t label, uint32_t final_prediction)
Definition: cbify.cc:60

prediction_type::scalars
Definition: learner.h:21

CB_ALGS::get_cost_estimate
float get_cost_estimate(CB::cb_class *observation, uint32_t action, float offset=0.)
Definition: cb_algs.h:58

LEARNER::learner
Definition: cb_explore.h:11

v_array::begin
T *& begin()
Definition: v_array.h:42

v_array::size
size_t size() const
Definition: v_array.h:68

MWT::observed_cost
bool observed_cost(CB::cb_class *cl)
Definition: mwt.cc:48

vw
Definition: global_data.h:369

MWT::predict_or_learn
void predict_or_learn(mwt &c, single_learner &base, example &ec)
Definition: mwt.cc:83

vw::p
parser * p
Definition: global_data.h:377

example_predict::feature_space
std::array< features, NUM_NAMESPACES > feature_space
Definition: example_predict.h:41

CB::cb_class
Definition: cb.h:15

LEARNER::as_singleline
single_learner * as_singleline(learner< T, E > *l)
Definition: learner.h:476

CB::print_update
void print_update(vw &all, bool is_test, example &ec, multi_ex *ec_seq, bool action_scores)
Definition: cb.cc:180

LEARNER::learner::set_finish_example
void set_finish_example(void(*f)(vw &all, T &, E &))
Definition: learner.h:307

MWT::mwt::observation
CB::cb_class * observation
Definition: mwt.cc:29

MWT
Definition: mwt.cc:16

LEARNER::init_learner
learner< T, E > & init_learner(free_ptr< T > &dat, L *base, void(*learn)(T &, L &, E &), void(*predict)(T &, L &, E &), size_t ws, prediction_type::prediction_type_t pred_type)
Definition: learner.h:369

v_array::push_back
void push_back(const T &new_ele)
Definition: v_array.h:107

vw::sd
shared_data * sd
Definition: global_data.h:375

MWT::mwt::namespaces
bool namespaces[256]
Definition: mwt.cc:27

CB::cb_class::probability
float probability
Definition: cb.h:19

mwt_setup
base_learner * mwt_setup(options_i &options, vw &all)
Definition: mwt.cc:236

MWT::policy_data
Definition: mwt.cc:18

delete_scalars
void delete_scalars(void *v)
Definition: example.h:37

io_buf::files
v_array< int > files
Definition: io_buf.h:64

v_array::clear
void clear()
Definition: v_array.h:88

example::num_features
size_t num_features
Definition: example.h:67

VW::config::options_i::was_supplied
virtual bool was_supplied(const std::string &key)=0

CB_ALGS
Definition: cb_algs.cc:19

MWT::finish_example
void finish_example(vw &all, mwt &c, example &ec)
Definition: mwt.cc:175

VW::config::options_i
Definition: options.h:107

MWT::mwt::total
double total
Definition: mwt.cc:31

feature_index
uint64_t feature_index
Definition: feature_group.h:21

features::clear
void clear()
Definition: feature_group.h:296

example
Definition: example.h:54

calloc_reserve
void calloc_reserve(v_array< T > &v, size_t length)
Definition: v_array.h:220

io_buf
Definition: io_buf.h:54

VW::finish_example
void finish_example(vw &, example &)
Definition: parser.cc:881

reductions.h

v_array::end
T *& end()
Definition: v_array.h:43

VW::config::options_i::insert
virtual void insert(const std::string &key, const std::string &value)=0

shared_data::update
void update(bool test_example, bool labeled_example, float loss, float weight, size_t num_features)
Definition: global_data.h:190

VW::config::option_group_definition::add
option_group_definition & add(T &&op)
Definition: options.h:90

add
int add(svm_params &params, svm_example *fec)
Definition: kernel_svm.cc:546

features_value_index_iterator
iterator over values and indicies
Definition: feature_group.h:112

CB::cb_label
label_parser cb_label
Definition: cb.cc:167

VW::config
Definition: options.h:11

example::l
polylabel l
Definition: example.h:57

MWT::save_load
void save_load(mwt &c, io_buf &model_file, bool read, bool text)
Definition: mwt.cc:195

VW::config::make_option
typed_option< T > make_option(std::string name, T &location)
Definition: options.h:80

CB::label
Definition: cb.h:25

CB::cb_class::cost
float cost
Definition: cb.h:17

v_array::empty
bool empty() const
Definition: v_array.h:59

vw.h

parameters::stride_shift
uint32_t stride_shift()
Definition: array_parameters.h:244

setup_base
LEARNER::base_learner * setup_base(options_i &options, vw &all)
Definition: parse_args.cc:1222

label_type::cb
Definition: global_data.h:346

example::pred
polyprediction pred
Definition: example.h:60

LEARNER
Definition: cb_explore.h:8

v_array::delete_v
void delete_v()
Definition: v_array.h:98

cb_algs.h

LEARNER::learner::learn
void learn(E &ec, size_t i=0)
Definition: learner.h:160

MWT::mwt::evals
v_array< policy_data > evals
Definition: mwt.cc:28

learn
void learn(bfgs &b, base_learner &base, example &ec)
Definition: bfgs.cc:965

v_array
Definition: reductions_fwd.h:10

polyprediction::scalars
v_array< float > scalars
Definition: example.h:46

parameters::mask
uint64_t mask()
Definition: array_parameters.h:260

c
constexpr uint64_t c
Definition: rand48.cc:12

f
float f
Definition: cache.cc:40

parser::lp
label_parser lp
Definition: parser.h:102

MWT::mwt::num_classes
uint32_t num_classes
Definition: mwt.cc:32

example::test_only
bool test_only
Definition: example.h:76