cpp/8.8.1/active_8cc_source.html

 #include <cerrno>
 #include "reductions.h"
 #include "rand48.h"
 #include <cfloat>
 #include "vw.h"
 #include "active.h"
 #include "vw_exception.h"

 using namespace LEARNER;
 using namespace VW::config;

 float get_active_coin_bias(float k, float avg_loss, float g, float c0)
 {
   float b, sb, rs, sl;
   b = (float)(c0 * (log(k + 1.) + 0.0001) / (k + 0.0001));
   sb = std::sqrt(b);
   avg_loss = std::min(1.f, std::max(0.f, avg_loss));  // loss should be in [0,1]

   sl = std::sqrt(avg_loss) + std::sqrt(avg_loss + g);
   if (g <= sb * sl + b)
     return 1;
   rs = (sl + std::sqrt(sl * sl + 4 * g)) / (2 * g);
   return b * rs * rs;
 }

 float query_decision(active& a, float ec_revert_weight, float k)
 {
   float bias, avg_loss, weighted_queries;
   if (k <= 1.)
     bias = 1.;
   else
   {
     weighted_queries = (float)a.all->sd->weighted_labeled_examples;
     avg_loss = (float)(a.all->sd->sum_loss / k + std::sqrt((1. + 0.5 * log(k)) / (weighted_queries + 0.0001)));
     bias = get_active_coin_bias(k, avg_loss, ec_revert_weight / k, a.active_c0);
   }
   if (a._random_state->get_and_update_random() < bias)
     return 1.f / bias;
   else
     return -1.;
 }

 template <bool is_learn>
 void predict_or_learn_simulation(active& a, single_learner& base, example& ec)
 {
   base.predict(ec);

   if (is_learn)
   {
     vw& all = *a.all;

     float k = (float)all.sd->t;
     float threshold = 0.f;

     ec.confidence = fabsf(ec.pred.scalar - threshold) / base.sensitivity(ec);
     float importance = query_decision(a, ec.confidence, k);

     if (importance > 0)
     {
       all.sd->queries += 1;
       ec.weight *= importance;
       base.learn(ec);
     }
     else
     {
       ec.l.simple.label = FLT_MAX;
       ec.weight = 0.f;
     }
   }
 }

 template <bool is_learn>
 void predict_or_learn_active(active& a, single_learner& base, example& ec)
 {
   if (is_learn)
     base.learn(ec);
   else
     base.predict(ec);

   if (ec.l.simple.label == FLT_MAX)
   {
     float threshold = (a.all->sd->max_label + a.all->sd->min_label) * 0.5f;
     ec.confidence = fabsf(ec.pred.scalar - threshold) / base.sensitivity(ec);
   }
 }

 void active_print_result(int f, float res, float weight, v_array<char> tag)
 {
   if (f >= 0)
   {
     std::stringstream ss;
     ss << std::fixed << res;
     if (!print_tag(ss, tag))
       ss << ' ';
     if (weight >= 0)
       ss << " " << std::fixed << weight;
     ss << '\n';
     ssize_t len = ss.str().size();
     ssize_t t = io_buf::write_file_or_socket(f, ss.str().c_str(), (unsigned int)len);
     if (t != len)
       std::cerr << "write error: " << strerror(errno) << std::endl;
   }
 }

 void output_and_account_example(vw& all, active& a, example& ec)
 {
   label_data& ld = ec.l.simple;

   all.sd->update(ec.test_only, ld.label != FLT_MAX, ec.loss, ec.weight, ec.num_features);
   if (ld.label != FLT_MAX && !ec.test_only)
     all.sd->weighted_labels += ((double)ld.label) * ec.weight;
   all.sd->weighted_unlabeled_examples += ld.label == FLT_MAX ? ec.weight : 0;

   float ai = -1;
   if (ld.label == FLT_MAX)
     ai = query_decision(a, ec.confidence, (float)all.sd->weighted_unlabeled_examples);

   all.print(all.raw_prediction, ec.partial_prediction, -1, ec.tag);
   for (auto i : all.final_prediction_sink)
   {
     active_print_result(i, ec.pred.scalar, ai, ec.tag);
   }

   print_update(all, ec);
 }

 void return_active_example(vw& all, active& a, example& ec)
 {
   output_and_account_example(all, a, ec);
   VW::finish_example(all, ec);
 }

 base_learner* active_setup(options_i& options, vw& all)
 {
   auto data = scoped_calloc_or_throw<active>();

   bool active_option = false;
   bool simulation = false;
   option_group_definition new_options("Active Learning");
   new_options.add(make_option("active", active_option).keep().help("enable active learning"))
       .add(make_option("simulation", simulation).help("active learning simulation mode"))
       .add(make_option("mellowness", data->active_c0)
                .default_value(8.f)
                .help("active learning mellowness parameter c_0. Default 8"));
   options.add_and_parse(new_options);

   if (!active_option)
     return nullptr;

   data->all = &all;
   data->_random_state = all.get_random_state();

   if (options.was_supplied("lda"))
     THROW("error: you can't combine lda and active learning");

   auto base = as_singleline(setup_base(options, all));

   // Create new learner
   learner<active, example>* l;
   if (options.was_supplied("simulation"))
     l = &init_learner(data, base, predict_or_learn_simulation<true>, predict_or_learn_simulation<false>);
   else
   {
     all.active = true;
     l = &init_learner(data, base, predict_or_learn_active<true>, predict_or_learn_active<false>);
     l->set_finish_example(return_active_example);
   }

   return make_base(*l);
 }
shared_data::sum_loss
double sum_loss
Definition: global_data.h:145

example::tag
v_array< char > tag
Definition: example.h:63

vw::raw_prediction
int raw_prediction
Definition: global_data.h:519

active::_random_state
std::shared_ptr< rand_state > _random_state
Definition: active.h:10

active::all
vw * all
Definition: active.h:9

LEARNER::learner::predict
void predict(E &ec, size_t i=0)
Definition: learner.h:169

active
Definition: active.h:6

return_active_example
void return_active_example(vw &all, active &a, example &ec)
Definition: active.cc:127

polyprediction::scalar
float scalar
Definition: example.h:45

shared_data::weighted_unlabeled_examples
double weighted_unlabeled_examples
Definition: global_data.h:143

io_buf::write_file_or_socket
static ssize_t write_file_or_socket(int f, const void *buf, size_t nbytes)
Definition: io_buf.cc:140

output_and_account_example
void output_and_account_example(vw &all, active &a, example &ec)
Definition: active.cc:105

query_decision
float query_decision(active &a, float ec_revert_weight, float k)
Definition: active.cc:26

vw::final_prediction_sink
v_array< int > final_prediction_sink
Definition: global_data.h:518

LEARNER::make_base
base_learner * make_base(learner< T, E > &base)
Definition: learner.h:462

VW::config::option_group_definition
Definition: options.h:85

example::confidence
float confidence
Definition: example.h:72

example::partial_prediction
float partial_prediction
Definition: example.h:68

print_tag
int print_tag(std::stringstream &ss, v_array< char > tag)
Definition: global_data.cc:81

VW::config::options_i::add_and_parse
virtual void add_and_parse(const option_group_definition &group)=0

label_data::label
float label
Definition: simple_label.h:14

polylabel::simple
label_data simple
Definition: example.h:28

LEARNER::learner
Definition: cb_explore.h:11

active_print_result
void active_print_result(int f, float res, float weight, v_array< char > tag)
Definition: active.cc:87

vw_exception.h

vw
Definition: global_data.h:369

predict_or_learn_simulation
void predict_or_learn_simulation(active &a, single_learner &base, example &ec)
Definition: active.cc:44

vw::get_random_state
std::shared_ptr< rand_state > get_random_state()
Definition: global_data.h:553

LEARNER::as_singleline
single_learner * as_singleline(learner< T, E > *l)
Definition: learner.h:476

CB::print_update
void print_update(vw &all, bool is_test, example &ec, multi_ex *ec_seq, bool action_scores)
Definition: cb.cc:180

active_setup
base_learner * active_setup(options_i &options, vw &all)
Definition: active.cc:133

LEARNER::learner::set_finish_example
void set_finish_example(void(*f)(vw &all, T &, E &))
Definition: learner.h:307

LEARNER::init_learner
learner< T, E > & init_learner(free_ptr< T > &dat, L *base, void(*learn)(T &, L &, E &), void(*predict)(T &, L &, E &), size_t ws, prediction_type::prediction_type_t pred_type)
Definition: learner.h:369

vw::sd
shared_data * sd
Definition: global_data.h:375

get_active_coin_bias
float get_active_coin_bias(float k, float avg_loss, float g, float c0)
Definition: active.cc:12

label_data
Definition: simple_label.h:12

vw::active
bool active
Definition: global_data.h:489

example::num_features
size_t num_features
Definition: example.h:67

VW::config::options_i::was_supplied
virtual bool was_supplied(const std::string &key)=0

shared_data::t
double t
Definition: global_data.h:140

VW::config::options_i
Definition: options.h:107

shared_data::weighted_labels
double weighted_labels
Definition: global_data.h:144

rand48.h

example
Definition: example.h:54

active::active_c0
float active_c0
Definition: active.h:8

VW::finish_example
void finish_example(vw &, example &)
Definition: parser.cc:881

reductions.h

shared_data::update
void update(bool test_example, bool labeled_example, float loss, float weight, size_t num_features)
Definition: global_data.h:190

example::loss
float loss
Definition: example.h:70

LEARNER::learner::sensitivity
float sensitivity(example &ec, size_t i=0)
Definition: learner.h:242

weight
float weight
Definition: array_parameters_dense.h:6

VW::config::option_group_definition::add
option_group_definition & add(T &&op)
Definition: options.h:90

VW::config
Definition: options.h:11

example::l
polylabel l
Definition: example.h:57

a
constexpr uint64_t a
Definition: rand48.cc:11

VW::config::make_option
typed_option< T > make_option(std::string name, T &location)
Definition: options.h:80

shared_data::min_label
float min_label
Definition: global_data.h:150

vw.h

shared_data::max_label
float max_label
Definition: global_data.h:151

shared_data::weighted_labeled_examples
double weighted_labeled_examples
Definition: global_data.h:141

setup_base
LEARNER::base_learner * setup_base(options_i &options, vw &all)
Definition: parse_args.cc:1222

predict_or_learn_active
void predict_or_learn_active(active &a, single_learner &base, example &ec)
Definition: active.cc:73

example::pred
polyprediction pred
Definition: example.h:60

LEARNER
Definition: cb_explore.h:8

active.h

LEARNER::learner::learn
void learn(E &ec, size_t i=0)
Definition: learner.h:160

example::weight
float weight
Definition: example.h:62

v_array< char >

bias
constexpr int bias
Definition: rand48.cc:14

THROW
#define THROW(args)
Definition: vw_exception.h:181

shared_data::queries
size_t queries
Definition: global_data.h:135

vw::print
void(* print)(int, float, float, v_array< char >)
Definition: global_data.h:521

f
float f
Definition: cache.cc:40

example::test_only
bool test_only
Definition: example.h:76