cpp/8.8.1/nn_8cc_source.html

 /*
 Copyright (c) by respective owners including Yahoo!, Microsoft, and
 individual contributors. All rights reserved.  Released under a BSD (revised)
 license as described in the file LICENSE.
  */
 #include <cfloat>
 #include <cmath>
 #include <cstdio>
 #include <sstream>
 #include <memory>

 #include "reductions.h"
 #include "rand48.h"
 #include "gd.h"
 #include "vw.h"

 using namespace LEARNER;
 using namespace VW::config;

 constexpr float hidden_min_activation = -3;
 constexpr float hidden_max_activation = 3;
 constexpr uint64_t nn_constant = 533357803;

 struct nn
 {
   uint32_t k;
   loss_function* squared_loss;
   example output_layer;
   example hiddenbias;
   example outputweight;
   float prediction;
   size_t increment;
   bool dropout;
   uint64_t xsubi;
   uint64_t save_xsubi;
   bool inpass;
   bool finished_setup;
   bool multitask;

   float* hidden_units;
   bool* dropped_out;

   polyprediction* hidden_units_pred;
   polyprediction* hiddenbias_pred;

   vw* all;  // many things
   std::shared_ptr<rand_state> _random_state;

   ~nn()
   {
     delete squared_loss;
     free(hidden_units);
     free(dropped_out);
     free(hidden_units_pred);
     free(hiddenbias_pred);
     VW::dealloc_example(nullptr, output_layer);
     VW::dealloc_example(nullptr, hiddenbias);
     VW::dealloc_example(nullptr, outputweight);
   }
 };

 #define cast_uint32_t static_cast<uint32_t>

 static inline float fastpow2(float p)
 {
   float offset = (p < 0) ? 1.0f : 0.0f;
   float clipp = (p < -126) ? -126.0f : p;
   int w = (int)clipp;
   float z = clipp - w + offset;
   union
   {
     uint32_t i;
     float f;
   } v = {cast_uint32_t((1 << 23) * (clipp + 121.2740575f + 27.7280233f / (4.84252568f - z) - 1.49012907f * z))};

   return v.f;
 }

 static inline float fastexp(float p) { return fastpow2(1.442695040f * p); }

 static inline float fasttanh(float p) { return -1.0f + 2.0f / (1.0f + fastexp(-2.0f * p)); }

 void finish_setup(nn& n, vw& all)
 {
   // TODO: output_layer audit

   memset(&n.output_layer, 0, sizeof(n.output_layer));
   n.output_layer.interactions = &all.interactions;
   n.output_layer.indices.push_back(nn_output_namespace);
   uint64_t nn_index = nn_constant << all.weights.stride_shift();

   features& fs = n.output_layer.feature_space[nn_output_namespace];
   for (unsigned int i = 0; i < n.k; ++i)
   {
     fs.push_back(1., nn_index);
     if (all.audit || all.hash_inv)
     {
       std::stringstream ss;
       ss << "OutputLayer" << i;
       fs.space_names.push_back(audit_strings_ptr(new audit_strings("", ss.str())));
     }
     nn_index += (uint64_t)n.increment;
   }
   n.output_layer.num_features += n.k;

   if (!n.inpass)
   {
     fs.push_back(1., nn_index);
     if (all.audit || all.hash_inv)
       fs.space_names.push_back(audit_strings_ptr(new audit_strings("", "OutputLayerConst")));
     ++n.output_layer.num_features;
   }

   n.output_layer.in_use = true;

   // TODO: not correct if --noconstant
   memset(&n.hiddenbias, 0, sizeof(n.hiddenbias));
   n.hiddenbias.interactions = &all.interactions;
   n.hiddenbias.indices.push_back(constant_namespace);
   n.hiddenbias.feature_space[constant_namespace].push_back(1, (uint64_t)constant);
   if (all.audit || all.hash_inv)
     n.hiddenbias.feature_space[constant_namespace].space_names.push_back(
         audit_strings_ptr(new audit_strings("", "HiddenBias")));
   n.hiddenbias.total_sum_feat_sq++;
   n.hiddenbias.l.simple.label = FLT_MAX;
   n.hiddenbias.weight = 1;
   n.hiddenbias.in_use = true;

   memset(&n.outputweight, 0, sizeof(n.outputweight));
   n.outputweight.interactions = &all.interactions;
   n.outputweight.indices.push_back(nn_output_namespace);
   features& outfs = n.output_layer.feature_space[nn_output_namespace];
   n.outputweight.feature_space[nn_output_namespace].push_back(outfs.values[0], outfs.indicies[0]);
   if (all.audit || all.hash_inv)
     n.outputweight.feature_space[nn_output_namespace].space_names.push_back(
         audit_strings_ptr(new audit_strings("", "OutputWeight")));
   n.outputweight.feature_space[nn_output_namespace].values[0] = 1;
   n.outputweight.total_sum_feat_sq++;
   n.outputweight.l.simple.label = FLT_MAX;
   n.outputweight.weight = 1;
   n.outputweight.in_use = true;

   n.finished_setup = true;
 }

 void end_pass(nn& n)
 {
   if (n.all->bfgs)
     n.xsubi = n.save_xsubi;
 }

 template <bool is_learn, bool recompute_hidden>
 void predict_or_learn_multi(nn& n, single_learner& base, example& ec)
 {
   bool shouldOutput = n.all->raw_prediction > 0;
   if (!n.finished_setup)
     finish_setup(n, *(n.all));
   shared_data sd;
   memcpy(&sd, n.all->sd, sizeof(shared_data));
   shared_data* save_sd = n.all->sd;
   n.all->sd = &sd;

   label_data ld = ec.l.simple;
   void (*save_set_minmax)(shared_data*, float) = n.all->set_minmax;
   float save_min_label;
   float save_max_label;
   float dropscale = n.dropout ? 2.0f : 1.0f;
   loss_function* save_loss = n.all->loss;

   polyprediction* hidden_units = n.hidden_units_pred;
   polyprediction* hiddenbias_pred = n.hiddenbias_pred;
   bool* dropped_out = n.dropped_out;

   std::ostringstream outputStringStream;

   n.all->set_minmax = noop_mm;
   n.all->loss = n.squared_loss;
   save_min_label = n.all->sd->min_label;
   n.all->sd->min_label = hidden_min_activation;
   save_max_label = n.all->sd->max_label;
   n.all->sd->max_label = hidden_max_activation;

   uint64_t save_ft_offset = ec.ft_offset;

   if (n.multitask)
     ec.ft_offset = 0;

   n.hiddenbias.ft_offset = ec.ft_offset;

   if (recompute_hidden)
   {
     base.multipredict(n.hiddenbias, 0, n.k, hiddenbias_pred, true);

     for (unsigned int i = 0; i < n.k; ++i)
       // avoid saddle point at 0
       if (hiddenbias_pred[i].scalar == 0)
       {
         n.hiddenbias.l.simple.label = (float)(n._random_state->get_and_update_random() - 0.5);
         base.learn(n.hiddenbias, i);
         n.hiddenbias.l.simple.label = FLT_MAX;
       }

     base.multipredict(ec, 0, n.k, hidden_units, true);

     for (unsigned int i = 0; i < n.k; ++i) dropped_out[i] = (n.dropout && merand48(n.xsubi) < 0.5);

     if (ec.passthrough)
       for (unsigned int i = 0; i < n.k; ++i)
       {
         add_passthrough_feature(ec, i * 2, hiddenbias_pred[i].scalar);
         add_passthrough_feature(ec, i * 2 + 1, hidden_units[i].scalar);
       }
   }

   if (shouldOutput)
     for (unsigned int i = 0; i < n.k; ++i)
     {
       if (i > 0)
         outputStringStream << ' ';
       outputStringStream << i << ':' << hidden_units[i].scalar << ','
                          << fasttanh(hidden_units[i].scalar);  // TODO: huh, what was going on here?
     }

   n.all->loss = save_loss;
   n.all->set_minmax = save_set_minmax;
   n.all->sd->min_label = save_min_label;
   n.all->sd->max_label = save_max_label;
   ec.ft_offset = save_ft_offset;

   bool converse = false;
   float save_partial_prediction = 0;
   float save_final_prediction = 0;
   float save_ec_loss = 0;

 CONVERSE:  // That's right, I'm using goto.  So sue me.

   n.output_layer.total_sum_feat_sq = 1;
   n.output_layer.feature_space[nn_output_namespace].sum_feat_sq = 1;

   n.outputweight.ft_offset = ec.ft_offset;

   n.all->set_minmax = noop_mm;
   n.all->loss = n.squared_loss;
   save_min_label = n.all->sd->min_label;
   n.all->sd->min_label = -1;
   save_max_label = n.all->sd->max_label;
   n.all->sd->max_label = 1;

   for (unsigned int i = 0; i < n.k; ++i)
   {
     float sigmah = (dropped_out[i]) ? 0.0f : dropscale * fasttanh(hidden_units[i].scalar);
     features& out_fs = n.output_layer.feature_space[nn_output_namespace];
     out_fs.values[i] = sigmah;

     n.output_layer.total_sum_feat_sq += sigmah * sigmah;
     out_fs.sum_feat_sq += sigmah * sigmah;

     n.outputweight.feature_space[nn_output_namespace].indicies[0] = out_fs.indicies[i];
     base.predict(n.outputweight, n.k);
     float wf = n.outputweight.pred.scalar;

     // avoid saddle point at 0
     if (wf == 0)
     {
       float sqrtk = std::sqrt((float)n.k);
       n.outputweight.l.simple.label = (float)(n._random_state->get_and_update_random() - 0.5) / sqrtk;
       base.update(n.outputweight, n.k);
       n.outputweight.l.simple.label = FLT_MAX;
     }
   }

   n.all->loss = save_loss;
   n.all->set_minmax = save_set_minmax;
   n.all->sd->min_label = save_min_label;
   n.all->sd->max_label = save_max_label;

   if (n.inpass)
   {
     // TODO: this is not correct if there is something in the
     // nn_output_namespace but at least it will not leak memory
     // in that case
     ec.indices.push_back(nn_output_namespace);
     features save_nn_output_namespace = ec.feature_space[nn_output_namespace];
     ec.feature_space[nn_output_namespace] = n.output_layer.feature_space[nn_output_namespace];
     ec.total_sum_feat_sq += n.output_layer.feature_space[nn_output_namespace].sum_feat_sq;
     if (is_learn)
       base.learn(ec, n.k);
     else
       base.predict(ec, n.k);
     n.output_layer.partial_prediction = ec.partial_prediction;
     n.output_layer.loss = ec.loss;
     ec.total_sum_feat_sq -= n.output_layer.feature_space[nn_output_namespace].sum_feat_sq;
     ec.feature_space[nn_output_namespace].sum_feat_sq = 0;
     ec.feature_space[nn_output_namespace] = save_nn_output_namespace;
     ec.indices.pop();
   }
   else
   {
     n.output_layer.ft_offset = ec.ft_offset;
     n.output_layer.l = ec.l;
     n.output_layer.weight = ec.weight;
     n.output_layer.partial_prediction = 0;
     if (is_learn)
       base.learn(n.output_layer, n.k);
     else
       base.predict(n.output_layer, n.k);
     ec.l = n.output_layer.l;
   }

   n.prediction = GD::finalize_prediction(n.all->sd, n.output_layer.partial_prediction);

   if (shouldOutput)
   {
     outputStringStream << ' ' << n.output_layer.partial_prediction;
     n.all->print_text(n.all->raw_prediction, outputStringStream.str(), ec.tag);
   }

   if (is_learn && n.all->training && ld.label != FLT_MAX)
   {
     float gradient = n.all->loss->first_derivative(n.all->sd, n.prediction, ld.label);

     if (fabs(gradient) > 0)
     {
       n.all->loss = n.squared_loss;
       n.all->set_minmax = noop_mm;
       save_min_label = n.all->sd->min_label;
       n.all->sd->min_label = hidden_min_activation;
       save_max_label = n.all->sd->max_label;
       n.all->sd->max_label = hidden_max_activation;
       save_ft_offset = ec.ft_offset;

       if (n.multitask)
         ec.ft_offset = 0;

       for (unsigned int i = 0; i < n.k; ++i)
       {
         if (!dropped_out[i])
         {
           float sigmah = n.output_layer.feature_space[nn_output_namespace].values[i] / dropscale;
           float sigmahprime = dropscale * (1.0f - sigmah * sigmah);
           n.outputweight.feature_space[nn_output_namespace].indicies[0] =
               n.output_layer.feature_space[nn_output_namespace].indicies[i];
           base.predict(n.outputweight, n.k);
           float nu = n.outputweight.pred.scalar;
           float gradhw = 0.5f * nu * gradient * sigmahprime;

           ec.l.simple.label = GD::finalize_prediction(n.all->sd, hidden_units[i].scalar - gradhw);
           ec.pred.scalar = hidden_units[i].scalar;
           if (ec.l.simple.label != hidden_units[i].scalar)
             base.update(ec, i);
         }
       }

       n.all->loss = save_loss;
       n.all->set_minmax = save_set_minmax;
       n.all->sd->min_label = save_min_label;
       n.all->sd->max_label = save_max_label;
       ec.ft_offset = save_ft_offset;
     }
   }

   ec.l.simple.label = ld.label;

   if (!converse)
   {
     save_partial_prediction = n.output_layer.partial_prediction;
     save_final_prediction = n.prediction;
     save_ec_loss = n.output_layer.loss;
   }

   if (n.dropout && !converse)
   {
     for (unsigned int i = 0; i < n.k; ++i)
     {
       dropped_out[i] = !dropped_out[i];
     }

     converse = true;
     goto CONVERSE;
   }

   ec.partial_prediction = save_partial_prediction;
   ec.pred.scalar = save_final_prediction;
   ec.loss = save_ec_loss;

   n.all->sd = save_sd;
   n.all->set_minmax(n.all->sd, sd.min_label);
   n.all->set_minmax(n.all->sd, sd.max_label);
 }

 void multipredict(nn& n, single_learner& base, example& ec, size_t count, size_t step, polyprediction* pred,
     bool finalize_predictions)
 {
   for (size_t c = 0; c < count; c++)
   {
     if (c == 0)
       predict_or_learn_multi<false, true>(n, base, ec);
     else
       predict_or_learn_multi<false, false>(n, base, ec);
     if (finalize_predictions)
       pred[c] = ec.pred;
     else
       pred[c].scalar = ec.partial_prediction;
     ec.ft_offset += (uint64_t)step;
   }
   ec.ft_offset -= (uint64_t)(step * count);
 }

 void finish_example(vw& all, nn&, example& ec)
 {
   int save_raw_prediction = all.raw_prediction;
   all.raw_prediction = -1;
   return_simple_example(all, nullptr, ec);
   all.raw_prediction = save_raw_prediction;
 }

 base_learner* nn_setup(options_i& options, vw& all)
 {
   auto n = scoped_calloc_or_throw<nn>();
   bool meanfield = false;
   option_group_definition new_options("Neural Network");
   new_options.add(make_option("nn", n->k).keep().help("Sigmoidal feedforward network with <k> hidden units"))
       .add(make_option("inpass", n->inpass)
                .keep()
                .help("Train or test sigmoidal feedforward network with input passthrough."))
       .add(make_option("multitask", n->multitask).keep().help("Share hidden layer across all reduced tasks."))
       .add(make_option("dropout", n->dropout).keep().help("Train or test sigmoidal feedforward network using dropout."))
       .add(make_option("meanfield", meanfield).help("Train or test sigmoidal feedforward network using mean field."));
   options.add_and_parse(new_options);

   if (!options.was_supplied("nn"))
     return nullptr;

   n->all = &all;
   n->_random_state = all.get_random_state();

   if (n->multitask && !all.quiet)
     std::cerr << "using multitask sharing for neural network " << (all.training ? "training" : "testing") << std::endl;

   if (options.was_supplied("meanfield"))
   {
     n->dropout = false;
     if (!all.quiet)
       std::cerr << "using mean field for neural network " << (all.training ? "training" : "testing") << std::endl;
   }

   if (n->dropout && !all.quiet)
     std::cerr << "using dropout for neural network " << (all.training ? "training" : "testing") << std::endl;

   if (n->inpass && !all.quiet)
     std::cerr << "using input passthrough for neural network " << (all.training ? "training" : "testing") << std::endl;

   n->finished_setup = false;
   n->squared_loss = getLossFunction(all, "squared", 0);

   n->xsubi = all.random_seed;

   n->save_xsubi = n->xsubi;

   n->hidden_units = calloc_or_throw<float>(n->k);
   n->dropped_out = calloc_or_throw<bool>(n->k);
   n->hidden_units_pred = calloc_or_throw<polyprediction>(n->k);
   n->hiddenbias_pred = calloc_or_throw<polyprediction>(n->k);

   auto base = as_singleline(setup_base(options, all));
   n->increment = base->increment;  // Indexing of output layer is odd.
   nn& nv = *n.get();
   learner<nn, example>& l =
       init_learner(n, base, predict_or_learn_multi<true, true>, predict_or_learn_multi<false, true>, n->k + 1);
   if (nv.multitask)
     l.set_multipredict(multipredict);
   l.set_finish_example(finish_example);
   l.set_end_pass(end_pass);

   return make_base(l);
 }

 /*

   train: ./vw -k -c -d mnist8v9.gz --passes 24 -b 25 --nn 64 -l 0.1 --invariant --adaptive --holdout_off --random_seed
 19 --nnmultipredict -f mnist64 predict: ./vw -t -d mnist8v9.gz -i mnist64 --nnmultipredict

                      default   multipredict
   nn  64 train         9.1s         8.1s
          predict       0.57s        0.52s
   nn 128 train        16.5s        13.8s
          predict       0.76s        0.69s

 with oaa:

   train: ./vw --oaa 10 -b 25 --adaptive --invariant --holdout_off -l 0.1 --nn 64 --passes 24 -k -c -d mnist-all.gz
 --random_seed 19 --nnmultipredict -f mnist-all64 predict: ./vw -t -d mnist-all.gz -i mnist-all64 --nnmultipredict

 */
LEARNER::learner::set_multipredict
void set_multipredict(void(*u)(T &, L &, E &, size_t, size_t, polyprediction *, bool))
Definition: learner.h:217

example::tag
v_array< char > tag
Definition: example.h:63

fastexp
static float fastexp(float p)
Definition: nn.cc:79

GD::finalize_prediction
float finalize_prediction(shared_data *sd, float ret)
Definition: gd.cc:339

vw::raw_prediction
int raw_prediction
Definition: global_data.h:519

example_predict::indices
v_array< namespace_index > indices
Definition: example_predict.h:40

vw::weights
parameters weights
Definition: global_data.h:537

vw::loss
loss_function * loss
Definition: global_data.h:523

LEARNER::learner::predict
void predict(E &ec, size_t i=0)
Definition: learner.h:169

loss_function
Definition: loss_functions.h:13

example_predict::ft_offset
uint64_t ft_offset
Definition: example_predict.h:42

nn::output_layer
example output_layer
Definition: nn.cc:28

v_array::pop
T pop()
Definition: v_array.h:58

features::push_back
void push_back(feature_value v, feature_index i)
Definition: feature_group.h:336

polyprediction::scalar
float scalar
Definition: example.h:45

nn::all
vw * all
Definition: nn.cc:46

audit_strings_ptr
std::shared_ptr< audit_strings > audit_strings_ptr
Definition: feature_group.h:23

gd.h

vw::hash_inv
bool hash_inv
Definition: global_data.h:541

shared_data
Definition: global_data.h:133

features::indicies
v_array< feature_index > indicies
Definition: feature_group.h:244

example_predict::interactions
std::vector< std::string > * interactions
Definition: example_predict.h:46

finish_setup
void finish_setup(nn &n, vw &all)
Definition: nn.cc:83

VW::dealloc_example
void dealloc_example(void(*delete_label)(void *), example &ec, void(*delete_prediction)(void *))
Definition: example.cc:219

vw::random_seed
uint64_t random_seed
Definition: global_data.h:491

nn::_random_state
std::shared_ptr< rand_state > _random_state
Definition: nn.cc:47

nn::xsubi
uint64_t xsubi
Definition: nn.cc:34

nn_output_namespace
constexpr unsigned char nn_output_namespace
Definition: constant.h:23

features
the core definition of a set of features.
Definition: feature_group.h:241

LEARNER::make_base
base_learner * make_base(learner< T, E > &base)
Definition: learner.h:462

VW::config::option_group_definition
Definition: options.h:85

nn::hidden_units
float * hidden_units
Definition: nn.cc:40

example::partial_prediction
float partial_prediction
Definition: example.h:68

vw::quiet
bool quiet
Definition: global_data.h:487

features::values
v_array< feature_value > values
Definition: feature_group.h:243

VW::config::options_i::add_and_parse
virtual void add_and_parse(const option_group_definition &group)=0

label_data::label
float label
Definition: simple_label.h:14

merand48
float merand48(uint64_t &initial)
Definition: rand48.cc:16

polylabel::simple
label_data simple
Definition: example.h:28

nn_setup
base_learner * nn_setup(options_i &options, vw &all)
Definition: nn.cc:417

nn::k
uint32_t k
Definition: nn.cc:26

add_passthrough_feature
#define add_passthrough_feature(ec, i, x)
Definition: example.h:119

nn::dropped_out
bool * dropped_out
Definition: nn.cc:41

predict_or_learn_multi
void predict_or_learn_multi(nn &n, single_learner &base, example &ec)
Definition: nn.cc:153

LEARNER::learner
Definition: cb_explore.h:11

nn_constant
constexpr uint64_t nn_constant
Definition: nn.cc:22

vw::training
bool training
Definition: global_data.h:488

nn::inpass
bool inpass
Definition: nn.cc:36

loss_function::first_derivative
virtual float first_derivative(shared_data *, float prediction, float label)=0

hidden_max_activation
constexpr float hidden_max_activation
Definition: nn.cc:21

prediction_type::scalar
Definition: learner.h:20

vw
Definition: global_data.h:369

nn::hidden_units_pred
polyprediction * hidden_units_pred
Definition: nn.cc:43

nn::prediction
float prediction
Definition: nn.cc:31

vw::get_random_state
std::shared_ptr< rand_state > get_random_state()
Definition: global_data.h:553

example_predict::feature_space
std::array< features, NUM_NAMESPACES > feature_space
Definition: example_predict.h:41

LEARNER::as_singleline
single_learner * as_singleline(learner< T, E > *l)
Definition: learner.h:476

nn::dropout
bool dropout
Definition: nn.cc:33

vw::set_minmax
void(* set_minmax)(shared_data *sd, float label)
Definition: global_data.h:394

noop_mm
void noop_mm(shared_data *, float)
Definition: global_data.cc:135

LEARNER::learner::set_finish_example
void set_finish_example(void(*f)(vw &all, T &, E &))
Definition: learner.h:307

LEARNER::init_learner
learner< T, E > & init_learner(free_ptr< T > &dat, L *base, void(*learn)(T &, L &, E &), void(*predict)(T &, L &, E &), size_t ws, prediction_type::prediction_type_t pred_type)
Definition: learner.h:369

v_array::push_back
void push_back(const T &new_ele)
Definition: v_array.h:107

vw::sd
shared_data * sd
Definition: global_data.h:375

nn::multitask
bool multitask
Definition: nn.cc:38

LEARNER::end_pass
void end_pass(example &ec, vw &all)
Definition: learner.cc:44

polyprediction
Definition: example.h:43

label_data
Definition: simple_label.h:12

nn::save_xsubi
uint64_t save_xsubi
Definition: nn.cc:35

multipredict
void multipredict(nn &n, single_learner &base, example &ec, size_t count, size_t step, polyprediction *pred, bool finalize_predictions)
Definition: nn.cc:391

vw::bfgs
bool bfgs
Definition: global_data.h:412

example::num_features
size_t num_features
Definition: example.h:67

VW::config::options_i::was_supplied
virtual bool was_supplied(const std::string &key)=0

nn
Definition: nn.cc:24

constant
constexpr uint64_t constant
Definition: constant.h:11

VW::config::options_i
Definition: options.h:107

rand48.h

example
Definition: example.h:54

vw::print_text
void(* print_text)(int, std::string, v_array< char >)
Definition: global_data.h:522

nn::hiddenbias
example hiddenbias
Definition: nn.cc:29

reductions.h

example::loss
float loss
Definition: example.h:70

VW::config::option_group_definition::add
option_group_definition & add(T &&op)
Definition: options.h:90

add
int add(svm_params &params, svm_example *fec)
Definition: kernel_svm.cc:546

hidden_min_activation
constexpr float hidden_min_activation
Definition: nn.cc:20

features::space_names
v_array< audit_strings_ptr > space_names
Definition: feature_group.h:245

cast_uint32_t
#define cast_uint32_t
Definition: nn.cc:62

VW::config
Definition: options.h:11

example::l
polylabel l
Definition: example.h:57

example::in_use
bool in_use
Definition: example.h:79

VW::config::make_option
typed_option< T > make_option(std::string name, T &location)
Definition: options.h:80

example::total_sum_feat_sq
float total_sum_feat_sq
Definition: example.h:71

example::passthrough
features * passthrough
Definition: example.h:74

features::sum_feat_sq
float sum_feat_sq
Definition: feature_group.h:247

shared_data::min_label
float min_label
Definition: global_data.h:150

LEARNER::learner::set_end_pass
void set_end_pass(void(*f)(T &))
Definition: learner.h:286

nn::increment
size_t increment
Definition: nn.cc:32

finish_example
void finish_example(vw &all, nn &, example &ec)
Definition: nn.cc:409

vw.h

vw::interactions
std::vector< std::string > interactions
Definition: global_data.h:457

shared_data::max_label
float max_label
Definition: global_data.h:151

parameters::stride_shift
uint32_t stride_shift()
Definition: array_parameters.h:244

LEARNER::learner::multipredict
void multipredict(E &ec, size_t lo, size_t count, polyprediction *pred, bool finalize_predictions)
Definition: learner.h:178

nn::finished_setup
bool finished_setup
Definition: nn.cc:37

fastpow2
static float fastpow2(float p)
Definition: nn.cc:64

nn::~nn
~nn()
Definition: nn.cc:49

nn::squared_loss
loss_function * squared_loss
Definition: nn.cc:27

vw::audit
bool audit
Definition: global_data.h:486

setup_base
LEARNER::base_learner * setup_base(options_i &options, vw &all)
Definition: parse_args.cc:1222

example::pred
polyprediction pred
Definition: example.h:60

LEARNER
Definition: cb_explore.h:8

LEARNER::learner::update
void update(E &ec, size_t i=0)
Definition: learner.h:222

LEARNER::learner::learn
void learn(E &ec, size_t i=0)
Definition: learner.h:160

fasttanh
static float fasttanh(float p)
Definition: nn.cc:81

constant_namespace
constexpr unsigned char constant_namespace
Definition: constant.h:22

example::weight
float weight
Definition: example.h:62

getLossFunction
loss_function * getLossFunction(vw &all, std::string funcName, float function_parameter)
Definition: loss_functions.cc:363

c
constexpr uint64_t c
Definition: rand48.cc:12

f
float f
Definition: cache.cc:40

nn::outputweight
example outputweight
Definition: nn.cc:30

nn::hiddenbias_pred
polyprediction * hiddenbias_pred
Definition: nn.cc:44

audit_strings
std::pair< std::string, std::string > audit_strings
Definition: feature_group.h:22

return_simple_example
void return_simple_example(vw &all, void *, example &ec)
Definition: simple_label.cc:137