cpp/8.8.1/OjaNewton_8cc_source.html

 /*
 Copyright (c) by respective owners including Yahoo!, Microsoft, and
 individual contributors. All rights reserved.    Released under a BSD (revised)
 license as described in the file LICENSE.
 */
 #include <string>
 #include "gd.h"
 #include "vw.h"
 #include "rand48.h"
 #include "reductions.h"
 #include <math.h>
 #include <memory>

 using namespace LEARNER;
 using namespace VW::config;

 #define NORM2 (m + 1)

 struct update_data
 {
   struct OjaNewton* ON;
   float g;
   float sketch_cnt;
   float norm2_x;
   float* Zx;
   float* AZx;
   float* delta;
   float bdelta;
   float prediction;
 };

 struct OjaNewton
 {
   vw* all;
   std::shared_ptr<rand_state> _random_state;
   int m;
   int epoch_size;
   float alpha;
   int cnt;
   int t;

   float* ev;
   float* b;
   float* D;
   float** A;
   float** K;

   float* zv;
   float* vv;
   float* tmp;

   example** buffer;
   float* weight_buffer;
   struct update_data data;

   float learning_rate_cnt;
   bool normalize;
   bool random_init;

   void initialize_Z(parameters& weights)
   {
     uint32_t length = 1 << all->num_bits;
     if (normalize)  // initialize normalization part
     {
       for (uint32_t i = 0; i < length; i++) (&(weights.strided_index(i)))[NORM2] = 0.1f;
     }
     if (!random_init)
     {
       // simple initialization
       for (int i = 1; i <= m; i++) (&(weights.strided_index(i)))[i] = 1.f;
     }
     else
     {
       // more complicated initialization: orthgonal basis of a random matrix

       const double PI2 = 2.f * 3.1415927f;

       for (uint32_t i = 0; i < length; i++)
       {
         weight& w = weights.strided_index(i);
         float r1, r2;
         for (int j = 1; j <= m; j++)
         {
           // box-muller tranform: https://en.wikipedia.org/wiki/Box%E2%80%93Muller_transform
           // redraw until r1 should be strictly positive
           do
           {
             r1 = _random_state->get_and_update_random();
             r2 = _random_state->get_and_update_random();
           } while (r1 == 0.f);

           (&w)[j] = std::sqrt(-2.f * log(r1)) * (float)cos(PI2 * r2);
         }
       }
     }

     // Gram-Schmidt
     for (int j = 1; j <= m; j++)
     {
       for (int k = 1; k <= j - 1; k++)
       {
         double tmp = 0;

         for (uint32_t i = 0; i < length; i++)
           tmp += ((double)(&(weights.strided_index(i)))[j]) * (&(weights.strided_index(i)))[k];
         for (uint32_t i = 0; i < length; i++)
           (&(weights.strided_index(i)))[j] -= (float)tmp * (&(weights.strided_index(i)))[k];
       }
       double norm = 0;
       for (uint32_t i = 0; i < length; i++)
         norm += ((double)(&(weights.strided_index(i)))[j]) * (&(weights.strided_index(i)))[j];
       norm = std::sqrt(norm);
       for (uint32_t i = 0; i < length; i++) (&(weights.strided_index(i)))[j] /= (float)norm;
     }
   }

   void compute_AZx()
   {
     for (int i = 1; i <= m; i++)
     {
       data.AZx[i] = 0;
       for (int j = 1; j <= i; j++)
       {
         data.AZx[i] += A[i][j] * data.Zx[j];
       }
     }
   }

   void update_eigenvalues()
   {
     for (int i = 1; i <= m; i++)
     {
       float gamma = fmin(learning_rate_cnt / t, 1.f);
       float tmp = data.AZx[i] * data.sketch_cnt;

       if (t == 1)
       {
         ev[i] = gamma * tmp * tmp;
       }
       else
       {
         ev[i] = (1 - gamma) * t * ev[i] / (t - 1) + gamma * t * tmp * tmp;
       }
     }
   }

   void compute_delta()
   {
     data.bdelta = 0;
     for (int i = 1; i <= m; i++)
     {
       float gamma = fmin(learning_rate_cnt / t, 1.f);

       // if different learning rates are used
       /*data.delta[i] = gamma * data.AZx[i] * data.sketch_cnt;
       for (int j = 1; j < i; j++) {
           data.delta[i] -= A[i][j] * data.delta[j];
       }
       data.delta[i] /= A[i][i];*/

       // if a same learning rate is used
       data.delta[i] = gamma * data.Zx[i] * data.sketch_cnt;

       data.bdelta += data.delta[i] * b[i];
     }
   }

   void update_K()
   {
     float tmp = data.norm2_x * data.sketch_cnt * data.sketch_cnt;
     for (int i = 1; i <= m; i++)
     {
       for (int j = 1; j <= m; j++)
       {
         K[i][j] += data.delta[i] * data.Zx[j] * data.sketch_cnt;
         K[i][j] += data.delta[j] * data.Zx[i] * data.sketch_cnt;
         K[i][j] += data.delta[i] * data.delta[j] * tmp;
       }
     }
   }

   void update_A()
   {
     for (int i = 1; i <= m; i++)
     {
       for (int j = 1; j < i; j++)
       {
         zv[j] = 0;
         for (int k = 1; k <= i; k++)
         {
           zv[j] += A[i][k] * K[k][j];
         }
       }

       for (int j = 1; j < i; j++)
       {
         vv[j] = 0;
         for (int k = 1; k <= j; k++)
         {
           vv[j] += A[j][k] * zv[k];
         }
       }

       for (int j = 1; j < i; j++)
       {
         for (int k = j; k < i; k++)
         {
           A[i][j] -= vv[k] * A[k][j];
         }
       }

       float norm = 0;
       for (int j = 1; j <= i; j++)
       {
         float temp = 0;
         for (int k = 1; k <= i; k++)
         {
           temp += K[j][k] * A[i][k];
         }
         norm += A[i][j] * temp;
       }
       norm = sqrtf(norm);

       for (int j = 1; j <= i; j++)
       {
         A[i][j] /= norm;
       }
     }
   }

   void update_b()
   {
     for (int j = 1; j <= m; j++)
     {
       float tmp = 0;
       for (int i = j; i <= m; i++)
       {
         tmp += ev[i] * data.AZx[i] * A[i][j] / (alpha * (alpha + ev[i]));
       }
       b[j] += tmp * data.g;
     }
   }

   void update_D()
   {
     for (int j = 1; j <= m; j++)
     {
       float scale = fabs(A[j][j]);
       for (int i = j + 1; i <= m; i++) scale = fmin(fabs(A[i][j]), scale);
       if (scale < 1e-10)
         continue;
       for (int i = 1; i <= m; i++)
       {
         A[i][j] /= scale;
         K[j][i] *= scale;
         K[i][j] *= scale;
       }
       b[j] /= scale;
       D[j] *= scale;
       // printf("D[%d] = %f\n", j, D[j]);
     }
   }

   void check()
   {
     double max_norm = 0;
     for (int i = 1; i <= m; i++)
       for (int j = i; j <= m; j++) max_norm = fmax(max_norm, fabs(K[i][j]));
     // printf("|K| = %f\n", max_norm);
     if (max_norm < 1e7)
       return;

     // implicit -> explicit representation
     // printf("begin conversion: t = %d, norm(K) = %f\n", t, max_norm);

     // first step: K <- AKA'

     // K <- AK
     for (int j = 1; j <= m; j++)
     {
       memset(tmp, 0, sizeof(double) * (m + 1));

       for (int i = 1; i <= m; i++)
       {
         for (int h = 1; h <= m; h++)
         {
           tmp[i] += A[i][h] * K[h][j];
         }
       }

       for (int i = 1; i <= m; i++) K[i][j] = tmp[i];
     }
     // K <- KA'
     for (int i = 1; i <= m; i++)
     {
       memset(tmp, 0, sizeof(double) * (m + 1));

       for (int j = 1; j <= m; j++)
         for (int h = 1; h <= m; h++) tmp[j] += K[i][h] * A[j][h];

       for (int j = 1; j <= m; j++)
       {
         K[i][j] = tmp[j];
       }
     }

     // second step: w[0] <- w[0] + (DZ)'b, b <- 0.

     uint32_t length = 1 << all->num_bits;
     for (uint32_t i = 0; i < length; i++)
     {
       weight& w = all->weights.strided_index(i);
       for (int j = 1; j <= m; j++) w += (&w)[j] * b[j] * D[j];
     }

     memset(b, 0, sizeof(double) * (m + 1));

     // third step: Z <- ADZ, A, D <- Identity

     // double norm = 0;
     for (uint32_t i = 0; i < length; ++i)
     {
       memset(tmp, 0, sizeof(float) * (m + 1));
       weight& w = all->weights.strided_index(i);
       for (int j = 1; j <= m; j++)
       {
         for (int h = 1; h <= m; ++h) tmp[j] += A[j][h] * D[h] * (&w)[h];
       }
       for (int j = 1; j <= m; ++j)
       {
         // norm = std::max(norm, fabs(tmp[j]));
         (&w)[j] = tmp[j];
       }
     }
     // printf("|Z| = %f\n", norm);

     for (int i = 1; i <= m; i++)
     {
       memset(A[i], 0, sizeof(double) * (m + 1));
       D[i] = 1;
       A[i][i] = 1;
     }
   }

   ~OjaNewton()
   {
     free(ev);
     free(b);
     free(D);
     free(buffer);
     free(weight_buffer);
     free(zv);
     free(vv);
     free(tmp);
     if (A)
     {
       for (int i = 1; i <= m; i++)
       {
         free(A[i]);
         free(K[i]);
       }
     }

     free(A);
     free(K);

     free(data.Zx);
     free(data.AZx);
     free(data.delta);
   }
 };

 void keep_example(vw& all, OjaNewton& /* ON */, example& ec) { output_and_account_example(all, ec); }

 void make_pred(update_data& data, float x, float& wref)
 {
   int m = data.ON->m;
   float* w = &wref;

   if (data.ON->normalize)
   {
     x /= std::sqrt(w[NORM2]);
   }

   data.prediction += w[0] * x;
   for (int i = 1; i <= m; i++)
   {
     data.prediction += w[i] * x * data.ON->D[i] * data.ON->b[i];
   }
 }

 void predict(OjaNewton& ON, base_learner&, example& ec)
 {
   ON.data.prediction = 0;
   GD::foreach_feature<update_data, make_pred>(*ON.all, ec, ON.data);
   ec.partial_prediction = (float)ON.data.prediction;
   ec.pred.scalar = GD::finalize_prediction(ON.all->sd, ec.partial_prediction);
 }

 void update_Z_and_wbar(update_data& data, float x, float& wref)
 {
   float* w = &wref;
   int m = data.ON->m;
   if (data.ON->normalize)
     x /= std::sqrt(w[NORM2]);
   float s = data.sketch_cnt * x;

   for (int i = 1; i <= m; i++)
   {
     w[i] += data.delta[i] * s / data.ON->D[i];
   }
   w[0] -= s * data.bdelta;
 }

 void compute_Zx_and_norm(update_data& data, float x, float& wref)
 {
   float* w = &wref;
   int m = data.ON->m;
   if (data.ON->normalize)
     x /= std::sqrt(w[NORM2]);

   for (int i = 1; i <= m; i++)
   {
     data.Zx[i] += w[i] * x * data.ON->D[i];
   }
   data.norm2_x += x * x;
 }

 void update_wbar_and_Zx(update_data& data, float x, float& wref)
 {
   float* w = &wref;
   int m = data.ON->m;
   if (data.ON->normalize)
     x /= std::sqrt(w[NORM2]);

   float g = data.g * x;

   for (int i = 1; i <= m; i++)
   {
     data.Zx[i] += w[i] * x * data.ON->D[i];
   }
   w[0] -= g / data.ON->alpha;
 }

 void update_normalization(update_data& data, float x, float& wref)
 {
   float* w = &wref;
   int m = data.ON->m;

   w[NORM2] += x * x * data.g * data.g;
 }

 void learn(OjaNewton& ON, base_learner& base, example& ec)
 {
   assert(ec.in_use);

   // predict
   predict(ON, base, ec);

   update_data& data = ON.data;
   data.g = ON.all->loss->first_derivative(ON.all->sd, ec.pred.scalar, ec.l.simple.label) * ec.l.simple.weight;
   data.g /= 2;  // for half square loss

   if (ON.normalize)
     GD::foreach_feature<update_data, update_normalization>(*ON.all, ec, data);

   ON.buffer[ON.cnt] = &ec;
   ON.weight_buffer[ON.cnt++] = data.g / 2;

   if (ON.cnt == ON.epoch_size)
   {
     for (int k = 0; k < ON.epoch_size; k++, ON.t++)
     {
       example& ex = *(ON.buffer[k]);
       data.sketch_cnt = ON.weight_buffer[k];

       data.norm2_x = 0;
       memset(data.Zx, 0, sizeof(float) * (ON.m + 1));
       GD::foreach_feature<update_data, compute_Zx_and_norm>(*ON.all, ex, data);
       ON.compute_AZx();

       ON.update_eigenvalues();
       ON.compute_delta();

       ON.update_K();

       GD::foreach_feature<update_data, update_Z_and_wbar>(*ON.all, ex, data);
     }

     ON.update_A();
     // ON.update_D();
   }

   memset(data.Zx, 0, sizeof(float) * (ON.m + 1));
   GD::foreach_feature<update_data, update_wbar_and_Zx>(*ON.all, ec, data);
   ON.compute_AZx();

   ON.update_b();
   ON.check();

   if (ON.cnt == ON.epoch_size)
   {
     ON.cnt = 0;
     for (int k = 0; k < ON.epoch_size; k++)
     {
       VW::finish_example(*ON.all, *ON.buffer[k]);
     }
   }
 }

 void save_load(OjaNewton& ON, io_buf& model_file, bool read, bool text)
 {
   vw& all = *ON.all;
   if (read)
   {
     initialize_regressor(all);
     ON.initialize_Z(all.weights);
   }

   if (model_file.files.size() > 0)
   {
     bool resume = all.save_resume;
     std::stringstream msg;
     msg << ":" << resume << "\n";
     bin_text_read_write_fixed(model_file, (char*)&resume, sizeof(resume), "", read, msg, text);

     double temp = 0.;
     if (resume)
       GD::save_load_online_state(all, model_file, read, text, temp);
     else
       GD::save_load_regressor(all, model_file, read, text);
   }
 }

 base_learner* OjaNewton_setup(options_i& options, vw& all)
 {
   auto ON = scoped_calloc_or_throw<OjaNewton>();

   bool oja_newton;
   float alpha_inverse;

   // These two are the only two boolean options that default to true. For now going to do this hack
   // as the infrastructure doesn't easily support this possibility at the same time providing the
   // ease of bool switches elsewhere. It seems that the switch behavior is more critical because
   // of the positional data argument.
   std::string normalize = "true";
   std::string random_init = "true";
   option_group_definition new_options("OjaNewton options");
   new_options.add(make_option("OjaNewton", oja_newton).keep().help("Online Newton with Oja's Sketch"))
       .add(make_option("sketch_size", ON->m).default_value(10).help("size of sketch"))
       .add(make_option("epoch_size", ON->epoch_size).default_value(1).help("size of epoch"))
       .add(make_option("alpha", ON->alpha).default_value(1.f).help("mutiplicative constant for indentiy"))
       .add(make_option("alpha_inverse", alpha_inverse).help("one over alpha, similar to learning rate"))
       .add(make_option("learning_rate_cnt", ON->learning_rate_cnt)
                .default_value(2.f)
                .help("constant for the learning rate 1/t"))
       .add(make_option("normalize", normalize).help("normalize the features or not"))
       .add(make_option("random_init", random_init).help("randomize initialization of Oja or not"));
   options.add_and_parse(new_options);

   if (!options.was_supplied("OjaNewton"))
     return nullptr;

   ON->all = &all;
   ON->_random_state = all.get_random_state();

   ON->normalize = normalize == "true";
   ON->random_init = random_init == "true";

   if (options.was_supplied("alpha_inverse"))
     ON->alpha = 1.f / alpha_inverse;

   ON->cnt = 0;
   ON->t = 1;
   ON->ev = calloc_or_throw<float>(ON->m + 1);
   ON->b = calloc_or_throw<float>(ON->m + 1);
   ON->D = calloc_or_throw<float>(ON->m + 1);
   ON->A = calloc_or_throw<float*>(ON->m + 1);
   ON->K = calloc_or_throw<float*>(ON->m + 1);
   for (int i = 1; i <= ON->m; i++)
   {
     ON->A[i] = calloc_or_throw<float>(ON->m + 1);
     ON->K[i] = calloc_or_throw<float>(ON->m + 1);
     ON->A[i][i] = 1;
     ON->K[i][i] = 1;
     ON->D[i] = 1;
   }

   ON->buffer = calloc_or_throw<example*>(ON->epoch_size);
   ON->weight_buffer = calloc_or_throw<float>(ON->epoch_size);

   ON->zv = calloc_or_throw<float>(ON->m + 1);
   ON->vv = calloc_or_throw<float>(ON->m + 1);
   ON->tmp = calloc_or_throw<float>(ON->m + 1);

   ON->data.ON = ON.get();
   ON->data.Zx = calloc_or_throw<float>(ON->m + 1);
   ON->data.AZx = calloc_or_throw<float>(ON->m + 1);
   ON->data.delta = calloc_or_throw<float>(ON->m + 1);

   all.weights.stride_shift((uint32_t)ceil(log2(ON->m + 2)));

   learner<OjaNewton, example>& l = init_learner(ON, learn, predict, all.weights.stride());
   l.set_save_load(save_load);
   l.set_finish_example(keep_example);
   return make_base(l);
 }
compute_Zx_and_norm
void compute_Zx_and_norm(update_data &data, float x, float &wref)
Definition: OjaNewton.cc:415

OjaNewton::D
float * D
Definition: OjaNewton.cc:44

OjaNewton::check
void check()
Definition: OjaNewton.cc:264

GD::finalize_prediction
float finalize_prediction(shared_data *sd, float ret)
Definition: gd.cc:339

OjaNewton::K
float ** K
Definition: OjaNewton.cc:46

vw::weights
parameters weights
Definition: global_data.h:537

vw::loss
loss_function * loss
Definition: global_data.h:523

OjaNewton::~OjaNewton
~OjaNewton()
Definition: OjaNewton.cc:345

update_data::prediction
float prediction
Definition: OjaNewton.cc:29

initialize_regressor
void initialize_regressor(vw &all, T &weights)
Definition: parse_regressor.cc:97

OjaNewton::normalize
bool normalize
Definition: OjaNewton.cc:57

OjaNewton_setup
base_learner * OjaNewton_setup(options_i &options, vw &all)
Definition: OjaNewton.cc:535

OjaNewton::zv
float * zv
Definition: OjaNewton.cc:48

polyprediction::scalar
float scalar
Definition: example.h:45

save_load
void save_load(OjaNewton &ON, io_buf &model_file, bool read, bool text)
Definition: OjaNewton.cc:511

OjaNewton::buffer
example ** buffer
Definition: OjaNewton.cc:52

OjaNewton::vv
float * vv
Definition: OjaNewton.cc:49

gd.h

OjaNewton::tmp
float * tmp
Definition: OjaNewton.cc:50

output_and_account_example
void output_and_account_example(vw &all, active &a, example &ec)
Definition: active.cc:105

update_data::AZx
float * AZx
Definition: OjaNewton.cc:26

OjaNewton::data
struct update_data data
Definition: OjaNewton.cc:54

OjaNewton::cnt
int cnt
Definition: OjaNewton.cc:39

parameters::stride
uint32_t stride()
Definition: array_parameters.h:252

make_pred
void make_pred(update_data &data, float x, float &wref)
Definition: OjaNewton.cc:375

LEARNER::make_base
base_learner * make_base(learner< T, E > &base)
Definition: learner.h:462

VW::config::option_group_definition
Definition: options.h:85

OjaNewton::update_A
void update_A()
Definition: OjaNewton.cc:182

example::partial_prediction
float partial_prediction
Definition: example.h:68

label_data::weight
float weight
Definition: simple_label.h:15

VW::config::options_i::add_and_parse
virtual void add_and_parse(const option_group_definition &group)=0

LEARNER::learner::set_save_load
void set_save_load(void(*sl)(T &, io_buf &, bool, bool))
Definition: learner.h:257

label_data::label
float label
Definition: simple_label.h:14

polylabel::simple
label_data simple
Definition: example.h:28

OjaNewton::A
float ** A
Definition: OjaNewton.cc:45

update_wbar_and_Zx
void update_wbar_and_Zx(update_data &data, float x, float &wref)
Definition: OjaNewton.cc:429

OjaNewton::epoch_size
int epoch_size
Definition: OjaNewton.cc:37

update_data
Definition: ftrl.cc:20

LEARNER::learner
Definition: cb_explore.h:11

vw::num_bits
uint32_t num_bits
Definition: global_data.h:398

v_array::size
size_t size() const
Definition: v_array.h:68

loss_function::first_derivative
virtual float first_derivative(shared_data *, float prediction, float label)=0

update_data::delta
float * delta
Definition: OjaNewton.cc:27

OjaNewton::t
int t
Definition: OjaNewton.cc:40

vw
Definition: global_data.h:369

GD::save_load_online_state
void save_load_online_state(vw &all, io_buf &model_file, bool read, bool text, gd *g, std::stringstream &msg, uint32_t ftrl_size, T &weights)
Definition: gd.cc:776

vw::get_random_state
std::shared_ptr< rand_state > get_random_state()
Definition: global_data.h:553

update_Z_and_wbar
void update_Z_and_wbar(update_data &data, float x, float &wref)
Definition: OjaNewton.cc:400

OjaNewton::learning_rate_cnt
float learning_rate_cnt
Definition: OjaNewton.cc:56

OjaNewton::update_eigenvalues
void update_eigenvalues()
Definition: OjaNewton.cc:129

OjaNewton::update_b
void update_b()
Definition: OjaNewton.cc:231

OjaNewton::compute_AZx
void compute_AZx()
Definition: OjaNewton.cc:117

LEARNER::learner::set_finish_example
void set_finish_example(void(*f)(vw &all, T &, E &))
Definition: learner.h:307

update_normalization
void update_normalization(update_data &data, float x, float &wref)
Definition: OjaNewton.cc:445

LEARNER::init_learner
learner< T, E > & init_learner(free_ptr< T > &dat, L *base, void(*learn)(T &, L &, E &), void(*predict)(T &, L &, E &), size_t ws, prediction_type::prediction_type_t pred_type)
Definition: learner.h:369

keep_example
void keep_example(vw &all, OjaNewton &, example &ec)
Definition: OjaNewton.cc:373

OjaNewton::compute_delta
void compute_delta()
Definition: OjaNewton.cc:147

parameters
Definition: array_parameters.h:226

vw::sd
shared_data * sd
Definition: global_data.h:375

update_data::bdelta
float bdelta
Definition: OjaNewton.cc:28

io_buf::files
v_array< int > files
Definition: io_buf.h:64

NORM2
#define NORM2
Definition: OjaNewton.cc:17

VW::config::options_i::was_supplied
virtual bool was_supplied(const std::string &key)=0

update_data::sketch_cnt
float sketch_cnt
Definition: OjaNewton.cc:23

VW::config::options_i
Definition: options.h:107

rand48.h

OjaNewton::_random_state
std::shared_ptr< rand_state > _random_state
Definition: OjaNewton.cc:35

example
Definition: example.h:54

parameters::strided_index
weight & strided_index(size_t index)
Definition: array_parameters.h:311

io_buf
Definition: io_buf.h:54

VW::finish_example
void finish_example(vw &, example &)
Definition: parser.cc:881

OjaNewton::update_D
void update_D()
Definition: OjaNewton.cc:244

reductions.h

OjaNewton::ev
float * ev
Definition: OjaNewton.cc:42

update_data::ON
struct OjaNewton * ON
Definition: OjaNewton.cc:21

update_data::g
float g
Definition: OjaNewton.cc:22

weight
float weight
Definition: array_parameters_dense.h:6

VW::config::option_group_definition::add
option_group_definition & add(T &&op)
Definition: options.h:90

add
int add(svm_params &params, svm_example *fec)
Definition: kernel_svm.cc:546

VW::config
Definition: options.h:11

predict
void predict(OjaNewton &ON, base_learner &, example &ec)
Definition: OjaNewton.cc:392

update_data::Zx
float * Zx
Definition: OjaNewton.cc:25

example::l
polylabel l
Definition: example.h:57

OjaNewton::weight_buffer
float * weight_buffer
Definition: OjaNewton.cc:53

example::in_use
bool in_use
Definition: example.h:79

VW::config::make_option
typed_option< T > make_option(std::string name, T &location)
Definition: options.h:80

OjaNewton::m
int m
Definition: OjaNewton.cc:36

vw.h

vw::save_resume
bool save_resume
Definition: global_data.h:415

parameters::stride_shift
uint32_t stride_shift()
Definition: array_parameters.h:244

OjaNewton::initialize_Z
void initialize_Z(parameters &weights)
Definition: OjaNewton.cc:60

example::pred
polyprediction pred
Definition: example.h:60

LEARNER
Definition: cb_explore.h:8

OjaNewton::random_init
bool random_init
Definition: OjaNewton.cc:58

GD::save_load_regressor
void save_load_regressor(vw &all, io_buf &model_file, bool read, bool text, T &weights)
Definition: gd.cc:707

OjaNewton::alpha
float alpha
Definition: OjaNewton.cc:38

OjaNewton
Definition: OjaNewton.cc:32

OjaNewton::all
vw * all
Definition: OjaNewton.cc:34

OjaNewton::b
float * b
Definition: OjaNewton.cc:43

bin_text_read_write_fixed
size_t bin_text_read_write_fixed(io_buf &io, char *data, size_t len, const char *read_message, bool read, std::stringstream &msg, bool text)
Definition: io_buf.h:326

OjaNewton::update_K
void update_K()
Definition: OjaNewton.cc:168

learn
void learn(OjaNewton &ON, base_learner &base, example &ec)
Definition: OjaNewton.cc:453

f
float f
Definition: cache.cc:40

update_data::norm2_x
float norm2_x
Definition: OjaNewton.cc:24