cpp/8.8.1/kernel__svm_8cc_source.html

 /*
 Copyright (c) by respective owners including Yahoo!, Microsoft, and
 individual contributors. All rights reserved.  Released under a BSD (revised)
 license as described in the file LICENSE.
  */
 #include <fstream>
 #include <sstream>
 #include <float.h>
 #ifdef _WIN32
 #define NOMINMAX
 #include <WinSock2.h>
 #else
 #include <netdb.h>
 #endif
 #include <string.h>
 #include <stdio.h>
 #include <assert.h>
 #include <memory>

 #include "parse_example.h"
 #include "constant.h"
 #include "gd.h"
 #include "cache.h"
 #include "accumulate.h"
 #include "learner.h"
 #include "vw.h"
 #include <map>
 #include "memory.h"
 #include "vw_allreduce.h"
 #include "rand48.h"
 #include "reductions.h"

 #define SVM_KER_LIN 0
 #define SVM_KER_RBF 1
 #define SVM_KER_POLY 2

 using namespace LEARNER;
 using namespace VW::config;

 using std::endl;

 struct svm_params;

 static size_t num_kernel_evals = 0;
 static size_t num_cache_evals = 0;

 struct svm_example
 {
   v_array<float> krow;
   flat_example ex;

   ~svm_example();
   void init_svm_example(flat_example* fec);
   int compute_kernels(svm_params& params);
   int clear_kernels();
 };

 struct svm_model
 {
   size_t num_support;
   v_array<svm_example*> support_vec;
   v_array<float> alpha;
   v_array<float> delta;
 };

 void free_svm_model(svm_model* model)
 {
   for (size_t i = 0; i < model->num_support; i++)
   {
     model->support_vec[i]->~svm_example();
     // Warning C6001 is triggered by the following:
     // example is allocated using (a) '&calloc_or_throw<svm_example>()' and freed using (b)
     // 'free(model->support_vec[i])'
     //
     // When the call to allocation is replaced by (a) 'new svm_example()' and deallocated using (b) 'operator delete
     // (model->support_vect[i])', the warning goes away. Disable SDL warning.
     //    #pragma warning(disable:6001)
     free_it(model->support_vec[i]);
     //  #pragma warning(default:6001)

     model->support_vec[i] = 0;
   }

   model->support_vec.delete_v();
   model->alpha.delete_v();
   model->delta.delete_v();
   free(model);
 }

 struct svm_params
 {
   size_t current_pass;
   bool active;
   bool active_pool_greedy;
   bool para_active;
   double active_c;

   size_t pool_size;
   size_t pool_pos;
   size_t subsample;  // NOTE: Eliminating subsample to only support 1/pool_size
   size_t reprocess;

   svm_model* model;
   size_t maxcache;
   // size_t curcache;

   svm_example** pool;
   float lambda;

   void* kernel_params;
   size_t kernel_type;

   size_t local_begin, local_end;
   size_t current_t;

   float loss_sum;

   vw* all;  // flatten, parallel
   std::shared_ptr<rand_state> _random_state;

   ~svm_params()
   {
     free(pool);
     if (all)
     {
       all->trace_message << "Num support = " << model->num_support << endl;
       all->trace_message << "Number of kernel evaluations = " << num_kernel_evals << " "
                          << "Number of cache queries = " << num_cache_evals << endl;
       all->trace_message << "Total loss = " << loss_sum << endl;
     }
     if (model)
     {
       free_svm_model(model);
     }
     if (all)
     {
       all->trace_message << "Done freeing model" << endl;
     }

     free(kernel_params);
     if (all)
     {
       all->trace_message << "Done freeing kernel params" << endl;
       all->trace_message << "Done with finish " << endl;
     }
   }
 };

 void svm_example::init_svm_example(flat_example* fec)
 {
   ex = *fec;
   free(fec);
 }

 svm_example::~svm_example()
 {
   krow.delete_v();
   // free flatten example contents
   flat_example* fec = &calloc_or_throw<flat_example>();
   *fec = ex;
   free_flatten_example(fec);  // free contents of flat example and frees fec.
 }

 float kernel_function(const flat_example* fec1, const flat_example* fec2, void* params, size_t kernel_type);

 int svm_example::compute_kernels(svm_params& params)
 {
   int alloc = 0;
   svm_model* model = params.model;
   size_t n = model->num_support;

   if (krow.size() < n)
   {
     // computing new kernel values and caching them
     // if(params->curcache + n > params->maxcache)
     // trim_cache(params);
     num_kernel_evals += krow.size();
     // std::cerr<<"Kernels ";
     for (size_t i = krow.size(); i < n; i++)
     {
       svm_example* sec = model->support_vec[i];
       float kv = kernel_function(&ex, &(sec->ex), params.kernel_params, params.kernel_type);
       krow.push_back(kv);
       alloc += 1;
       // std::cerr<<kv<<" ";
     }
     // std::cerr<< endl;
   }
   else
     num_cache_evals += n;
   return alloc;
 }

 int svm_example::clear_kernels()
 {
   int rowsize = (int)krow.size();
   krow.end() = krow.begin();
   krow.resize(0);
   return -rowsize;
 }

 static int make_hot_sv(svm_params& params, size_t svi)
 {
   svm_model* model = params.model;
   size_t n = model->num_support;
   if (svi >= model->num_support)
     params.all->trace_message << "Internal error at " << __FILE__ << ":" << __LINE__ << endl;
   // rotate params fields
   svm_example* svi_e = model->support_vec[svi];
   int alloc = svi_e->compute_kernels(params);
   float svi_alpha = model->alpha[svi];
   float svi_delta = model->delta[svi];
   for (size_t i = svi; i > 0; --i)
   {
     model->support_vec[i] = model->support_vec[i - 1];
     model->alpha[i] = model->alpha[i - 1];
     model->delta[i] = model->delta[i - 1];
   }
   model->support_vec[0] = svi_e;
   model->alpha[0] = svi_alpha;
   model->delta[0] = svi_delta;
   // rotate cache
   for (size_t j = 0; j < n; j++)
   {
     svm_example* e = model->support_vec[j];
     size_t rowsize = e->krow.size();
     if (svi < rowsize)
     {
       float kv = e->krow[svi];
       for (size_t i = svi; i > 0; --i) e->krow[i] = e->krow[i - 1];
       e->krow[0] = kv;
     }
     else
     {
       float kv = svi_e->krow[j];
       e->krow.push_back(0);
       alloc += 1;
       for (size_t i = e->krow.size() - 1; i > 0; --i) e->krow[i] = e->krow[i - 1];
       e->krow[0] = kv;
     }
   }
   return alloc;
 }

 static int trim_cache(svm_params& params)
 {
   int sz = (int)params.maxcache;
   svm_model* model = params.model;
   size_t n = model->num_support;
   int alloc = 0;
   for (size_t i = 0; i < n; i++)
   {
     svm_example* e = model->support_vec[i];
     sz -= (int)e->krow.size();
     if (sz < 0)
       alloc += e->clear_kernels();
   }
   return alloc;
 }

 int save_load_flat_example(io_buf& model_file, bool read, flat_example*& fec)
 {
   size_t brw = 1;
   if (read)
   {
     fec = &calloc_or_throw<flat_example>();
     brw = model_file.bin_read_fixed((char*)fec, sizeof(flat_example), "");

     if (brw > 0)
     {
       if (fec->tag_len > 0)
       {
         fec->tag = calloc_or_throw<char>(fec->tag_len);
         brw = model_file.bin_read_fixed((char*)fec->tag, fec->tag_len * sizeof(char), "");
         if (!brw)
           return 2;
       }
       if (fec->fs.size() > 0)
       {
         features& fs = fec->fs;
         size_t len = fs.size();
         fs.values = v_init<feature_value>();
         fs.values.resize(len);
         brw = model_file.bin_read_fixed((char*)fs.values.begin(), len * sizeof(feature_value), "");
         if (!brw)
           return 3;
         fs.values.end() = fs.values.begin() + len;

         len = fs.indicies.size();
         fs.indicies = v_init<feature_index>();
         fs.indicies.resize(len);
         brw = model_file.bin_read_fixed((char*)fs.indicies.begin(), len * sizeof(feature_index), "");
         if (!brw)
           return 3;
         fs.indicies.end() = fs.indicies.begin() + len;
       }
     }
     else
       return 1;
   }
   else
   {
     brw = model_file.bin_write_fixed((char*)fec, sizeof(flat_example));

     if (brw > 0)
     {
       if (fec->tag_len > 0)
       {
         brw = model_file.bin_write_fixed((char*)fec->tag, (uint32_t)fec->tag_len * sizeof(char));
         if (!brw)
         {
           std::cerr << fec->tag_len << " " << fec->tag << endl;
           return 2;
         }
       }
       if (fec->fs.size() > 0)
       {
         brw =
             model_file.bin_write_fixed((char*)fec->fs.values.begin(), (uint32_t)fec->fs.size() * sizeof(feature_value));
         if (!brw)
           return 3;
         brw = model_file.bin_write_fixed(
             (char*)fec->fs.indicies.begin(), (uint32_t)fec->fs.indicies.size() * sizeof(feature_index));
         if (!brw)
           return 3;
       }
     }
     else
       return 1;
   }
   return 0;
 }

 void save_load_svm_model(svm_params& params, io_buf& model_file, bool read, bool text)
 {
   svm_model* model = params.model;
   // TODO: check about initialization

   // params.all->opts_n_args.trace_message<<"Save load svm "<<read<<" "<<text<< endl;
   if (model_file.files.size() == 0)
     return;
   std::stringstream msg;
   bin_text_read_write_fixed(model_file, (char*)&(model->num_support), sizeof(model->num_support), "", read, msg, text);
   // params.all->opts_n_args.trace_message<<"Read num support "<<model->num_support<< endl;

   flat_example* fec = nullptr;
   if (read)
     model->support_vec.resize(model->num_support);

   for (uint32_t i = 0; i < model->num_support; i++)
   {
     if (read)
     {
       save_load_flat_example(model_file, read, fec);
       svm_example* tmp = &calloc_or_throw<svm_example>();
       tmp->init_svm_example(fec);
       model->support_vec.push_back(tmp);
     }
     else
     {
       fec = &(model->support_vec[i]->ex);
       save_load_flat_example(model_file, read, fec);
     }
   }

   if (read)
     model->alpha.resize(model->num_support);
   bin_text_read_write_fixed(
       model_file, (char*)model->alpha.begin(), (uint32_t)model->num_support * sizeof(float), "", read, msg, text);
   if (read)
     model->delta.resize(model->num_support);
   bin_text_read_write_fixed(
       model_file, (char*)model->delta.begin(), (uint32_t)model->num_support * sizeof(float), "", read, msg, text);
 }

 void save_load(svm_params& params, io_buf& model_file, bool read, bool text)
 {
   if (text)
   {
     params.all->trace_message << "Not supporting readable model for kernel svm currently" << endl;
     return;
   }

   save_load_svm_model(params, model_file, read, text);
 }

 float linear_kernel(const flat_example* fec1, const flat_example* fec2)
 {
   float dotprod = 0;

   features& fs_1 = (features&)fec1->fs;
   features& fs_2 = (features&)fec2->fs;
   if (fs_2.indicies.size() == 0)
     return 0.f;

   int numint = 0;
   for (size_t idx1 = 0, idx2 = 0; idx1 < fs_1.size() && idx2 < fs_2.size(); idx1++)
   {
     uint64_t ec1pos = fs_1.indicies[idx1];
     uint64_t ec2pos = fs_2.indicies[idx2];
     // params.all->opts_n_args.trace_message<<ec1pos<<" "<<ec2pos<<" "<<idx1<<" "<<idx2<<" "<<f->x<<" "<<ec2f->x<< endl;
     if (ec1pos < ec2pos)
       continue;

     while (ec1pos > ec2pos && ++idx2 < fs_2.size()) ec2pos = fs_2.indicies[idx2];

     if (ec1pos == ec2pos)
     {
       // params.all->opts_n_args.trace_message<<ec1pos<<" "<<ec2pos<<" "<<idx1<<" "<<idx2<<" "<<f->x<<"
       // "<<ec2f->x<< endl;
       numint++;
       dotprod += fs_1.values[idx1] * fs_2.values[idx2];
       ++idx2;
     }
   }
   // params.all->opts_n_args.trace_message<< endl;
   // params.all->opts_n_args.trace_message<<"numint = "<<numint<<" dotprod = "<<dotprod<< endl;
   return dotprod;
 }

 float poly_kernel(const flat_example* fec1, const flat_example* fec2, int power)
 {
   float dotprod = linear_kernel(fec1, fec2);
   // std::cerr<<"Bandwidth = "<<bandwidth<< endl;
   // std::cout<<pow(1 + dotprod, power)<< endl;
   return pow(1 + dotprod, power);
 }

 float rbf_kernel(const flat_example* fec1, const flat_example* fec2, float bandwidth)
 {
   float dotprod = linear_kernel(fec1, fec2);
   // std::cerr<<"Bandwidth = "<<bandwidth<< endl;
   return expf(-(fec1->total_sum_feat_sq + fec2->total_sum_feat_sq - 2 * dotprod) * bandwidth);
 }

 float kernel_function(const flat_example* fec1, const flat_example* fec2, void* params, size_t kernel_type)
 {
   switch (kernel_type)
   {
     case SVM_KER_RBF:
       return rbf_kernel(fec1, fec2, *((float*)params));
     case SVM_KER_POLY:
       return poly_kernel(fec1, fec2, *((int*)params));
     case SVM_KER_LIN:
       return linear_kernel(fec1, fec2);
   }
   return 0;
 }

 float dense_dot(float* v1, v_array<float> v2, size_t n)
 {
   float dot_prod = 0.;
   for (size_t i = 0; i < n; i++) dot_prod += v1[i] * v2[i];
   return dot_prod;
 }

 void predict(svm_params& params, svm_example** ec_arr, float* scores, size_t n)
 {
   svm_model* model = params.model;
   for (size_t i = 0; i < n; i++)
   {
     ec_arr[i]->compute_kernels(params);
     // std::cout<<"size of krow = "<<ec_arr[i]->krow.size()<< endl;
     if (ec_arr[i]->krow.size() > 0)
       scores[i] = dense_dot(ec_arr[i]->krow.begin(), model->alpha, model->num_support) / params.lambda;
     else
       scores[i] = 0;
   }
 }

 void predict(svm_params& params, single_learner&, example& ec)
 {
   flat_example* fec = flatten_sort_example(*(params.all), &ec);
   if (fec)
   {
     svm_example* sec = &calloc_or_throw<svm_example>();
     sec->init_svm_example(fec);
     float score;
     predict(params, &sec, &score, 1);
     ec.pred.scalar = score;
     sec->~svm_example();
     free(sec);
   }
 }

 size_t suboptimality(svm_model* model, double* subopt)
 {
   size_t max_pos = 0;
   // std::cerr<<"Subopt ";
   double max_val = 0;
   for (size_t i = 0; i < model->num_support; i++)
   {
     float tmp = model->alpha[i] * model->support_vec[i]->ex.l.simple.label;

     if ((tmp < model->support_vec[i]->ex.l.simple.weight && model->delta[i] < 0) || (tmp > 0 && model->delta[i] > 0))
       subopt[i] = fabs(model->delta[i]);
     else
       subopt[i] = 0;

     if (subopt[i] > max_val)
     {
       max_val = subopt[i];
       max_pos = i;
     }
     // std::cerr<<subopt[i]<<" ";
   }
   // std::cerr<< endl;
   return max_pos;
 }

 int remove(svm_params& params, size_t svi)
 {
   svm_model* model = params.model;
   if (svi >= model->num_support)
     params.all->trace_message << "Internal error at " << __FILE__ << ":" << __LINE__ << endl;
   // shift params fields
   svm_example* svi_e = model->support_vec[svi];
   for (size_t i = svi; i < model->num_support - 1; ++i)
   {
     model->support_vec[i] = model->support_vec[i + 1];
     model->alpha[i] = model->alpha[i + 1];
     model->delta[i] = model->delta[i + 1];
   }
   svi_e->~svm_example();
   free(svi_e);
   model->support_vec.pop();
   model->alpha.pop();
   model->delta.pop();
   model->num_support--;
   // shift cache
   int alloc = 0;
   for (size_t j = 0; j < model->num_support; j++)
   {
     svm_example* e = model->support_vec[j];
     size_t rowsize = e->krow.size();
     if (svi < rowsize)
     {
       for (size_t i = svi; i < rowsize - 1; i++) e->krow[i] = e->krow[i + 1];
       e->krow.pop();
       alloc -= 1;
     }
   }
   return alloc;
 }

 int add(svm_params& params, svm_example* fec)
 {
   svm_model* model = params.model;
   model->num_support++;
   model->support_vec.push_back(fec);
   model->alpha.push_back(0.);
   model->delta.push_back(0.);
   // std::cout<<"After adding "<<model->num_support<< endl;
   return (int)(model->support_vec.size() - 1);
 }

 bool update(svm_params& params, size_t pos)
 {
   // params.all->opts_n_args.trace_message<<"Update\n";
   svm_model* model = params.model;
   bool overshoot = false;
   // params.all->opts_n_args.trace_message<<"Updating model "<<pos<<" "<<model->num_support<<" ";
   svm_example* fec = model->support_vec[pos];
   label_data& ld = fec->ex.l.simple;
   fec->compute_kernels(params);
   float* inprods = fec->krow.begin();
   float alphaKi = dense_dot(inprods, model->alpha, model->num_support);
   model->delta[pos] = alphaKi * ld.label / params.lambda - 1;
   float alpha_old = model->alpha[pos];
   alphaKi -= model->alpha[pos] * inprods[pos];
   model->alpha[pos] = 0.;

   float proj = alphaKi * ld.label;
   float ai = (params.lambda - proj) / inprods[pos];
   // std::cout<<model->num_support<<" "<<pos<<" "<<proj<<" "<<alphaKi<<" "<<alpha_old<<" "<<ld.label<<"
   // "<<model->delta[pos]<<" " << ai<<" "<<params.lambda<< endl;

   if (ai > fec->ex.l.simple.weight)
     ai = fec->ex.l.simple.weight;
   else if (ai < 0)
     ai = 0;

   ai *= ld.label;
   float diff = ai - alpha_old;

   if (fabs(diff) > 1.0e-06)
     overshoot = true;

   if (fabs(diff) > 1.)
   {
     // params.all->opts_n_args.trace_message<<"Here\n";
     diff = (float)(diff > 0) - (diff < 0);
     ai = alpha_old + diff;
   }

   for (size_t i = 0; i < model->num_support; i++)
   {
     label_data& ldi = model->support_vec[i]->ex.l.simple;
     model->delta[i] += diff * inprods[i] * ldi.label / params.lambda;
   }

   if (fabs(ai) <= 1.0e-10)
     remove(params, pos);
   else
     model->alpha[pos] = ai;

   return overshoot;
 }

 void copy_char(char& c1, const char& c2) noexcept
 {
   if (c2 != '\0')
     c1 = c2;
 }

 void add_size_t(size_t& t1, const size_t& t2) noexcept { t1 += t2; }

 void add_double(double& t1, const double& t2) noexcept { t1 += t2; }

 void sync_queries(vw& all, svm_params& params, bool* train_pool)
 {
   io_buf* b = new io_buf();

   char* queries;
   flat_example* fec = nullptr;

   for (size_t i = 0; i < params.pool_pos; i++)
   {
     if (!train_pool[i])
       continue;

     fec = &(params.pool[i]->ex);
     save_load_flat_example(*b, false, fec);
     delete params.pool[i];
   }

   size_t* sizes = calloc_or_throw<size_t>(all.all_reduce->total);
   sizes[all.all_reduce->node] = b->head - b->space.begin();
   // params.all->opts_n_args.trace_message<<"Sizes = "<<sizes[all.node]<<" ";
   all_reduce<size_t, add_size_t>(all, sizes, all.all_reduce->total);

   size_t prev_sum = 0, total_sum = 0;
   for (size_t i = 0; i < all.all_reduce->total; i++)
   {
     if (i <= (all.all_reduce->node - 1))
       prev_sum += sizes[i];
     total_sum += sizes[i];
   }

   // params.all->opts_n_args.trace_message<<total_sum<<" "<<prev_sum<< endl;
   if (total_sum > 0)
   {
     queries = calloc_or_throw<char>(total_sum);
     memcpy(queries + prev_sum, b->space.begin(), b->head - b->space.begin());
     b->space.delete_v();
     all_reduce<char, copy_char>(all, queries, total_sum);

     b->space.begin() = queries;
     b->head = b->space.begin();
     b->space.end() = &queries[total_sum * sizeof(char)];

     size_t num_read = 0;
     params.pool_pos = 0;

     for (size_t i = 0; i < params.pool_size; i++)
     {
       if (!save_load_flat_example(*b, true, fec))
       {
         params.pool[i] = &calloc_or_throw<svm_example>();
         params.pool[i]->init_svm_example(fec);
         train_pool[i] = true;
         params.pool_pos++;
         // for(int j = 0;j < fec->feature_map_len;j++)
         //   params.all->opts_n_args.trace_message<<fec->feature_map[j].weight_index<<":"<<fec->feature_map[j].x<<" ";
         // params.all->opts_n_args.trace_message<< endl;
         // params.pool[i]->in_use = true;
         // params.current_t += ((label_data*) params.pool[i]->ld)->weight;
         // params.pool[i]->example_t = params.current_t;
       }
       else
         break;

       num_read += b->head - b->space.begin();
       if (num_read == prev_sum)
         params.local_begin = i + 1;
       if (num_read == prev_sum + sizes[all.all_reduce->node])
         params.local_end = i;
     }
   }
   if (fec)
     free(fec);
   free(sizes);
   delete b;
 }

 void train(svm_params& params)
 {
   // params.all->opts_n_args.trace_message<<"In train "<<params.all->training<< endl;

   bool* train_pool = calloc_or_throw<bool>(params.pool_size);
   for (size_t i = 0; i < params.pool_size; i++) train_pool[i] = false;

   float* scores = calloc_or_throw<float>(params.pool_pos);
   predict(params, params.pool, scores, params.pool_pos);
   // std::cout<<scores[0]<< endl;

   if (params.active)
   {
     if (params.active_pool_greedy)
     {
       std::multimap<double, size_t> scoremap;
       for (size_t i = 0; i < params.pool_pos; i++)
         scoremap.insert(std::pair<const double, const size_t>(fabs(scores[i]), i));

       std::multimap<double, size_t>::iterator iter = scoremap.begin();
       // params.all->opts_n_args.trace_message<<params.pool_size<<" "<<"Scoremap: ";
       // for(;iter != scoremap.end();iter++)
       // params.all->opts_n_args.trace_message<<iter->first<<" "<<iter->second<<"
       // "<<((label_data*)params.pool[iter->second]->ld)->label<<"\t"; params.all->opts_n_args.trace_message<< endl;
       iter = scoremap.begin();

       for (size_t train_size = 1; iter != scoremap.end() && train_size <= params.subsample; train_size++)
       {
         // params.all->opts_n_args.trace_message<<train_size<<" "<<iter->second<<" "<<iter->first<< endl;
         train_pool[iter->second] = 1;
         iter++;
       }
     }
     else
     {
       for (size_t i = 0; i < params.pool_pos; i++)
       {
         float queryp = 2.0f /
             (1.0f +
                 expf(
                     (float)(params.active_c * fabs(scores[i])) * (float)pow(params.pool[i]->ex.example_counter, 0.5f)));
         if (params._random_state->get_and_update_random() < queryp)
         {
           svm_example* fec = params.pool[i];
           fec->ex.l.simple.weight *= 1 / queryp;
           train_pool[i] = 1;
         }
       }
     }
     // free(scores);
   }

   if (params.para_active)
   {
     for (size_t i = 0; i < params.pool_pos; i++)
       if (!train_pool[i])
         delete params.pool[i];
     sync_queries(*(params.all), params, train_pool);
   }

   if (params.all->training)
   {
     svm_model* model = params.model;

     for (size_t i = 0; i < params.pool_pos; i++)
     {
       // params.all->opts_n_args.trace_message<<"process: "<<i<<" "<<train_pool[i]<< endl;
       int model_pos = -1;
       if (params.active)
       {
         if (train_pool[i])
         {
           // params.all->opts_n_args.trace_message<<"i = "<<i<<"train_pool[i] = "<<train_pool[i]<<"
           // "<<params.pool[i]->example_counter<< endl;
           model_pos = add(params, params.pool[i]);
         }
       }
       else
         model_pos = add(params, params.pool[i]);

       // params.all->opts_n_args.trace_message<<"Added: "<<model_pos<<"
       // "<<model->support_vec[model_pos]->example_counter<< endl;std::cout<<"After adding in train
       // "<<model->num_support<< endl;

       if (model_pos >= 0)
       {
         bool overshoot = update(params, model_pos);
         // std::cout<<model_pos<<":alpha = "<<model->alpha[model_pos]<< endl;

         double* subopt = calloc_or_throw<double>(model->num_support);
         for (size_t j = 0; j < params.reprocess; j++)
         {
           if (model->num_support == 0)
             break;
           // std::cout<<"reprocess: ";
           int randi = 1;
           if (params._random_state->get_and_update_random() < 0.5)
             randi = 0;
           if (randi)
           {
             size_t max_pos = suboptimality(model, subopt);
             if (subopt[max_pos] > 0)
             {
               if (!overshoot && max_pos == (size_t)model_pos && max_pos > 0 && j == 0)
                 params.all->trace_message << "Shouldn't reprocess right after process!!!" << endl;
               // std::cout<<max_pos<<" "<<subopt[max_pos]<< endl;
               // std::cout<<params.model->support_vec[0]->example_counter<< endl;
               if (max_pos * model->num_support <= params.maxcache)
                 make_hot_sv(params, max_pos);
               update(params, max_pos);
             }
           }
           else
           {
             size_t rand_pos = (size_t)floorf(params._random_state->get_and_update_random() * model->num_support);
             update(params, rand_pos);
           }
         }
         // std::cout<< endl;
         // td::cout<<params.model->support_vec[0]->example_counter<< endl;
         free(subopt);
       }
     }
   }
   else
     for (size_t i = 0; i < params.pool_pos; i++) delete params.pool[i];

   // params.all->opts_n_args.trace_message<<params.model->support_vec[0]->example_counter<< endl;
   // for(int i = 0;i < params.pool_size;i++)
   //   params.all->opts_n_args.trace_message<<scores[i]<<" ";
   // params.all->opts_n_args.trace_message<< endl;
   free(scores);
   // params.all->opts_n_args.trace_message<<params.model->support_vec[0]->example_counter<< endl;
   free(train_pool);
   // params.all->opts_n_args.trace_message<<params.model->support_vec[0]->example_counter<< endl;
 }

 void learn(svm_params& params, single_learner&, example& ec)
 {
   flat_example* fec = flatten_sort_example(*(params.all), &ec);
   if (fec)
   {
     svm_example* sec = &calloc_or_throw<svm_example>();
     sec->init_svm_example(fec);
     float score = 0;
     predict(params, &sec, &score, 1);
     ec.pred.scalar = score;
     // std::cout<<"Score = "<<score<< endl;
     ec.loss = std::max(0.f, 1.f - score * ec.l.simple.label);
     params.loss_sum += ec.loss;
     if (params.all->training && ec.example_counter % 100 == 0)
       trim_cache(params);
     if (params.all->training && ec.example_counter % 1000 == 0 && ec.example_counter >= 2)
     {
       params.all->trace_message << "Number of support vectors = " << params.model->num_support << endl;
       params.all->trace_message << "Number of kernel evaluations = " << num_kernel_evals << " "
                                 << "Number of cache queries = " << num_cache_evals << " loss sum = " << params.loss_sum
                                 << " " << params.model->alpha[params.model->num_support - 1] << " "
                                 << params.model->alpha[params.model->num_support - 2] << endl;
     }
     params.pool[params.pool_pos] = sec;
     params.pool_pos++;

     if (params.pool_pos == params.pool_size)
     {
       train(params);
       params.pool_pos = 0;
     }
   }
 }

 LEARNER::base_learner* kernel_svm_setup(options_i& options, vw& all)
 {
   auto params = scoped_calloc_or_throw<svm_params>();
   std::string kernel_type;
   float bandwidth = 1.f;
   int degree = 2;

   bool ksvm = false;

   option_group_definition new_options("Kernel SVM");
   new_options.add(make_option("ksvm", ksvm).keep().help("kernel svm"))
       .add(make_option("reprocess", params->reprocess).default_value(1).help("number of reprocess steps for LASVM"))
       .add(make_option("pool_greedy", params->active_pool_greedy).help("use greedy selection on mini pools"))
       .add(make_option("para_active", params->para_active).help("do parallel active learning"))
       .add(make_option("pool_size", params->pool_size).default_value(1).help("size of pools for active learning"))
       .add(make_option("subsample", params->subsample)
                .default_value(1)
                .help("number of items to subsample from the pool"))
       .add(make_option("kernel", kernel_type)
                .keep()
                .default_value("linear")
                .help("type of kernel (rbf or linear (default))"))
       .add(make_option("bandwidth", bandwidth).keep().default_value(1.f).help("bandwidth of rbf kernel"))
       .add(make_option("degree", degree).keep().default_value(2).help("degree of poly kernel"));
   options.add_and_parse(new_options);

   if (!ksvm)
   {
     return nullptr;
   }

   std::string loss_function = "hinge";
   float loss_parameter = 0.0;
   delete all.loss;
   all.loss = getLossFunction(all, loss_function, (float)loss_parameter);

   params->model = &calloc_or_throw<svm_model>();
   params->model->num_support = 0;
   params->maxcache = 1024 * 1024 * 1024;
   params->loss_sum = 0.;
   params->all = &all;
   params->_random_state = all.get_random_state();

   // This param comes from the active reduction.
   // During options refactor: this changes the semantics a bit - now this will only be true if --active was supplied and
   // NOT --simulation
   if (all.active)
     params->active = true;
   if (params->active)
     params->active_c = 1.;

   params->pool = calloc_or_throw<svm_example*>(params->pool_size);
   params->pool_pos = 0;

   if (!options.was_supplied("subsample") && params->para_active)
     params->subsample = (size_t)ceil(params->pool_size / all.all_reduce->total);

   params->lambda = all.l2_lambda;
   if (params->lambda == 0.)
     params->lambda = 1.;
   params->all->trace_message << "Lambda = " << params->lambda << endl;
   params->all->trace_message << "Kernel = " << kernel_type << endl;

   if (kernel_type.compare("rbf") == 0)
   {
     params->kernel_type = SVM_KER_RBF;
     params->all->trace_message << "bandwidth = " << bandwidth << endl;
     params->kernel_params = &calloc_or_throw<double>();
     *((float*)params->kernel_params) = bandwidth;
   }
   else if (kernel_type.compare("poly") == 0)
   {
     params->kernel_type = SVM_KER_POLY;
     params->all->trace_message << "degree = " << degree << endl;
     params->kernel_params = &calloc_or_throw<int>();
     *((int*)params->kernel_params) = degree;
   }
   else
     params->kernel_type = SVM_KER_LIN;

   params->all->weights.stride_shift(0);

   learner<svm_params, example>& l = init_learner(params, learn, predict, 1);
   l.set_save_load(save_load);
   return make_base(l);
 }
poly_kernel
float poly_kernel(const flat_example *fec1, const flat_example *fec2, int power)
Definition: kernel_svm.cc:421

v_array::resize
void resize(size_t length)
Definition: v_array.h:69

kernel_svm_setup
LEARNER::base_learner * kernel_svm_setup(options_i &options, vw &all)
Definition: kernel_svm.cc:867

example::example_counter
size_t example_counter
Definition: example.h:64

vw::loss
loss_function * loss
Definition: global_data.h:523

num_kernel_evals
static size_t num_kernel_evals
Definition: kernel_svm.cc:44

memory.h

loss_function
Definition: loss_functions.h:13

parse_example.h

v_array::pop
T pop()
Definition: v_array.h:58

svm_params::_random_state
std::shared_ptr< rand_state > _random_state
Definition: kernel_svm.cc:119

polyprediction::scalar
float scalar
Definition: example.h:45

save_load_svm_model
void save_load_svm_model(svm_params &params, io_buf &model_file, bool read, bool text)
Definition: kernel_svm.cc:334

svm_example::init_svm_example
void init_svm_example(flat_example *fec)
Definition: kernel_svm.cc:149

gd.h

svm_params::maxcache
size_t maxcache
Definition: kernel_svm.cc:104

features::indicies
v_array< feature_index > indicies
Definition: feature_group.h:244

svm_params::model
svm_model * model
Definition: kernel_svm.cc:103

svm_params::local_begin
size_t local_begin
Definition: kernel_svm.cc:113

flat_example::total_sum_feat_sq
float total_sum_feat_sq
Definition: example.h:96

constant.h

features
the core definition of a set of features.
Definition: feature_group.h:241

dense_dot
float dense_dot(float *v1, v_array< float > v2, size_t n)
Definition: kernel_svm.cc:450

feature_value
float feature_value
Definition: feature_group.h:20

svm_params::current_t
size_t current_t
Definition: kernel_svm.cc:114

LEARNER::make_base
base_learner * make_base(learner< T, E > &base)
Definition: learner.h:462

VW::config::option_group_definition
Definition: options.h:85

svm_params::lambda
float lambda
Definition: kernel_svm.cc:108

label_data::weight
float weight
Definition: simple_label.h:15

features::values
v_array< feature_value > values
Definition: feature_group.h:243

svm_params::active
bool active
Definition: kernel_svm.cc:93

VW::config::options_i::add_and_parse
virtual void add_and_parse(const option_group_definition &group)=0

LEARNER::learner::set_save_load
void set_save_load(void(*sl)(T &, io_buf &, bool, bool))
Definition: learner.h:257

label_data::label
float label
Definition: simple_label.h:14

svm_params::pool
svm_example ** pool
Definition: kernel_svm.cc:107

polylabel::simple
label_data simple
Definition: example.h:28

free_flatten_example
void free_flatten_example(flat_example *fec)
Definition: example.cc:190

learn
void learn(svm_params &params, single_learner &, example &ec)
Definition: kernel_svm.cc:833

SVM_KER_LIN
#define SVM_KER_LIN
Definition: kernel_svm.cc:33

flat_example::l
polylabel l
Definition: example.h:86

flat_example::fs
features fs
Definition: example.h:97

AllReduce::total
const size_t total
Definition: allreduce.h:80

LEARNER::learner
Definition: cb_explore.h:11

AllReduce::node
const size_t node
Definition: allreduce.h:81

sync_queries
void sync_queries(vw &all, svm_params &params, bool *train_pool)
Definition: kernel_svm.cc:620

v_array::begin
T *& begin()
Definition: v_array.h:42

vw::training
bool training
Definition: global_data.h:488

v_array::size
size_t size() const
Definition: v_array.h:68

svm_model
Definition: kernel_svm.cc:58

vw
Definition: global_data.h:369

free_it
void free_it(void *ptr)
Definition: memory.h:94

vw::get_random_state
std::shared_ptr< rand_state > get_random_state()
Definition: global_data.h:553

io_buf::head
char * head
Definition: io_buf.h:67

trim_cache
static int trim_cache(svm_params &params)
Definition: kernel_svm.cc:245

vw::all_reduce
AllReduce * all_reduce
Definition: global_data.h:381

features::size
size_t size() const
Definition: feature_group.h:280

io_buf::bin_read_fixed
size_t bin_read_fixed(char *data, size_t len, const char *read_message)
Definition: io_buf.h:230

copy_char
void copy_char(char &c1, const char &c2) noexcept
Definition: kernel_svm.cc:610

LEARNER::init_learner
learner< T, E > & init_learner(free_ptr< T > &dat, L *base, void(*learn)(T &, L &, E &), void(*predict)(T &, L &, E &), size_t ws, prediction_type::prediction_type_t pred_type)
Definition: learner.h:369

update
bool update(svm_params &params, size_t pos)
Definition: kernel_svm.cc:557

v_array::push_back
void push_back(const T &new_ele)
Definition: v_array.h:107

vw::l2_lambda
float l2_lambda
Definition: global_data.h:445

save_load_flat_example
int save_load_flat_example(io_buf &model_file, bool read, flat_example *&fec)
Definition: kernel_svm.cc:261

svm_example
Definition: kernel_svm.cc:47

svm_params::pool_pos
size_t pool_pos
Definition: kernel_svm.cc:99

svm_model::delta
v_array< float > delta
Definition: kernel_svm.cc:63

io_buf::files
v_array< int > files
Definition: io_buf.h:64

add_size_t
void add_size_t(size_t &t1, const size_t &t2) noexcept
Definition: kernel_svm.cc:616

svm_params
Definition: kernel_svm.cc:90

label_data
Definition: simple_label.h:12

svm_params::kernel_params
void * kernel_params
Definition: kernel_svm.cc:110

vw::active
bool active
Definition: global_data.h:489

vw::trace_message
vw_ostream trace_message
Definition: global_data.h:424

make_hot_sv
static int make_hot_sv(svm_params &params, size_t svi)
Definition: kernel_svm.cc:202

cache.h

svm_params::pool_size
size_t pool_size
Definition: kernel_svm.cc:98

VW::config::options_i::was_supplied
virtual bool was_supplied(const std::string &key)=0

predict
void predict(svm_params &params, svm_example **ec_arr, float *scores, size_t n)
Definition: kernel_svm.cc:457

svm_params::reprocess
size_t reprocess
Definition: kernel_svm.cc:101

kernel_function
float kernel_function(const flat_example *fec1, const flat_example *fec2, void *params, size_t kernel_type)
Definition: kernel_svm.cc:436

svm_params::current_pass
size_t current_pass
Definition: kernel_svm.cc:92

linear_kernel
float linear_kernel(const flat_example *fec1, const flat_example *fec2)
Definition: kernel_svm.cc:387

VW::config::options_i
Definition: options.h:107

rand48.h

feature_index
uint64_t feature_index
Definition: feature_group.h:21

svm_params::kernel_type
size_t kernel_type
Definition: kernel_svm.cc:111

svm_params::subsample
size_t subsample
Definition: kernel_svm.cc:100

example
Definition: example.h:54

SVM_KER_POLY
#define SVM_KER_POLY
Definition: kernel_svm.cc:35

suboptimality
size_t suboptimality(svm_model *model, double *subopt)
Definition: kernel_svm.cc:486

svm_params::active_pool_greedy
bool active_pool_greedy
Definition: kernel_svm.cc:94

io_buf
Definition: io_buf.h:54

io_buf::space
v_array< char > space
Definition: io_buf.h:62

reductions.h

SVM_KER_RBF
#define SVM_KER_RBF
Definition: kernel_svm.cc:34

free_svm_model
void free_svm_model(svm_model *model)
Definition: kernel_svm.cc:66

save_load
void save_load(svm_params &params, io_buf &model_file, bool read, bool text)
Definition: kernel_svm.cc:376

v_array::end
T *& end()
Definition: v_array.h:43

svm_params::~svm_params
~svm_params()
Definition: kernel_svm.cc:121

example::loss
float loss
Definition: example.h:70

svm_model::support_vec
v_array< svm_example * > support_vec
Definition: kernel_svm.cc:61

VW::config::option_group_definition::add
option_group_definition & add(T &&op)
Definition: options.h:90

svm_example::compute_kernels
int compute_kernels(svm_params &params)
Definition: kernel_svm.cc:166

add
int add(svm_params &params, svm_example *fec)
Definition: kernel_svm.cc:546

flatten_sort_example
flat_example * flatten_sort_example(vw &all, example *ec)
Definition: example.cc:182

VW::config
Definition: options.h:11

example::l
polylabel l
Definition: example.h:57

svm_model::alpha
v_array< float > alpha
Definition: kernel_svm.cc:62

add_double
void add_double(double &t1, const double &t2) noexcept
Definition: kernel_svm.cc:618

VW::config::make_option
typed_option< T > make_option(std::string name, T &location)
Definition: options.h:80

svm_params::para_active
bool para_active
Definition: kernel_svm.cc:95

io_buf::bin_write_fixed
size_t bin_write_fixed(const char *data, size_t len)
Definition: io_buf.h:252

learner.h

svm_params::local_end
size_t local_end
Definition: kernel_svm.cc:113

accumulate.h

train
void train(svm_params &params)
Definition: kernel_svm.cc:696

vw.h

flat_example::example_counter
size_t example_counter
Definition: example.h:91

svm_example::~svm_example
~svm_example()
Definition: kernel_svm.cc:155

svm_params::loss_sum
float loss_sum
Definition: kernel_svm.cc:116

flat_example
Definition: example.h:84

svm_model::num_support
size_t num_support
Definition: kernel_svm.cc:60

svm_params::all
vw * all
Definition: kernel_svm.cc:118

vw_allreduce.h

example::pred
polyprediction pred
Definition: example.h:60

svm_example::ex
flat_example ex
Definition: kernel_svm.cc:50

LEARNER
Definition: cb_explore.h:8

v_array::delete_v
void delete_v()
Definition: v_array.h:98

svm_example::krow
v_array< float > krow
Definition: kernel_svm.cc:49

v_array< float >

getLossFunction
loss_function * getLossFunction(vw &all, std::string funcName, float function_parameter)
Definition: loss_functions.cc:363

rbf_kernel
float rbf_kernel(const flat_example *fec1, const flat_example *fec2, float bandwidth)
Definition: kernel_svm.cc:429

bin_text_read_write_fixed
size_t bin_text_read_write_fixed(io_buf &io, char *data, size_t len, const char *read_message, bool read, std::stringstream &msg, bool text)
Definition: io_buf.h:326

num_cache_evals
static size_t num_cache_evals
Definition: kernel_svm.cc:45

f
float f
Definition: cache.cc:40

svm_params::active_c
double active_c
Definition: kernel_svm.cc:96

svm_example::clear_kernels
int clear_kernels()
Definition: kernel_svm.cc:194