cpp/8.8.1/lrqfa_8cc_source.html

 #include <string>
 #include "reductions.h"
 #include "rand48.h"
 #include "parse_args.h"  // for spoof_hex_encoded_namespaces

 using namespace LEARNER;
 using namespace VW::config;

 struct LRQFAstate
 {
   vw* all;
   std::string field_name;
   int k;
   int field_id[256];
   size_t orig_size[256];
 };

 inline float cheesyrand(uint64_t x)
 {
   uint64_t seed = x;

   return merand48(seed);
 }

 constexpr inline bool example_is_test(example& ec) { return ec.l.simple.label == FLT_MAX; }

 template <bool is_learn>
 void predict_or_learn(LRQFAstate& lrq, single_learner& base, example& ec)
 {
   vw& all = *lrq.all;

   memset(lrq.orig_size, 0, sizeof(lrq.orig_size));
   for (namespace_index i : ec.indices) lrq.orig_size[i] = ec.feature_space[i].size();

   size_t which = ec.example_counter;
   float first_prediction = 0;
   float first_loss = 0;
   unsigned int maxiter = (is_learn && !example_is_test(ec)) ? 2 : 1;
   unsigned int k = lrq.k;
   float sqrtk = (float)std::sqrt(k);

   uint32_t stride_shift = lrq.all->weights.stride_shift();
   uint64_t weight_mask = lrq.all->weights.mask();
   for (unsigned int iter = 0; iter < maxiter; ++iter, ++which)
   {
     // Add left LRQ features, holding right LRQ features fixed
     //     and vice versa

     for (std::string::const_iterator i1 = lrq.field_name.begin(); i1 != lrq.field_name.end(); ++i1)
     {
       for (std::string::const_iterator i2 = i1 + 1; i2 != lrq.field_name.end(); ++i2)
       {
         unsigned char left = (which % 2) ? *i1 : *i2;
         unsigned char right = ((which + 1) % 2) ? *i1 : *i2;
         unsigned int lfd_id = lrq.field_id[left];
         unsigned int rfd_id = lrq.field_id[right];
         for (unsigned int lfn = 0; lfn < lrq.orig_size[left]; ++lfn)
         {
           features& fs = ec.feature_space[left];
           float lfx = fs.values[lfn];
           uint64_t lindex = fs.indicies[lfn];
           for (unsigned int n = 1; n <= k; ++n)
           {
             uint64_t lwindex =
                 (lindex + ((uint64_t)(rfd_id * k + n) << stride_shift));  // a feature has k weights in each field
             float* lw = &all.weights[lwindex & weight_mask];
             // perturb away from saddle point at (0, 0)
             if (is_learn && !example_is_test(ec) && *lw == 0)
               *lw = cheesyrand(lwindex) * 0.5f / sqrtk;

             for (unsigned int rfn = 0; rfn < lrq.orig_size[right]; ++rfn)
             {
               features& rfs = ec.feature_space[right];
               //                    feature* rf = ec.atomics[right].begin + rfn;
               // NB: ec.ft_offset added by base learner
               float rfx = rfs.values[rfn];
               uint64_t rindex = rfs.indicies[rfn];
               uint64_t rwindex = (rindex + ((uint64_t)(lfd_id * k + n) << stride_shift));

               rfs.push_back(*lw * lfx * rfx, rwindex);
               if (all.audit || all.hash_inv)
               {
                 std::stringstream new_feature_buffer;
                 new_feature_buffer << right << '^' << rfs.space_names[rfn].get()->second << '^' << n;
 #ifdef _WIN32
                 char* new_space = _strdup("lrqfa");
                 char* new_feature = _strdup(new_feature_buffer.str().c_str());
 #else
                 char* new_space = strdup("lrqfa");
                 char* new_feature = strdup(new_feature_buffer.str().c_str());
 #endif
                 rfs.space_names.push_back(audit_strings_ptr(new audit_strings(new_space, new_feature)));
               }
             }
           }
         }
       }
     }

     if (is_learn)
       base.learn(ec);
     else
       base.predict(ec);

     // Restore example
     if (iter == 0)
     {
       first_prediction = ec.pred.scalar;
       first_loss = ec.loss;
     }
     else
     {
       ec.pred.scalar = first_prediction;
       ec.loss = first_loss;
     }

     for (char i : lrq.field_name)
     {
       namespace_index right = i;
       features& rfs = ec.feature_space[right];
       rfs.values.end() = rfs.values.begin() + lrq.orig_size[right];

       if (all.audit || all.hash_inv)
       {
         for (size_t j = lrq.orig_size[right]; j < rfs.space_names.size(); ++j) rfs.space_names[j].~audit_strings_ptr();

         rfs.space_names.end() = rfs.space_names.begin() + lrq.orig_size[right];
       }
     }
   }
 }

 LEARNER::base_learner* lrqfa_setup(options_i& options, vw& all)
 {
   std::string lrqfa;
   option_group_definition new_options("Low Rank Quadratics FA");
   new_options.add(make_option("lrqfa", lrqfa).keep().help("use low rank quadratic features with field aware weights"));
   options.add_and_parse(new_options);

   if (!options.was_supplied("lrqfa"))
     return nullptr;

   auto lrq = scoped_calloc_or_throw<LRQFAstate>();
   lrq->all = &all;

   std::string lrqopt = spoof_hex_encoded_namespaces(lrqfa);
   size_t last_index = lrqopt.find_last_not_of("0123456789");
   new (&lrq->field_name) std::string(lrqopt.substr(0, last_index + 1));  // make sure there is no duplicates
   lrq->k = atoi(lrqopt.substr(last_index + 1).c_str());

   int fd_id = 0;
   for (char i : lrq->field_name) lrq->field_id[(int)i] = fd_id++;

   all.wpp = all.wpp * (uint64_t)(1 + lrq->k);
   learner<LRQFAstate, example>& l = init_learner(lrq, as_singleline(setup_base(options, all)), predict_or_learn<true>,
       predict_or_learn<false>, 1 + lrq->field_name.size() * lrq->k);

   return make_base(l);
 }
example_predict::indices
v_array< namespace_index > indices
Definition: example_predict.h:40

example::example_counter
size_t example_counter
Definition: example.h:64

vw::weights
parameters weights
Definition: global_data.h:537

LEARNER::learner::predict
void predict(E &ec, size_t i=0)
Definition: learner.h:169

stride_shift
uint64_t stride_shift(const stagewise_poly &poly, uint64_t idx)
Definition: stagewise_poly.cc:81

features::push_back
void push_back(feature_value v, feature_index i)
Definition: feature_group.h:336

polyprediction::scalar
float scalar
Definition: example.h:45

audit_strings_ptr
std::shared_ptr< audit_strings > audit_strings_ptr
Definition: feature_group.h:23

vw::hash_inv
bool hash_inv
Definition: global_data.h:541

features::indicies
v_array< feature_index > indicies
Definition: feature_group.h:244

LRQFAstate::all
vw * all
Definition: lrqfa.cc:11

predict_or_learn
void predict_or_learn(LRQFAstate &lrq, single_learner &base, example &ec)
Definition: lrqfa.cc:28

lrqfa_setup
LEARNER::base_learner * lrqfa_setup(options_i &options, vw &all)
Definition: lrqfa.cc:133

features
the core definition of a set of features.
Definition: feature_group.h:241

LEARNER::make_base
base_learner * make_base(learner< T, E > &base)
Definition: learner.h:462

VW::config::option_group_definition
Definition: options.h:85

example_is_test
constexpr bool example_is_test(example &ec)
Definition: lrqfa.cc:25

features::values
v_array< feature_value > values
Definition: feature_group.h:243

VW::config::options_i::add_and_parse
virtual void add_and_parse(const option_group_definition &group)=0

spoof_hex_encoded_namespaces
std::string spoof_hex_encoded_namespaces(const std::string &arg)
Definition: parse_args.cc:568

label_data::label
float label
Definition: simple_label.h:14

merand48
float merand48(uint64_t &initial)
Definition: rand48.cc:16

polylabel::simple
label_data simple
Definition: example.h:28

LEARNER::learner
Definition: cb_explore.h:11

v_array::begin
T *& begin()
Definition: v_array.h:42

LRQFAstate::field_id
int field_id[256]
Definition: lrqfa.cc:14

LRQFAstate
Definition: lrqfa.cc:9

v_array::size
size_t size() const
Definition: v_array.h:68

LRQFAstate::orig_size
size_t orig_size[256]
Definition: lrqfa.cc:15

vw
Definition: global_data.h:369

example_predict::feature_space
std::array< features, NUM_NAMESPACES > feature_space
Definition: example_predict.h:41

LEARNER::as_singleline
single_learner * as_singleline(learner< T, E > *l)
Definition: learner.h:476

LEARNER::init_learner
learner< T, E > & init_learner(free_ptr< T > &dat, L *base, void(*learn)(T &, L &, E &), void(*predict)(T &, L &, E &), size_t ws, prediction_type::prediction_type_t pred_type)
Definition: learner.h:369

v_array::push_back
void push_back(const T &new_ele)
Definition: v_array.h:107

VW::config::options_i::was_supplied
virtual bool was_supplied(const std::string &key)=0

namespace_index
unsigned char namespace_index
Definition: example_predict.h:8

VW::config::options_i
Definition: options.h:107

rand48.h

example
Definition: example.h:54

vw::wpp
uint32_t wpp
Definition: global_data.h:432

reductions.h

v_array::end
T *& end()
Definition: v_array.h:43

example::loss
float loss
Definition: example.h:70

VW::config::option_group_definition::add
option_group_definition & add(T &&op)
Definition: options.h:90

LRQFAstate::field_name
std::string field_name
Definition: lrqfa.cc:12

features::space_names
v_array< audit_strings_ptr > space_names
Definition: feature_group.h:245

VW::config
Definition: options.h:11

example::l
polylabel l
Definition: example.h:57

VW::config::make_option
typed_option< T > make_option(std::string name, T &location)
Definition: options.h:80

parameters::stride_shift
uint32_t stride_shift()
Definition: array_parameters.h:244

cheesyrand
float cheesyrand(uint64_t x)
Definition: lrqfa.cc:18

vw::audit
bool audit
Definition: global_data.h:486

setup_base
LEARNER::base_learner * setup_base(options_i &options, vw &all)
Definition: parse_args.cc:1222

example::pred
polyprediction pred
Definition: example.h:60

LEARNER
Definition: cb_explore.h:8

LEARNER::learner::learn
void learn(E &ec, size_t i=0)
Definition: learner.h:160

parameters::mask
uint64_t mask()
Definition: array_parameters.h:260

LRQFAstate::k
int k
Definition: lrqfa.cc:13

parse_args.h

audit_strings
std::pair< std::string, std::string > audit_strings
Definition: feature_group.h:22