Obvious memory reductions (#15204)

* remove rd->update_every * reduce amount of memory for RRDDIM * reorgnize rrddim->db entries * optimize rrdset and statsd * optimize dictionaries * RW_SPINLOCK for dictionaries * fix codeql warning * rw_spinlock improvements * remove obsolete assertion * fix crash on health_alarm_log_process() * use RW_SPINLOCK for AVL trees * add RW_SPINLOCK read/write trylock * pgc and mrg now use rw_spinlocks; cache line optimizations for mrg * thread tag of dbegnine init * append created datafile, lockless * make DOUBLE_LINKED_LIST_APPEND_ITEM_UNSAFE friendly for lockless use * thread cancelability in spinlocks; optimize thread cancelability management * introduce a JudyL to index datafiles and use it during queries to quickly find the relevant files * use the last timestamp of each journal file for indexing * when the previous cannot be found, start from the beginning * add more stats to PDC to trace routing easier * rename spinlock functions * fix for spinlock renames * revert statsd socket statistics to size_t * turn fatal into internal_fatal() * show candidates always * show connected status and connection attempts
author: Costa Tsaousis <costa@netdata.cloud> 2023-06-19 23:19:36 +0300
committer: GitHub <noreply@github.com> 2023-06-19 23:19:36 +0300
commit: 43c749b07d07e79dae8111dcdb7bc1a46c3dda1b (patch)
tree: 4c3a270652787c91ef15c7ef8e29915769fc1fd4 /ml/ml.cc
parent: 0b4f820e9d42d10f64c3305d9c084261bc9880cf (diff)
1 files changed, 17 insertions, 17 deletions
diff --git a/ml/ml.cc b/ml/ml.cc
index 4d157b8f94..0e09b3612a 100644
--- a/ml/ml.cc
+++ b/ml/ml.cc
@@ -337,7 +337,7 @@ ml_dimension_calculated_numbers(ml_training_thread_t *training_thread, ml_dimens
     // Figure out what our time window should be.
     training_response.query_before_t = training_response.last_entry_on_response;
     training_response.query_after_t = std::max(
-        training_response.query_before_t - static_cast<time_t>((max_n - 1) * dim->rd->update_every),
+        training_response.query_before_t - static_cast<time_t>((max_n - 1) * dim->rd->rrdset->update_every),
         training_response.first_entry_on_response
     );
 
@@ -568,9 +568,9 @@ int ml_dimension_load_models(RRDDIM *rd) {
     if (!dim)
         return 0;
 
-    netdata_spinlock_lock(&dim->slock);
+    spinlock_lock(&dim->slock);
     bool is_empty = dim->km_contexts.empty();
-    netdata_spinlock_unlock(&dim->slock);
+    spinlock_unlock(&dim->slock);
 
     if (!is_empty)
         return 0;
@@ -602,7 +602,7 @@ int ml_dimension_load_models(RRDDIM *rd) {
     if (unlikely(rc != SQLITE_OK))
         goto bind_fail;
 
-    netdata_spinlock_lock(&dim->slock);
+    spinlock_lock(&dim->slock);
 
     dim->km_contexts.reserve(Cfg.num_models_to_use);
     while ((rc = sqlite3_step_monitored(res)) == SQLITE_ROW) {
@@ -639,7 +639,7 @@ int ml_dimension_load_models(RRDDIM *rd) {
         dim->ts = TRAINING_STATUS_TRAINED;
     }
 
-    netdata_spinlock_unlock(&dim->slock);
+    spinlock_unlock(&dim->slock);
 
     if (unlikely(rc != SQLITE_DONE))
         error_report("Failed to load models, rc = %d", rc);
@@ -666,7 +666,7 @@ ml_dimension_train_model(ml_training_thread_t *training_thread, ml_dimension_t *
     ml_training_response_t training_response = P.second;
 
     if (training_response.result != TRAINING_RESULT_OK) {
-        netdata_spinlock_lock(&dim->slock);
+        spinlock_lock(&dim->slock);
 
         dim->mt = METRIC_TYPE_CONSTANT;
 
@@ -688,7 +688,7 @@ ml_dimension_train_model(ml_training_thread_t *training_thread, ml_dimension_t *
         dim->last_training_time = training_response.last_entry_on_response;
         enum ml_training_result result = training_response.result;
 
-        netdata_spinlock_unlock(&dim->slock);
+        spinlock_unlock(&dim->slock);
 
         return result;
     }
@@ -714,7 +714,7 @@ ml_dimension_train_model(ml_training_thread_t *training_thread, ml_dimension_t *
     // update models
     worker_is_busy(WORKER_TRAIN_UPDATE_MODELS);
     {
-        netdata_spinlock_lock(&dim->slock);
+        spinlock_lock(&dim->slock);
 
         if (dim->km_contexts.size() < Cfg.num_models_to_use) {
             dim->km_contexts.push_back(std::move(dim->kmeans));
@@ -753,7 +753,7 @@ ml_dimension_train_model(ml_training_thread_t *training_thread, ml_dimension_t *
         model_info.kmeans = dim->km_contexts.back();
         training_thread->pending_model_info.push_back(model_info);
 
-        netdata_spinlock_unlock(&dim->slock);
+        spinlock_unlock(&dim->slock);
     }
 
     return training_response.result;
@@ -782,7 +782,7 @@ ml_dimension_schedule_for_training(ml_dimension_t *dim, time_t curr_time)
         break;
     case TRAINING_STATUS_SILENCED:
     case TRAINING_STATUS_TRAINED:
-        if ((dim->last_training_time + (Cfg.train_every * dim->rd->update_every)) < curr_time) {
+        if ((dim->last_training_time + (Cfg.train_every * dim->rd->rrdset->update_every)) < curr_time) {
             schedule_for_training = true;
             dim->ts = TRAINING_STATUS_PENDING_WITH_MODEL;
         }
@@ -852,7 +852,7 @@ ml_dimension_predict(ml_dimension_t *dim, time_t curr_time, calculated_number_t
     /*
      * Lock to predict and possibly schedule the dimension for training
     */
-    if (netdata_spinlock_trylock(&dim->slock) == 0)
+    if (spinlock_trylock(&dim->slock) == 0)
         return false;
 
     // Mark the metric time as variable if we received different values
@@ -867,7 +867,7 @@ ml_dimension_predict(ml_dimension_t *dim, time_t curr_time, calculated_number_t
         case TRAINING_STATUS_UNTRAINED:
         case TRAINING_STATUS_PENDING_WITHOUT_MODEL: {
         case TRAINING_STATUS_SILENCED:
-            netdata_spinlock_unlock(&dim->slock);
+            spinlock_unlock(&dim->slock);
             return false;
         }
         default:
@@ -892,7 +892,7 @@ ml_dimension_predict(ml_dimension_t *dim, time_t curr_time, calculated_number_t
 
         if (anomaly_score < (100 * Cfg.dimension_anomaly_score_threshold)) {
             global_statistics_ml_models_consulted(models_consulted);
-            netdata_spinlock_unlock(&dim->slock);
+            spinlock_unlock(&dim->slock);
             return false;
         }
 
@@ -906,7 +906,7 @@ ml_dimension_predict(ml_dimension_t *dim, time_t curr_time, calculated_number_t
         dim->ts = TRAINING_STATUS_SILENCED;
     }
 
-    netdata_spinlock_unlock(&dim->slock);
+    spinlock_unlock(&dim->slock);
 
     global_statistics_ml_models_consulted(models_consulted);
     return sum;
@@ -1277,7 +1277,7 @@ void ml_host_stop(RRDHOST *rh) {
             if (!dim)
                 continue;
 
-            netdata_spinlock_lock(&dim->slock);
+            spinlock_lock(&dim->slock);
 
             // reset dim
             // TODO: should we drop in-mem models, or mark them as stale? Is it
@@ -1292,7 +1292,7 @@ void ml_host_stop(RRDHOST *rh) {
 
             ml_kmeans_init(&dim->kmeans);
 
-            netdata_spinlock_unlock(&dim->slock);
+            spinlock_unlock(&dim->slock);
         }
         rrddim_foreach_done(rdp);
     }
@@ -1459,7 +1459,7 @@ void ml_dimension_new(RRDDIM *rd)
     else
         dim->mls = MACHINE_LEARNING_STATUS_ENABLED;
 
-    netdata_spinlock_init(&dim->slock);
+    spinlock_init(&dim->slock);
 
     dim->km_contexts.reserve(Cfg.num_models_to_use);
author	Costa Tsaousis <costa@netdata.cloud>	2023-06-19 23:19:36 +0300
committer	GitHub <noreply@github.com>	2023-06-19 23:19:36 +0300
commit	43c749b07d07e79dae8111dcdb7bc1a46c3dda1b (patch)
tree	4c3a270652787c91ef15c7ef8e29915769fc1fd4 /ml/ml.cc
parent	0b4f820e9d42d10f64c3305d9c084261bc9880cf (diff)