deep-learning large-scale-learning non-convex-optimization optimizers stochastic-optimization

Optimization methods for training neural networks

This repository is the collection of tutorials on my experience in training large neural networks, extracting features of different optimizers, models and regularization techniques as well as different set ups of training. Here I exclude everything related to the convex deterministic optimization and focus only on the stochastic methods that address problems related to the data processing from different domains.

Basic concepts: models, autograd, generalization, local minima and their features
Ingredients of basic optimizers
Key elements of models
Federated learning
Few-bit optimizers
Privacy-aware optimizers
From first-order stochastic methods to higher order optimizers
Paralellism in training large neural networks
Meta optimizers
Challenges and perspectives

About

Tutorials on optimizers for deep neural networks

deep-learning large-scale-learning non-convex-optimization optimizers stochastic-optimization

MIT License