adamvm/CppThread

Multithreading: threads

When apply multithreading
When do not apply multithreading
Basic operations on threads
Passing arguments to thread function
Exceptions in threads
Puting thread into sleep

Współdzielenie danych

Niebezpieczeństwa podczas używania wielowątkowości
Thread sanitizer
Debugger
Mutexy
Menadżery blokad

Zmienne warunku

Aktywne czekanie (spinlock)
std::condition_variable
std::condition_variable_any
Zagrożenia dla std::condition_variable / std::condition_variable_any

Komunikacja jednokierunkowa (future, promise)

Opis
Funkcje std::future
Obsługa wyjątków w std::promise
std::shared_future

Zadania asynchroniczne (`std::assync`)

Opis
Polityki uruchamiania
Problem domyślnej polityki
std::packaged_task

Multithreading: threads

1. When to apply multithreading?

Divide work between cores
Improvement of performance
- Parallelize task (division the task into smaller)
- Parallelize data (run same task on multiple data chunks)

2. When not to apply multithreading

When to many parallel tasks can deteriorate overal performance (cost of creating thread, cost of resources - every thread consume memory)
When code complexity and effort to introduce threading is higher than performance gain (maintenance cost vs gain)

3. Basic operations on threads

Item	Description
`std::thread name(function)`	For thread creation we need to pass: function, functor, function object (it is copied to thread), lambda If thread do not receive any function then `std::thread::joinable()` will return `false` If we will not call `join()` or `detach()` `std::terminate` will be called If during thread life exception will raise, thread join will be not possible. We can use RAII (Resource Acquisition Is Initialization) - refer to "Example 2" Thread is non-copiable, we can move it instead (`std::move`)
`std::thread::joinable()`	Returns `true` if `join()` or `detach()` is possible
`std::thread::join()`	We can use to wait till thread finish all operations and we want to synchronize Program flow will not run further until thread will finish all requested work
`std::thread::detach()`	Main program runs and thread is detached We lose control over the thread, but it continue to run Every threads has own stack (return addres from function and local variables). We can use `detach()` for purpose of creating system daemon that runs in system even if main() is already finished
`std::thread::hardware_concurrency()`	returns value of available hardware units capable to run separated number of threads
`std::this_thread::get_id()`	Returns thread id that runs this operation `std::thread::id this_id = std::this_thread::get_id();`

Example 1

#include <thread>
#include <iostream>

struct Bar1 {
    void operator()() { std::cout << "Hello World!"; }
};

struct Bar2 {
    void foo() { std::cout << "Hello World!"; }
};

void foo() {
    std::cout << "Hello World!";
}

int main() {

    std::thread t1([]() { std:: cout << "Hello World!"; });

    std::thread t2(foo);
    // pass the function

    std::thread t3(&foo);
    // pass the function reference

    Bar1 bar1;
    std::thread t4(bar1);
    // overloaded function call operator

    std::thread t5(*foo);
    // pass the function pointer 

    Bar2 bar2;
    std::thread t6(&Bar2::foo, &bar2);

    t1.join();
    t2.join();
    t3.join();
    t4.join();
    t5.join();
    t6.join();
}

Example 2

/*
ThreadGuard use reference to thread. When execution reach end of scope destructor checks
whether `joinable()` is `true`. If yes then join the thread. Move semantics may be used
to move the thread.
*/
class ThreadGuard
{
    std::thread &t;

public:

    explicit ThreadGuard(std::thread& t_) : t(t_) { }
    ~ThreadGuard() {
        if (t.joinable())
            t.join();
    }
};

void fun() { }

int main()
{
    std::thread t(fun);
    ThreadGuard g(t);
    // or ThreadGuard(std::thread(fun));
}

4. Passing arguments to thread function

Pass by value

Struct SomeStruct { };

void bar(int x, std::string str, SomeStruct obj) { }

int main() {

    std::thread t(bar, 10, "String", SomeStruct{});
    t.join();
}

Pass by reference

If function expect value and get reference then:

create variable copy
and pass reference to copy (so other threads will not see changes on refered object)

To be able to use reference in threads wrapper std::ref should be introduced (or std::cref() for const reference).

void bar(int& x, int* y) {
    std::cout << "Inside fun: = " << x << " | y = " << *y << std::endl;
    x = 20;
    *y = 30;
}

int main() {
    int x = 10;
    int y = 10;
    std::thread t(bar, std::ref(x), &y);
    t.join();
    std::cout << "Outside fun: x = " << x << " | y = " << y << std::endl;

    return 0;
}

Warning! We should assure that time of refered variable is longer than thread itself

Example:

#include <thread>

void do_sth([[maybe_unused]] int i) { /* ... */ }

struct A {
    int& ref_;
    A(int& a) : ref_(a) {}
    void operator()() {
        do_sth(ref_); // potential access to
                      // a dangling reference
    }
};

std::thread create_thread() {
    int local = 0;
    A worker(local);
    std::thread t(worker);
    return t;
} // local is destroyed, reference in worker is dangling

int main() {
    auto t = create_thread();  // Undefined Behavior
    auto t2 = create_thread(); // Undefined Behavior
    t.join();
    t2.join();
    return 0;
}

Pass class method

Class method is run in thread as parameter and takes pointer to object that should be called on
- std::thread t(&Car::setData, &toyota, 2015, "Corolla") despite that finction declaration of setData() is void setData(int year, const string & model)
- Corolla does not require std::ref() because it is temporary variable (simillar to const &)
- Method (function, lambda or functor) is copied to thread memory
- Paramethers are copied or moved

Example 1 (code smell - potential problem)

void f(int i, std::string const& s);
void oops(int arg)
{
    char buffer[1024];
    sprintf(buffer, "%i", arg);
    std::thread t(f, 3, buffer);
    t.detach();
}

Implicit conversion from char[] to string and detach(). Conversion could be slowlier than detach() and we lost reference object.

Solution:

void f(int i, std::string const& s);
void oops(int arg)
{
    char buffer[1024];
    sprintf(buffer, "%i", arg);
    std::thread t(f, 3, std::string(buffer));
    t.detach();
}

5. Exceptions in threads

An exception can be only catch in the same thread where was thrown
To handle exception in other thread we should use pointer on exception: std::exception_ptr
- The thread that throw exception assigns to pointer std::current_exception()
- The thread that should handle has to check std::current_expection() != 0). If true, then current thread rethrows exception with std::rethrow_exception()
Usage of noexcept can be considered

#include <iostream>
#include <thread>
#include <exception>
#include <stdexcept>

int main()
{
    std::exception_ptr thread_exception = nullptr;
    std::thread t([](std::exception_ptr & te) {
        try {
            throw std::runtime_error("WTF");
        } catch (...) {
            te = std::current_exception();
        }
    }, std::ref(thread_exception));
    t.join();

    if (thread_exception) {
        try {
            std::rethrow_exception(thread_exception);
        } catch (const std::exception & ex) {
            std::cout << "Thread exited with an exception: " << ex.what() << "\n";
        }
    }
    return 0;
}

6. Puting thread into sleep

Item	Description
`#include <chrono>`	Library supporting date and time operations
`using namespace std::chrono_literals`	Let us use short forms e.g. 2s lub 2000ms instead of `std::chrono::seconds(2)` or `std::chrono::milliseconds(2000)`
`std::this_thread::sleep_until()`	Put the thread into sleep until specified moment of time
`std::thread::sleep_for()`	Put the thread into sleep for specified time Argument value is mimimal guaranteed time

Example 1

#include <chrono>
#include <iostream>
#include <thread>

int main()
{
    using namespace std::chrono_literals;

    std::cout << "Hello waiter\n" << std::flush;
    auto start = std::chrono::high_resolution_clock::now();

    std::this_thread::sleep_for(2s);

    auto end = std::chrono::high_resolution_clock::now();
    std::chrono::duration<double, std::milli> elapsed = end - start;

    std::cout << "waited " << elapsed.count() << " ms\n";
}

Wyjście:

>> Hello waiter
>> Waited 2000.12 ms

Współdzielenie danych

7. Niebezpieczeństwa podczas używania wielowątkowości

Zjawisko	Opis
Deadlock	Przykład Sytuacja, w której conajmniej dwa różne wątki czekają na siebie i żadna nie może pójść dalej Występuje losowo przy niektórych uruchomieniach programu Zalecane użycie `std::scoped_lock` do rozwiązania problemu zakleszczenia Operacja czekania na wątek nie blokuje procesora
Race conditions	Przykład Sytuacja, w której dwa lub więcej procesów wykonuje operację na zasobach dzielonych, a ostateczny wynik tej operacji jest zależny od momentu jej realizacji Wyścig = undefined behaviour Aby zapobiec warunkom wyścigu należy stworzyć mechanizm zabraniający więcej niż jednemu wątkowi dostępu do zasobów dzielonych w tym samym czasie Do wykrywania tego zjawiska służy tzw. Thread Sanitizer (TSan, Data race detector wbudowany g++ oraz clang) Debugger spowalnia wykonywanie operacji dlatego czasem może być ciężko wykryć coś takiego
Data races	Wyścig na danych, wartość zmiennej będzie zależeć od tego jak zostaną zakolejkowane wątki i może być różna przy różnych uruchomieniach programu
Zagłodzenie procesu/wątku	Sytuacja, w której przynajmniej jeden wątek nigdy nie dostanie wszystkich wymaganych zasobów
Livelock	Podobny do Deadlock przy czym stan dwóch procesów związanych z blokadą zmienia się w stosunku do drugiego procesu Deadlock powoduje nieskończone oczekiwanie podczas gdy Livelock, jest szczególnym przypadkiem deadlocka, który powoduje marnowanie cykli procesora

Przykład Deadlock

#include <thread>
#include <mutex>

using namespace std;

class X {

    mutable mutex mtx_;
    int value_ = 0;

public:
    explicit X(int v) : value(v) {}

    bool operator< (const X & other) const {
        lock_guard<mutex> ownGuard(mtx_);
        locK_guard<mutex> otherGuard(other.mtx_);
        // Rozwiazanie:
        // std::scoped_lock l(mtx_, other.mtx_);

        return value_ < other.value_;
    }
};

int main() {

    X x1(5);
    X x2(6);

    thread t1([&](){ x1 < x2; });
    thread t2([&](){ x2 < x1; });

    t1.join();
    t2.join();

    return 0;
}

Słowo kluczowe mutable przy mutexie oznacza tyle, że nawet w przypadku metody const stan mutexu mtx_ może zostać zmieniony (wywoływanie lock() i unlock() to w pewnym sensie jego modyfikacja)
Słowo kluczowe explicit przy konstruktorze blokuje niejawne konwersje
- Więcej informacji o explicit:
  - https://www.youtube.com/watch?v=Rr1NX1lH3oE

Przykład Race conditions

void abc(int &a) { a = 2; }
void def(int &a) { a = 3; }

int main()
{
    int x = 1;
    std::thread t1(abc, std::ref(x));
    std::thread t2(def, std::ref(x));

    t1.join();
    t2.join();

    std::cout << x << std::endl;
}

8. Thread sanitizer

>> g++ 1.cpp -lpthread -fsanitize=thread -O2 -g

>> ./a.out

-g - informacja dla debuggera

Jeśli nie ma "niebezpieczeństw", thread sanitizer nie pokaże "raportu".

9. Debugger

>> g++ 1.cpp -lpthread -g

>> gdb --tui ./a.out

Komenda	Opis
`b 5`	Ustawia breakpoint w 5 linii
`watch x`	Obserwowanie zmian zmiennej x (debugger zatrzyma się gdy nastąpi jej modyfikacja)
`c`	Kontynuowanie debugowania
`info threads`	Informacje o wątkach
`thread 3`	Przełączenie na wątek 3
`n`	Następna instrukcja
`fin`	Wykonanie wszystkiego do końca bieżącej funkcji
`up`	Przejście do wyższej ramki stosu
`down`	Przejście do niższej ramki stosu
`del br`	Usunięcie wszystkich breakpointów
CTRL + L	Odświeżenie widoku

10. Mutexy

Mutex Opis

Mutex	Opis
`std::mutex`	Blokuje jednoczesny dostęp do tzw. sekcji krytycznej Preferowane jest użycie `lock_guard` i zablokowanie całej funkcji, a nie pojedynczych linii Czas trwania blokady musi być możliwie jak najkrótszy Nie blokujemy instrukcji `sleep_for()` Zamiast wypisywać `std::cout << "Hello" << " World";` warto skleić stringa wcześniej za pomocą `std::stringstream` Preferowane wykorzystanie jako składnik w klasie W przypadku wystąpienia wyjątku `std::mutex` nie zostanie odblokowany i inne wątki nigdy nie skończą pracy. Stąd zalecane jest użycie ktoregoś z menadżerów blokad RAII W przypadku stałych (`const`) nie ma potrzby stosowania blokad

std::mutex

Blokuje jednoczesny dostęp do tzw. sekcji krytycznej
Preferowane jest użycie lock_guard i zablokowanie całej funkcji, a nie pojedynczych linii
Czas trwania blokady musi być możliwie jak najkrótszy
Nie blokujemy instrukcji sleep_for()
Zamiast wypisywać std::cout << "Hello" << " World"; warto skleić stringa wcześniej za pomocą std::stringstream
Preferowane wykorzystanie jako składnik w klasie
W przypadku wystąpienia wyjątku std::mutex nie zostanie odblokowany i inne wątki nigdy nie skończą pracy. Stąd zalecane jest użycie ktoregoś z menadżerów blokad RAII
W przypadku stałych (const) nie ma potrzby stosowania blokad

Najważniejsze funkcje `std::mutex`

Funkcja	Opis
`void lock()`	Zablokowanie mutexu Jeśli mutex jest zablokowany przez inny wątek to oczekujemy na odblokowanie
`void unlock()`	Odblokowanie mutexu
`bool try_lock()`	Próba zablokowania mutexu (zwraca `true` jeśli udało się zablokować i blokuje, `false` jeśli mutex zajęty i nie udało się go zablokować). Jest operacją nieblokującą i w przypadku nieudanej próby zajęcia mutexu możemy wykonać inne czynności

Przykład

#include <vector>
#include <thread>
#include <chrono>
#include <iostream>
#include <mutex>

void do_work(int id)
{
    this_thread::sleep_for(100ms);
    m.lock();
    cout << ss.rdbuf();
    m.unlock();
}

int main()
{
    std::mutex m;
    std::vector<std::thread> threads;

    for (int i = 0; i < 20; i++)
        threads.emplace_back(thread(do_work, i));

    for (auto && t : threads)
        t.join();

    return 0;
}

Pozostałe mutexy	Opis
`std::timed_mutex`	Dwie dodatkowe operacje oprócz standardowych z `std::mutex`: `bool try_lock_until(timeout_time)` - spróbuj zablokować do jakiegoś punktu w czasie (zwraca true jak się udało, false jeśli nie) `bool try_lock_for(timeout_duration)` - spróbuj zablokować na jakiś czas (zwraca true jak się udało, false jeśli nie)
`std::recursive_mutex`	Ten sam wątek może wielokrotnie pozyskać mutex poprzez wywołanie metody `lock()` lub `try_lock` Aby zwolnić mutex wątek musi taką samą ilość razy go odblokować Zazwyczaj stosowany w algorytmach rekurencyjnych
`std::recursive_timed_mutex`	Połączenie `std::timed_mutex` oraz `std::recursive_mutex`
`std::shared_mutex`	Możliwość pozyskiwania blokad współdzielonych przy pomocy `void lock_shared()` `bool try_lock_shared()` `bool try_lock_shared_for(real_time)` `bool try_lock_shared_until(abs_time)` `void unlock_shared()`

11. Menadżery blokad

Pozostałe mutexy	Opis
`std::lock_guard<mutex>`	Przykład Najprostszy, główny wybór Nie ma funkcji odblokowania, blokuje tak długo jak żyje Blokuje w konstruktorze Odblokowuje w destruktorze Przyjmuje dodatkowy patarametr - czytaj
`std::unique_lock<mutex>`	Opóźnione blokowanie Próby zablokowania ograniczone czasowo Blokowanie rekursywne Podejmowanie nieblokujących prób pozyskania blokady - `try_lock()` Obsługa `std::timed_mutex>` Korzystanie ze zmiennych warunkowych (condition variable) Niekopiowalny Przenoszalny (`std::move`) Przyjmuje dodatkowy patarametr - czytaj
`std::scoped_lock`	Przykład Przyjmuje różne mutexy Blokuje kilka mutexów Zapobiega zakleszczeniom (deadlock) Konstruktor blokuje wszystkie mutexy w bezpiecznej kolejności unikając blokad Destruktor odblokowuje je w kolejności odwrotnej Niekopiowalny
`std::shared_lock<shared_mutex>`	Przykład Menadżer współdzielonych blokad do odczytu Kilka wątków może współdzielić blokadę Wątki zapisujące muszą pozyskać wyłączną blokadę (`std::lock_guard` lub `std::unique_lock`) Te same własności co `std::unique_lock` Przyjmuje dodatkowy patarametr - czytaj

Przykład `std::lock_guard<mutex>`

#include <vector>
#include <thread>
#include <chrono>
#include <iostream>
#include <mutex>
#include <sstream>

void do_work(int id, mutex & m)
{
    this_thread::sleep_for(100ms);

    stringstream ss;
    ss << "Thread [" << id << "]: " << "Job done!" << std::endl;

    lock_guard<mutex> lock(m);

    cout << ss.rdbuf();
    // Tak naprawdę nie trzeba tutaj mutexa bo to pojedyncza operacja
    // Nie da się jej "zakłócić"
}

int main()
{
    std::mutex m;
    std::vector<std::thread> threads;

    for (int i = 0; i < 20; i++)
        threads.emplace_back(thread(do_work, i, std::ref(m)));

    for (auto && t : threads)
        t.join();

    return 0;
}

Przykład `std::scoped_lock`

#include <iostream>
#include <mutex>
#include <thread>

class X {
    mutable std::mutex mtx_;
    int value_ = 0;

public:
    explicit X(int v) : value_(v) {}

    bool operator<(const X & other) const {
        std::scoped_lock l(mtx_, other.mtx_);
        return value_ < other.value_;
    }
};

int main() {

    X x1(5);
    X x2(6);

    std::thread t1([&] {
        if (x1 < x2)
            std::cout << "x1 is less" << std::endl;
    });

    std::thread t2([&] {
        if (x2 < x1)
            std::cout << "x2 is less" << std::endl;
    });

    t1.join();
    t2.join();

    return 0;
}

Przykład `std::shared_lock<std::shared_mutex>`

#include <deque>
#include <shared_mutex>

std::deque<int> ids;
std::shared_mutex mtxIds;

int getIdsIndex() { /* ... */ }
int getIdsIndex() { /* ... */ }
int getIdsIndex() { /* ... */ }

void reader() {
    int index = getIdsIndex();
    std::shared_lock<std::shared_mutex> lock(mtxIds);
    int value = ids[index];
    lock.unlock();
    process(value);
}

void writer() {
    int index = getIdsIndex();
    std::lock_guard<std::shared_mutex> lock(mtxIds);
    // lub std::unique_lock...
    ids[index] = newValue();
}

Dodatkowe parametry dla `std::lock_guard`, `std::unique_lock` oraz `std::shared_lock`

Wyżej wymienione blokady opcjonalnie przyjmują dodatkowy parametr w postaci std::defer_lock lub std::adopt_lock.

std::defer_lock
- Nie blokuje w momencie utworzenia tylko oczekuje na operację std::lock()
- Stanowi to alternatywę dla std::scope_lock, który pojawił się dopiero w C++17

bool operator<(const X & other) const
{
    std::unique_lock<std::mutex> l1(mtx_, defer_lock);
    std::unique_lock<std::mutex> l2(other.mtx_, defer_lock);
    std::lock(l1, l2);

    return value_ < other.value_;
}

std::adopt_lock
- Informacja dla konstruktora, że otrzyma on już zablokowane mutexy (wcześniej pojawia się std::lock()`
- Działanie przeciwne do std::defer_lock

bool operator<(const X & other) const
{
    std::lock(mtx_, other.mtx_);
    std::lock_guard<std::mutex> l1(mtx_, adopt_lock);
    std::lock_guard<std::mutex> l2(other.mtx_, adopt_lock);

    return value_ < other.value_;
}

Funkcja std::lock() gwarantuje zablokowanie wszystkich mutexów bez zakleszczenia niezależnie od kolejności ich pozyskania.

Zmienne atomowe

12. Model pamięci

Najmniejsza jednostka – 1 bajt
Każdy bajt ma unikalny adres w pamięci
Synchronizacja nie jest potrzebna jeśli zapisujemy coś wielowątkowo do różnych obszarów pamięci

std::vector<int> v(10, 0);

for (int = 0; i < 10; i++)
    std::thread t([&]{ v[i] = i; });

Synchronizacja jest potrzebna jeśli zapisujemy coś wielowątkowo do tych samych obszarów pamięci

std::vector<int> v;

for (int = 0; i < 10; i++)
    std::thread t([&]{ v.emplace_back(i); });

Synchronizacja jest potrzebna jeśli conajmniej jeden wątek zapisuje, a inne odczytują ten sam obszar pamięci
Brak synchronizacji jeśli jest wymagana to wyścig/undefined behaviour
Użycie const nie wymaga synchronizacji
Link do pełnego artykułu - czytaj

13. Jak synchronizować?

int a = 0;
std::mutex m;

std::thread t1([&] {
std::lock_guard<mutex> lg(m);
a = 1;
});

std::thread t2([&] {
std::lock_guard<mute> lg(m);
a = 2;
});

Lepsze rozwiązanie, które chroni przed wyścigiem (data-race) to zastosowanie zmiennej atomowej (std::atomic). W ten sposób zapewniamy odpowiednie porządkowanie operacji dostępu do pamięci.

std::atomic<int> a = 0;
std::thread t1([&]{ a = 1; });
std::thread t2([&]{ a = 2; });

14. `std::atomic`

`std::atomic`	Opis
Cechy	Umożliwiają jednoczesny zapis i odczyt Nie ma potrzeby dodatkowego blokowania Pozwalają na prostą arytmetykę i operacje bitowe (te których nie ma w standardzie języka wymagają blokowania mutexem) Wykorzystuje się tylko z typami prostymi (liczby i wskaźniki)
Najważniejsze operacje	`store()` - zapisuje wartość zmiennej atomowej (można podać dodatkowo `std::memory_order`) `operator=()` - zapisuje wartość w zmiennej atomowej `load()` - odczytuje wartość ze zmiennej atomowej (można podać dodatkowo `std::memory_order`) `operator T()` - odczytuje wartość ze zmiennej atomowej

// use store() /  load()
#include <atomic>
#include <iostream>
#include <mutex>
#include <thread>
#include <vector>

std::vector<int> generateContainer()
{
    std::vector<int> input = {2, 4, 6, 8, 10, 1, 3, 5, 7, 9};
    std::vector<int> output;
    std::vector<std::thread> threads;
    std::mutex m;

    // należy jeszcze wyciągnąć lambdę przed pętlę...
    for (auto i = 0u; i < input.size(); i++) {
        threads.emplace_back([&, i]{
            std::lock_guard<std::mutex> l(m);
            // wstawianie wątków do wektora jest bezpieczne (bo jest sekwencyjne)
            // należy zabezpieczyć wstawianie liczb do wektora
            // bo może być problem z iteratorami
            output.push_back(input[i]);
        });
    }

    // "i" przekazujemy przez kopię
    // 1 powód: jeśli "i" przekażemy przez referencję to wszystkie wątki mogą mieć
    // taką samą wartość "i", np. 5
    // 2 powód: część wstawiania może się odbyć dopiero przed join(), a wtedy
    // zmienna "i" już nie istnieje (dangling reference)

    for (auto && t : threads)
        t.join();

    return output;
}

std::vector<int> generateOtherContainer()
{
    int start {5};
    // nie trzeba std::atomic bo mamy mutex na if oraz else
    std::atomic<bool> add {true};
    std::vector<int> output;
    std::vector<std::thread> threads;
    std::mutex m;

    for (int i = 0; i < 10; i++) {
        threads.emplace_back([&, i]{
            if (add)
            {
                std::lock_guard<std::mutex> l(m);
                output.push_back(start+=i);
            }
            else
            {
                std::lock_guard<std::mutex> l(m);
                output.push_back(start-=i);
            }
            add = !add;
        });
    }

    for (auto && t : threads)
        t.join();

    return output;
}

void powerContainer(std::vector<int>& input)
{
    std::vector<std::thread> threads;

    for (auto i = 0u; i < input.size(); i++)
        threads.emplace_back([&, i]{ input[i]*=input[i]; });
    // nie ma potrzeby stosowania mutexu
    // za każdym razem zapisujemy w inny obszar pamięci

    for (auto && t : threads)
        t.join();
}

void printContainer(const std::vector<int>& c)
{
    for (const auto & value : c)
        std::cout << value << " ";
    std::cout << std::endl;
}

int main() {

    auto container1 = generateContainer();
    printContainer(container1);
    powerContainer(    // należy jeszcze wyciągnąć lambdę przed pętlę...container1);
    printContainer(container1);

    auto container2 = generateOtherContainer();
    printContainer(container2);
    powerContainer(container2);
    printContainer(container2);

    return 0;
}

15. `std::atomic` i `std::memory_order`

std::memory_order pozwala na dodatkową otymalizację i określa on typ synchronizacji. Więcej informacji - czytaj.

Typ `std::memory_order`	Opis
`memory_order_relaxed`	Nie ma żadnej synchronizacji (tak jakby nie było `std::atomic`)
`memory_order_consume`	Do odczytu Zagwarantowane, że kompilator nie zmieni kolejności operacji przed `load()` i `store()`
`memory_order_acquire`	Do odczytu Zagwarantowane, że kompilator nie zmieni kolejności operacji przed `load()` i `store()`
`memory_order_release`	Do zapisu Zagwarantowane, że kompilator nie zmieni kolejności operacji po `load()` i `store()`
`memory_order_acq_rel`	Do zapisu Zagwarantowane, że kompilator nie zmieni kolejności operacji po `load()` i `store()`
`memory_order_seq_cst`	Domyślny wybór (jeśli nie wybrany inny) Blokowany jednoczesny odczyt i zapis

Zmienne warunku

16. Aktywne czekanie (spinlock)

Aktywne czekanie (busy waiting) to stan, w którym wątek ciągle sprawdza, czy został spełniony pewien warunek
Inna nazwa tego problemu to wirująca blokada (spinlock)
Problem rozwiązuje zmienna warunku (condition variable)

void saveToFile(StringQueue & sq) {

    ofstream file("/tmp/sth.txt");

    while (file) {
        while (sq.empty()) { /* nop */ }
        
        file << sq.pop() << endl;
    }
}

17. `std::condition_variable`

std::condition_variable Opis

Cechy

`std::condition_variable`	Opis
Cechy	Działa tylko z `std::unique_lock` Niekopiowalny Wymaga `#include <condition_variable>`
Najważniejsze operacje	`wait()` – oczekuje na zmianę / blokuje obecny wątek dopóki nie zostanie on wybudzony Wątek który zablokował mutex, trafił na `wait()` ale nie otrzymał ani `notify_one()`, ani `notify_all()` zwalnia mutex i jest usypiany. Ponadto, mimo że nie było żadnego `notify()` może się on spontanicznie wybudzić i (spróbować) zablokować z powrotem mutex by sprawdzić czy był `notify()` oraz (opcjonalnie) czy warunek podany w predykacie został spełniony Wymaga przekazania w argumencie: `std::unique_lock` lub... `std::unique_lock` oraz predykat `notify_one()` – wybudza jeden z wątków oczekujących na zmianę Nie mamy kontroli nad tym, który z wątków zostanie powiadomiony Jeśli na zmiennej warunku czeka kilka wątków i każdy ma inny predykat, to jego użycie może spowodować zakleszczenie. Wybudzony może zostać wątek, dla którego warunek nie został spełniony i jeśli żaden inny wątek nie zawoła `nofity_one()` lub `notify_all()` to wszystkie będą czekać `notify_all()` – wybudza wszystkie wątki czekające na zmianę Preferowanany wybór Wątki te mogą konkurować o zasoby `wait_for()` - przyjmuje okres czasu po którym naśtąpi wybudzenie Opcjonalnie zwraca powód wybudzenia (czy z powodu timeout'u lub nie) `wait_until()` - przyjmuje punkt w czasie, w którym nastąpi wybudzenie Opcjonalnie zwraca powód wybudzenia (czy z powodu timeout'u lub nie)

Działa tylko z std::unique_lock
Niekopiowalny
Wymaga #include <condition_variable>

Najważniejsze operacje

wait() – oczekuje na zmianę / blokuje obecny wątek dopóki nie zostanie on wybudzony

Wątek który zablokował mutex, trafił na wait() ale nie otrzymał ani notify_one(), ani notify_all() zwalnia mutex i jest usypiany. Ponadto, mimo że nie było żadnego notify() może się on spontanicznie wybudzić i (spróbować) zablokować z powrotem mutex by sprawdzić czy był notify() oraz (opcjonalnie) czy warunek podany w predykacie został spełniony
Wymaga przekazania w argumencie:
- std::unique_lock lub...
- std::unique_lock oraz predykat

notify_one() – wybudza jeden z wątków oczekujących na zmianę
- Nie mamy kontroli nad tym, który z wątków zostanie powiadomiony
- Jeśli na zmiennej warunku czeka kilka wątków i każdy ma inny predykat, to jego użycie może spowodować zakleszczenie. Wybudzony może zostać wątek, dla którego warunek nie został spełniony i jeśli żaden inny wątek nie zawoła nofity_one() lub notify_all() to wszystkie będą czekać
notify_all() – wybudza wszystkie wątki czekające na zmianę

Preferowanany wybór
Wątki te mogą konkurować o zasoby

wait_for() - przyjmuje okres czasu po którym naśtąpi wybudzenie

Opcjonalnie zwraca powód wybudzenia (czy z powodu timeout'u lub nie)

wait_until() - przyjmuje punkt w czasie, w którym nastąpi wybudzenie

Opcjonalnie zwraca powód wybudzenia (czy z powodu timeout'u lub nie)

Jeśli wywołamy którąkolwiek z funkcji notify(), a żaden wątek nie czeka (wait()) to "stracimy" takiego notify'a.

18. `std::condition_variable_any`

`std::condition_variable_any`	Opis
Cechy	Działa z każdym rodzajem blokad Te same właściwości co `std::condition_variable`

19. Zagrożenia dla `std::condition_variable` / `std::condition_variable_any`

Zagrożenie Opis

Fałszywe przebudzenie (spurious wakeup)

Zagrożenie	Opis
Fałszywe przebudzenie (spurious wakeup)	Wątek czekający na zmiennej warunku cyklicznie co pewien okres czasu wybudza się i sprawdza czy nie przyszła notyfikacja W celu oczekiwania na zmiennej warunku wymagana co najmniej blokada `std::unique_lock`, gdyż podczas uśpienia wątek ją odblokowuje, a gdy wybudza się, aby sprawdzić notyfikację blokuje ją ponownie na chwilę, po czym znów ją odblokowuje i śpi dalej Predykat dodany do funkcji `wait()` zapobiega fałszywym przebudzeniom, gdyż dodaje dodatkowy warunek, który musi być spełniony, aby wątek się wybudził
Utracona notyfikacja (lost wakeup)	Jeśli notyfikacja została wysłana zanim wątek oczekiwał na zmiennej, to jest ona utracona i nie wybudzi ona wątku Problem można obejść, gdy pojawi się fałszywe przebudzenie Jeśli wątek oczekiwał na zmiennej warunku z predykatem, to predykat musi być spełniony, inaczej fałszywe przebudzenie nie nastąpi

Wątek czekający na zmiennej warunku cyklicznie co pewien okres czasu wybudza się i sprawdza czy nie przyszła notyfikacja
W celu oczekiwania na zmiennej warunku wymagana co najmniej blokada std::unique_lock, gdyż podczas uśpienia wątek ją odblokowuje, a gdy wybudza się, aby sprawdzić notyfikację blokuje ją ponownie na chwilę, po czym znów ją odblokowuje i śpi dalej
Predykat dodany do funkcji wait() zapobiega fałszywym przebudzeniom, gdyż dodaje dodatkowy warunek, który musi być spełniony, aby wątek się wybudził

Utracona notyfikacja (lost wakeup)

Jeśli notyfikacja została wysłana zanim wątek oczekiwał na zmiennej, to jest ona utracona i nie wybudzi ona wątku
Problem można obejść, gdy pojawi się fałszywe przebudzenie
Jeśli wątek oczekiwał na zmiennej warunku z predykatem, to predykat musi być spełniony, inaczej fałszywe przebudzenie nie nastąpi

Komunikacja jednokierunkowa (`std::future` i `std::promise`)

20. Opis

std::future i std::promise razem tworzą jednokierunkowy kanał komunikacji między dwoma wątkami
Wątek, który "ma coś zrobić" jako argument oprócz lambdy dostaje też std::promise
Wątek, który ma odebrać wynik obliczeń wywołuje future.get()

std::promise<int> promise; // typ wyniku
std::future<int> future = promise.get_future(); 
// tworzymy future przez wywołanie get_future() na std::promise
// w ten sposób tworzy się kanał komunikacji
// kolejne wywolanie promise.get_future() rzuci wyjątek

auto function = [](std::promise<int> promise
{
    promise.set_value(10;)
    // ustawiamy promise jakąś wartość
}

std::thread t(function, std::move(promise));
// do osobnego wątku przekazujemy lambdę z promise'm

std::cout << future.get() << std::endl;
// inny wątek woła get() by wyłuskać wartość
// kolejne wywołanie get() rzuci wyjątek

t.join();

21. Funkcje `std::future`

Funkcja	Opis
`get()`	Służy do synchronizacji wątków tj. jeden wątek nie pójdzie dalej tylko poczeka do momentu aż inny wątek czegoś nie zrobi `get()` czeka na inny wątek i pobiera jego wynik Można wywołać tylko raz Kolejne wywołanie rzuci wyjątek
`valid()`	Zwraca `true` jeśli można go użyć (tzn. można na nim wywołać `get()` lub `wait()` (innymi słowy czy `std::future` nie został już "zużyty")
`wait()`	Służy do synchronizacji wątków tj. jeden wątek nie pójdzie dalej tylko poczeka do momentu aż inny wątek czegoś nie zrobi `wait()` nie pobiera wartości tylko czeka aż będzie dostępna Można wywołać wielokrotnie

22. Obsługa wyjątków w `std::promise`

Na std::promise oprócz set.value() można wywołać set.exception()
Wywołanie get() na "drugim" wątku rzuci wyjątek

promise.set_exception(std::make_exception_ptr(e));

try {
// ...
} catch (...) {
promise.set_exception(std::current_exception());
}

23. `std::shared_future`

Jeden wątek nadaje, ale wiele odbiera
- Obiekt std::promise tworzymy tylko jeden
Jedyna różnica w zastosowaniu to taka że zamiast std::future<int> f = promise.get_future() piszemy std::shared_future<int> f = promise.get_future().share()
- Każdy wątek powinien utworzyć swój własny obiekt shared_future
Kopiowalny
Przenoszalny

Zadania asynchroniczne (`std::assync`)

24. Opis

std::async to wysokopoziomowe rozwiązanie, które automatycznie zarządza wywołaniami asynchronicznymi z podstawowymi mechanizmami synchronizacji
Przykazując funkcję do std::assync zwróci on obiekt std::future za pomocą którego można się dostać do jego rezultatu (jak tylko będzie on dostępy)
- Wywołując get() przed tym jak zostanie "obliczony" wynik, wątek poczeka na niego...
Obsługa wyjątków przez std::promise i std::future
Wymaga #include <future>

std::future<int> f = std::assync(function)
std::cout << f.get() << std::endl;

25. Polityki uruchamiania

Przykład wykorzystania:

auto f2 = async(launch::async, []{
        cout << "f2 started\n";
        this_thread::sleep_for(1s);

Polityka	Opis
`std::launch::async`	Wywołanie asynchroniczne w osobnym wątku
`std::launch::deferred`	Wywołanie funkcji (i obliczenie rezultatu) następuje dopiero po wywołaniu `get()` lub `wait()` Wątek wywołujący `get()` lub `wait()` czeka na wątek zwracający wartość (punkt synchronizacji)
`std::launch::async::deferred`	Wywołanie asynchroniczne w osobnym wątku
Bez launch policy	Undefined behaviour (od C++14 - czytaj)

#include <future>
#include <vector>
#include <iostream>
#include <chrono>
using namespace std;

int main()
{
    auto f1 = async([] {
        cout << "f1 started\n";
        this_thread::sleep_for(1s);
        return 42;
    });
    cout << "f1 spawned\n";
    
    auto f2 = async(launch::async, []{
        cout << "f2 started\n";
        this_thread::sleep_for(1s);
        return 2 * 42;
    });
    cout << "f2 spawned\n";
    
    auto f3 = async(launch::deferred, []{
        cout << "f3 started\n";
        this_thread::sleep_for(1s);
        return 3 * 42;
    });
    cout << "f3 spawned\n";

    cout << "Getting f1 result\n";
    auto v1 = f1.get();
    cout << "Got f1 result\n";
    
    cout << "Getting f2 result\n";
    auto v2 = f2.get();
    cout << "Got f2 result\n";
    
    cout << "Getting f3 result\n";
    auto v3 = f3.get();
    cout << "Got f3 result\n";
    
    vector<int> numbers = { v1, v2, v3 };
    for (const auto & item : numbers)
        cout << item << '\n';
    
    return 0;
}

Wyjście:

>> f1 spawned
>> f1 started
>> f2 spawned
>> f3 spawned
>> Getting f1 result
>> f2 started
>> Got f1 result
>> Getting f2 result
>> Got f2 result
>> Getting f3 result
>> f3 started
>> Got f3 result
>> 42
>> 84
>> 126

26. Problem domyślnej polityki

Nie można sprawdzić w jaki sposób future (std::async) został uruchomiony ale korzystając z wait_for() i tego że zwraca 1 z 3 statusów:

future_status::deferred
future_status::ready
future_status::timeout

... można tak zdobyć wynik:

#include <iostream>
#include <future>
using namespace std;

void f() {
  this_thread::sleep_for(1s);
}

int main() {
    auto fut = async(f);

    if (fut.wait_for(0s) == future_status::deferred) {
        cout << "Scheduled as deffered. Calling wait() to enforce execution\n";
        fut.wait();
    } else {
        while (fut.wait_for(100ms) != future_status::ready) {   
            cout << "Waiting...\n";
        }
        cout << "Finally...\n";
    }
}

27. `std::packaged_task`

std::packaged_task nie wykonuje się od razu (w odróżnieniu od std::async), to użytkownik decyduje kiedy to ma się wykonać
Przydatne jeśli chcemy do std::async przekazać parametry, których jeszcze nie mamy albo inny wątek/funkcja go oblicza
- Wtedy wątek tworzymy dopiero jak już mamy obliczone parametry

auto globalLambda = [](int a, int b) {
    std::cout << "globalLambda:\n";    
    std::this_thread::sleep_for(std::chrono::seconds(1));
    return std::pow(a, b); 
};

// LOKALNE WYWOŁANIE

void localPackagedTask() {
    std::cout << "\nlocalPackagedTask:\n";
    std::packaged_task<int(int,int)> task(globalLambda);
    auto result = task.get_future();
    
    std::cout << "before task execution\n";
    task(2, 9);
    std::cout << "after task execution\n";
 
    std::cout << "getting result:\t" << result.get() << '\n';
}

// WYWOŁANIE W INNYM WĄTKU

void remotePackagedTask() {
    std::cout << "\nremotePackagedTask:\n";
    std::packaged_task<int(int,int)> task(globalLambda);
    auto result = task.get_future();
    
    std::cout << "before task execution\n";
    std::thread t(std::move(task), 2, 9);
    std::cout << "after task execution\n";

    t.detach(); // detach żeby było asynchronicznie (nie join())

    std::cout << "getting result:\t" << result.get() << '\n';
}

// TO SAMO TYLKO KORZYSTAJĄC Z ASYNC

void remoteAsync() {
    std::cout << "\nremoteAsync:\n";
    auto result = std::async(std::launch::async, globalLambda, 2, 9); 
    std::cout << "getting result:\t" << result.get() << '\n';
}

int main() {
    localPackagedTask();
    remotePackagedTask();
    remoteAsync();
}

Multithreading: threads

Współdzielenie danych

Zmienne atomowe

Zmienne warunku

Komunikacja jednokierunkowa (future, promise)

Zadania asynchroniczne (std::assync)

Multithreading: threads

1. When to apply multithreading?

2. When not to apply multithreading

3. Basic operations on threads

Example 1

Example 2

4. Passing arguments to thread function

Pass by value

Pass by reference

Pass class method

Example 1 (code smell - potential problem)

Solution:

5. Exceptions in threads

6. Puting thread into sleep

Example 1

Współdzielenie danych

7. Niebezpieczeństwa podczas używania wielowątkowości

Przykład Deadlock

Przykład Race conditions

8. Thread sanitizer

9. Debugger

10. Mutexy

Najważniejsze funkcje std::mutex

Przykład

11. Menadżery blokad

Przykład std::lock_guard<mutex>

Przykład std::scoped_lock

Przykład std::shared_lock<std::shared_mutex>

Dodatkowe parametry dla std::lock_guard, std::unique_lock oraz std::shared_lock

Zmienne atomowe

12. Model pamięci

13. Jak synchronizować?

14. std::atomic

15. std::atomic i std::memory_order

Zmienne warunku

16. Aktywne czekanie (spinlock)

17. std::condition_variable

18. std::condition_variable_any

19. Zagrożenia dla std::condition_variable / std::condition_variable_any

Komunikacja jednokierunkowa (std::future i std::promise)

20. Opis

21. Funkcje std::future

22. Obsługa wyjątków w std::promise

23. std::shared_future

Zadania asynchroniczne (std::assync)

24. Opis

25. Polityki uruchamiania

26. Problem domyślnej polityki

27. std::packaged_task

About

Zadania asynchroniczne (`std::assync`)

Najważniejsze funkcje `std::mutex`

Przykład `std::lock_guard<mutex>`

Przykład `std::scoped_lock`

Przykład `std::shared_lock<std::shared_mutex>`

Dodatkowe parametry dla `std::lock_guard`, `std::unique_lock` oraz `std::shared_lock`

14. `std::atomic`

15. `std::atomic` i `std::memory_order`

17. `std::condition_variable`

18. `std::condition_variable_any`

19. Zagrożenia dla `std::condition_variable` / `std::condition_variable_any`

Komunikacja jednokierunkowa (`std::future` i `std::promise`)

21. Funkcje `std::future`

22. Obsługa wyjątków w `std::promise`

23. `std::shared_future`

Zadania asynchroniczne (`std::assync`)

27. `std::packaged_task`