Skip to content

Шеметов Даниил. Технология OMP. Поразрядная сортировка для целых чисел с четно-нечетным слиянием Бэтчера. Вариант 18#231

Open
7RosenRot wants to merge 7 commits intolearning-process:masterfrom
7RosenRot:shemetov_d_radix_odd_even_mergesort_omp

Conversation

@7RosenRot
Copy link
Contributor

@7RosenRot 7RosenRot commented Mar 2, 2026

Описание

Реализован гибридный алгоритм Radix Odd-Even Batcher's Merge Sort в параллельном варианте. Данная сортировка сочетает в себе поразрядную сортировку Radix Sort и итеративную сеть четно-нечетного слияния Бэтчера Odd-Even Batcher's Merge.

  • Задача: Поразрядная сортировка для целых чисел с четно-нечетным слиянием Бэтчера.
  • Вариант: 18
  • Технология: OMP
  • Описание реализации приведено ниже

Особенности параллельного алгоритма Radix Odd-Even Batcher's Merge Sort:

  1. Блок подготовки. Так как алгоритм четно-нечётного слияния Бэтчера требует, чтобы длина подмассива была степенью двух, необходимо чтобы расширенный массив разбивался на 2^n частей. Мы выполняем разбиение, основываясь на количестве выделенных для работы потоков, что задает следующее требование: мы используем потоков не больше ближайшей снизу степени двух, т.е - 1 -> 1 (SEQ), 2 -> 2, 3 -> 2, 7 -> 4, 8 -> 8, 9 -> 8, ...
size_t threads = omp_get_max_threads();

size_t limit = 1;
while (limit * 2 <= std::min(threads, power_)) {
  limit *= 2;
}

size_t chunk_size = power_ / limit;
  1. Параллельный блок. В предыдущем шаге мы получили 2^n подмассивов длины chunk_size. Теперь, для каждого из 2^n потоков мы вычисляем значение левого левый = номер_потока * длина_подмассива и правого правый = левый + длина_подмассива - 1 края.
    ● Сортировка - Выполняем поразрядную сортировку в указанных ограничениях и перед началом слияния дожидаемся окончания сортировки каждого потока #pragma omp barrier.
    ● Слияние - Теперь берем по два блока и сливаем их в один, то есть если бы у нас было 4 блока по 4 элемента, схема слияния выглядела бы так: 4 + 4 -> 8, 4 + 4 -> 8, 8 + 8 -> 16
#pragma omp parallel num_threads(limit) default(none) shared(ref_array, ref_power, chunk_size, limit, is_error)
  {
    size_t thread_num = omp_get_thread_num();
    size_t left = thread_num * chunk_size;
    size_t right = left + chunk_size - 1;

    std::vector<int> buffer;
    std::vector<int> position;

    RadixSort(ref_array, left, right, buffer, position);
#pragma omp barrier
    for (size_t segment = chunk_size * 2; segment <= ref_power; segment *= 2) {
#pragma omp for
      for (size_t i = 0; i < ref_power; i += segment) {
        OddEvenMerge(ref_array, i, segment);
      }
#pragma omp barrier
    }
  }
  1. Быстродействие. Наибольшая производительность наблюдается при использовании 2-х потоков:
    (SEQ) 0.0317 vs 0.0216 (OMP), что составляет Ускорение = 1,47 и Эффективность 73%

Тестирование проводится на массиве длиной 2^17 + 1 = 131073 элементов, что дополняется до 262144 элементов


Чек-лист

  • Статус CI: Все CI-задачи (сборка, тесты, генерация отчёта) успешно проходят на моей ветке в моем форке
  • Директория и именование задачи: Я создал директорию с именем <фамилия>_<первая_буква_имени>_<короткое_название_задачи>
  • Полное описание задачи: Я предоставил полное описание задачи в теле pull request
  • clang-format: Мои изменения успешно проходят clang-format локально в моем форке (нет ошибок форматирования)
  • clang-tidy: Мои изменения успешно проходят clang-tidy локально в моем форке (нет предупреждений/ошибок)
  • Функциональные тесты: Все функциональные тесты успешно проходят локально на моей машине
  • Тесты производительности: Все тесты производительности успешно проходят локально на моей машине
  • Ветка: Я работаю в ветке, названной точно так же, как директория моей задачи
    (например, nesterov_a_vector_sum), а не в master
  • Правдивое содержание: Я подтверждаю, что все сведения, указанные в этом pull request, являются точными и
    достоверными

…directory, renamed namespaces, prepared tests for adding OMP, TBB, STL and ALL versions
@7RosenRot 7RosenRot requested a review from allnes as a code owner March 2, 2026 22:48
Ramzan8-88 pushed a commit to Ramzan8-88/ppc-2026-threads that referenced this pull request Mar 4, 2026
…чки для компонент бинарного изображения. Вариант 32. (learning-process#231)

## Описание

- **Задача**: Построение выпуклой оболочки для компонент бинарного
изображения
- **Вариант**: 32
- **Технология**: SEQ, MPI

## **Описание реализации**

### Последовательная версия (SEQ):
На вход программе поступает бинарное изображение (ширина, высота, вектор
пикселей). Реализация выполняет бинаризацию изображения, находит связные
компоненты белых пикселей и для каждой компоненты строит выпуклую
оболочку с помощью алгоритма Грэхема.

### Параллельная версия (MPI):
На вход программе поступает бинарное изображение одинакового размера на
всех процессах. Изображение делится по строкам между процессами, каждый
процесс ищет компоненты связности в своём блоке и отправляет их на
процесс 0, где выполняется централизованное построение выпуклых оболочек
для всех компонент.

## Отчет
Отчет подробно описывает:
- постановку задачи
- реализацию последовательного алгоритма
- реализацию распараллеленного алгоритм
- детали реализации
- экспериментальные результаты и анализ производительности

---

## Чек-лист

- [x] **Статус CI**: Все CI-задачи (сборка, тесты, генерация отчёта)
успешно проходят на моей ветке в моем форке
- [x] **Директория и именование задачи**: Я создал директорию с именем
`<фамилия>_<первая_буква_имени>_<короткое_название_задачи>`
- [x] **Полное описание задачи**: Я предоставил полное описание задачи в
теле pull request
- [x] **clang-format**: Мои изменения успешно проходят `clang-format`
локально в моем форке (нет ошибок форматирования)
- [x] **clang-tidy**: Мои изменения успешно проходят `clang-tidy`
локально в моем форке (нет предупреждений/ошибок)
- [x] **Функциональные тесты**: Все функциональные тесты успешно
проходят локально на моей машине
- [x] **Тесты производительности**: Все тесты производительности успешно
проходят локально на моей машине
- [x] **Ветка**: Я работаю в ветке, названной точно так же, как
директория моей задачи (например, `nesterov_a_vector_sum`), а не в
`master`
- [x] **Правдивое содержание**: Я подтверждаю, что все сведения,
указанные в этом pull request, являются точными и достоверными
@github-actions github-actions bot removed the task:seq label Mar 6, 2026
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant