Шеметов Даниил. Технология OMP. Поразрядная сортировка для целых чисел с четно-нечетным слиянием Бэтчера. Вариант 18#231
Open
7RosenRot wants to merge 7 commits intolearning-process:masterfrom
Conversation
…directory, renamed namespaces, prepared tests for adding OMP, TBB, STL and ALL versions
Ramzan8-88
pushed a commit
to Ramzan8-88/ppc-2026-threads
that referenced
this pull request
Mar 4, 2026
…чки для компонент бинарного изображения. Вариант 32. (learning-process#231) ## Описание - **Задача**: Построение выпуклой оболочки для компонент бинарного изображения - **Вариант**: 32 - **Технология**: SEQ, MPI ## **Описание реализации** ### Последовательная версия (SEQ): На вход программе поступает бинарное изображение (ширина, высота, вектор пикселей). Реализация выполняет бинаризацию изображения, находит связные компоненты белых пикселей и для каждой компоненты строит выпуклую оболочку с помощью алгоритма Грэхема. ### Параллельная версия (MPI): На вход программе поступает бинарное изображение одинакового размера на всех процессах. Изображение делится по строкам между процессами, каждый процесс ищет компоненты связности в своём блоке и отправляет их на процесс 0, где выполняется централизованное построение выпуклых оболочек для всех компонент. ## Отчет Отчет подробно описывает: - постановку задачи - реализацию последовательного алгоритма - реализацию распараллеленного алгоритм - детали реализации - экспериментальные результаты и анализ производительности --- ## Чек-лист - [x] **Статус CI**: Все CI-задачи (сборка, тесты, генерация отчёта) успешно проходят на моей ветке в моем форке - [x] **Директория и именование задачи**: Я создал директорию с именем `<фамилия>_<первая_буква_имени>_<короткое_название_задачи>` - [x] **Полное описание задачи**: Я предоставил полное описание задачи в теле pull request - [x] **clang-format**: Мои изменения успешно проходят `clang-format` локально в моем форке (нет ошибок форматирования) - [x] **clang-tidy**: Мои изменения успешно проходят `clang-tidy` локально в моем форке (нет предупреждений/ошибок) - [x] **Функциональные тесты**: Все функциональные тесты успешно проходят локально на моей машине - [x] **Тесты производительности**: Все тесты производительности успешно проходят локально на моей машине - [x] **Ветка**: Я работаю в ветке, названной точно так же, как директория моей задачи (например, `nesterov_a_vector_sum`), а не в `master` - [x] **Правдивое содержание**: Я подтверждаю, что все сведения, указанные в этом pull request, являются точными и достоверными
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
Описание
Реализован гибридный алгоритм Radix Odd-Even Batcher's Merge Sort в параллельном варианте. Данная сортировка сочетает в себе поразрядную сортировку Radix Sort и итеративную сеть четно-нечетного слияния Бэтчера Odd-Even Batcher's Merge.
Особенности параллельного алгоритма Radix Odd-Even Batcher's Merge Sort:
2^nчастей. Мы выполняем разбиение, основываясь на количестве выделенных для работы потоков, что задает следующее требование: мы используем потоков не больше ближайшей снизу степени двух, т.е -1 -> 1 (SEQ), 2 -> 2, 3 -> 2, 7 -> 4, 8 -> 8, 9 -> 8, ...2^nподмассивов длиныchunk_size. Теперь, для каждого из2^nпотоков мы вычисляем значение левоголевый = номер_потока * длина_подмассиваи правогоправый = левый + длина_подмассива - 1края.● Сортировка - Выполняем поразрядную сортировку в указанных ограничениях и перед началом слияния дожидаемся окончания сортировки каждого потока
#pragma omp barrier.● Слияние - Теперь берем по два блока и сливаем их в один, то есть если бы у нас было 4 блока по 4 элемента, схема слияния выглядела бы так:
4 + 4 -> 8, 4 + 4 -> 8, 8 + 8 -> 16(SEQ) 0.0317 vs 0.0216 (OMP), что составляет Ускорение = 1,47 и Эффективность 73%Тестирование проводится на массиве длиной 2^17 + 1 = 131073 элементов, что дополняется до 262144 элементов
Чек-лист
<фамилия>_<первая_буква_имени>_<короткое_название_задачи>clang-formatлокально в моем форке (нет ошибок форматирования)clang-tidyлокально в моем форке (нет предупреждений/ошибок)(например,
nesterov_a_vector_sum), а не вmasterдостоверными