Алгоритмы на С++ (олимпиадный подход): Часть 1. Знак перестановки. Подсчет количества инверсий

понедельник, 7 февраля 2011 г.

Часть 1. Знак перестановки. Подсчет количества инверсий

[Все темы по перестановкам]

Теория: Липский. Комбинаторика для программистов. 1988
Особое внимание нужно уделить понятиям инверсии перестановки и знаку перестановки.

sgn(f) = pow(-1,I(f)),
где sgn(f) – знак перестановки, I(f) – количество инверсий

В Липском описан алгоритм, который линейно определяет четность перестановки: четность перестановки равна четности количества четных циклов перестановки.
Мы же сегодня будем заниматься определением количества инверсий в перестановках.

Практика:
В качестве базовой задачи рассмотрим 1090.In the Army Now и решим ее тремя способами.

1 Способ: Сортировка слиянием (merge_sort) O(NlogN)
Суть метода можно легко понять на основе перестановки:

{4, 5, 6, 1, 2, 3}

При сортировке слиянием наступит момент, когда нужно будет сливать в один массив первую половину перестановки со второй. Отсюда видно, что 1 сразу встанет на первое место, миновав элементы 4,5,6 за одну итерацию. Тем самым учтется три инверсии за один шаг. За счет этого мы уходим от квадратичной сложности.

[Решение]

В следующих двух способах придерживаемся общего правила:

Последовательно проходим по каждому элементу перестановки и отвечаем на вопрос: “Сколько элементов было до текущего, которые больше него?”.
2 Способ: Карманная сортировка (bucket_sort) O(N)
Для ответа на вопрос при карманной сортировке нужно определить карман B, в который попадет текущий элемент. Затем найти количество элементов в старших карманах относительно B. Потом аккуратно подсчитать количество элементов, больших текущего в кармане B.
Карман A считается старшим для кармана B, если любой элемент из A больше любого элемента из B.

[Решение]

3 Способ: Дерево Фенвика (Fenwick_tree) O(NlogN)
Сложилось впечатление, что там, где пытаются пристроить карманную сортировку не по назначению, всегда есть место для Дерева Фенвика. И как показывает практика использование дерева Фенвика дает хороший выигрыш по времени, несмотря на свою алгоритмическую сложность.
Вспоминаются слова Михаила Мирзаянова: “Хорошо написанный куб может работать быстрее плохо написанного квадрата”.
По решению: Чтобы найти количество элементов, больше текущего, которые были раньше, необходимо уметь находить быстро сумму элементов в интервале от [cur+1,MAX_VALUE], где cur – текущий элемент, а MAX_VALUE – максимальный элемент в перестановке.

[Решение]

12 комментариев:

Анонимный30 сентября 2011 г. в 09:11
"Липский. Комбинаторика для программистов. 1988
Особое внимание нужно уделить понятиям инверсии перестановки и знаку перестановки.

sgn(f) = pow(-1,I(f)), "

В книге(стр 19):
1: begin
2: s := 1;
3: for i := I to n do HOBbII[i]:=ИCTИHА;
4: for i := I to n do
5: if HOBЫЙ[i] then (*найден цикл, содержащий i*)
6: begin
j := P[i];
7: while j <> i do
8: begin HOBЫЙ[i]:=ложь; s := -s; j := P[j];
end;
end;
end;

Мне кажется что в коде ошибка, HOBЫЙ[i]:=ложь; должно быть HOBЫЙ[j]:=ложь;

Потому что инчае не имеет смысла отмечать HOBЫЙ[i]:=ложь;.
Зачем i-ый элемент отмечать k (длина цикла) раз, ведь он уже точно рассмотрен не будет.
ОтветитьУдалить
Ответы
Анонимный1 октября 2011 г. в 17:17
Это код из книги Липского, я думаю он не правильный.
ОтветитьУдалить
Ответы
slipstak22 октября 2011 г. в 00:14
Да да, Вы безусловно правы. Там нужно писать в восьмой строке НОВЫЙ[j]:=ложь по причине, которой Вы сами огласили.

Только получается, что цикл будет исполняться на k раз, а k-1, т.к. в шестой строке мы обрабатываем первую вершину цикла, а все последующие k-1 вершины в рамках цикла while.

К сожалению опечатки прокрадываются даже в такие шедевральные издания.
ОтветитьУдалить
Ответы
Unknown29 июня 2012 г. в 14:00
Игорб, скажите, а почему вы решили, что второе решение O(N)? Линейную сложность имеет сама по себе сортировка корзинками, а изменённая под подсчёт количества инверсий - уже нет.

Внешний цикл исполняется N раз явно. Про итоговую линейную сложность можно говорить, если тело цикла исполняется за O(1), а это не так. Там есть два отдельных цикла, один из которых O(количество корзинок), а второй O(размер корзинки). Если мы фиксируем количество корзинок (принимаем за константу), то размер корзинки пропорционален N, и, таким образом, цикл поиска точки вставки имеет линейную сложность. Если заменить его бинарным поиском, будет log(N), и O(N*log(N)) итого, но по связному списку бинарный поиск не сделаешь, а массив даст N на вставке. Итого - квадрат без вариантов.

Если же мы фиксируем размер корзинки, то количество корзинок пропорционально N, и цикл подсчёта суммы длин корзинок (в версии из видео) или цикл инкремента кэша инверсий (в версии с everfall) даёт O(N), что в итого даст квадрат. В версии из видео можно сумму считать на дереве Фенвика, тогда получится O(log(N)) тело цикла и O(N*log(N)) итого. Но не более.

А так в обоих версиях второго решения у вас квадрат. Проверьте на 100 000 элементов, или на миллионе - будет заметно.
ОтветитьУдалить
Ответы

Добавить комментарий

понедельник, 7 февраля 2011 г.

Часть 1. Знак перестановки. Подсчет количества инверсий

12 комментариев:

Постоянные читатели

Поиск по этому блогу

Авторы

Счетчик посетителей

Архив блога

LiveInternet

projecteuler

latex

понедельник, 7 февраля 2011 г.

Часть 1. Знак перестановки. Подсчет количества инверсий

12 комментариев:

Постоянные читатели

Поиск по этому блогу

Авторы

Счетчик посетителей

Архив блога

LiveInternet

projecteuler

latex

понедельник, 7 февраля 2011 г.