Разработка

Screenshot from 2022-02-07 01-09-18.png - (522.63KB, 902×602)

Решаем задачки и радуемся жизни Стив Балмер 07.02.2022 (пн) 01:15:59 No. 25980

Бросто берешь и решаешь без задней мысли.

Стив Балмер 07.02.2022 (пн) 01:21:09 No. 25981

Screenshot from 2022-02-07 01-06-51.png - (277.47KB, 2778×1010)

Несколько лет этим не занимался.

Очень простая задачка, но я мимодумно налепил два ненужных домолнительных массива. А можно было проще и в один проход: https://pastebin.com/7Zi3s97W

Чувствую себя бакой.

Стив Балмер 08.02.2022 (вт) 10:29:17 No. 25985

Screenshot from 2022-02-08 10-26-18.png - (212.17KB, 1792×1662)

https://leetcode.com/problems/number-of-ships-in-a-rectangle/

Тоже простая задачка, хотя помечена как Hard. Решается элементарно через рекурсию - это первое и единственное, что может прийти в голову.

Стив Балмер 09.02.2022 (ср) 15:19:09 No. 25989

>>25985
Если чуть пристальнее вглядеться в условие, то увидите, что там ограничение по вызову функцией самой себя, и что решения, в которых мухлёж (созданием другой функции для рекурсии, например), имеют последствием дисквалификацию.
Ещё, проблему назвали интерактивной, что бы это не значило.
Если это значит многократный вызов той функции по разным запрашиваемым областям, я бы завёл дерево ранее найденных кораблей, проверяя в первую очередь, нет ли уже из чего ранее найденного в той области, и если нет, циклом по строкам искал бы корабль.

Стив Балмер 09.02.2022 (ср) 16:33:59 No. 25990

>>25989
Простой рекурсии достаточно: https://pastebin.com/E06SPDCw

Там ограничение на 400 вызовов функции, при этом 10 кораблей и поле 1000 на 1000. Получаем как раз 4 10 log2(1000) вызовов при отбросе пустых квадратов - и гарантированно укладываемся.

Стив Балмер 09.02.2022 (ср) 18:03:13 No. 25994

Снимок экрана 2022-02-09 в 20_19_18.png - (302.74KB, 1344×574)

https://leetcode.com/problems/k-diff-pairs-in-an-array/

Важный момент – случай с k == 0 нужно рассматривать отдельно и проверять, что в массиве есть сразу два элемента с одинаковым значением.

Вполне подошло интуитивное решение через сортировку и два итератора. Однако, можно и лучше – через подсчет элементов в hashmap и проверку на вхождение туда элемента (key - k).

Стив Балмер 11.02.2022 (пт) 02:41:56 No. 26001

Снимок экрана 2022-02-11 в 04_38_44.png - (428.67KB, 1318×1120)

https://leetcode.com/problems/subarray-sum-equals-k/

Задачка очень похожа на предыдущую, только мы ищем разность не непосредственно между элементами, а между суммами от нуля до элемента. Плюс учитываем повторения

Runtime: 56 ms, faster than 99.52% of C++ online submissions for Subarray Sum Equals K.

Стив Балмер 11.02.2022 (пт) 02:59:41 No. 26002

>>26001
Мое решение этой задачи неинтересно и почти совпадает с авторским, но кто-то прислал туда вдвое более быстрое (20-30 ms): https://hastebin.com/qiqurohaxo.cpp

Автор создал какую-то свою структуру данных на битовых операциях, без пол-литра не разберешься.

Стив Балмер 11.02.2022 (пт) 03:08:00 No. 26003

>>26002
А, понял. Это кастомная хэш-таблица для интов. Прикольно.

Стив Балмер 13.02.2022 (вс) 17:41:11 No. 26005

Снимок экрана 2022-02-13 в 19_37_39.png - (437.24KB, 1278×1076)

Простая задачка, но я прочитал ее настолько мугичкой, что вместо подмножеств стал генерировать перестановки. Получилось сложнее и не нужно.

Стив Балмер 14.02.2022 (пн) 14:42:38 No. 26006

>>26005
Все подмножества действительно элементарно перечисляются. Считай, берёшь числовую переменную, на еденицу увеличиваешь, и вот тебе оно самое, следующее и уникальное.
Тут интереснее, как быть с подмножествами мощности n. Для них вроде как тоже только числовыми операциями можно делать перечисления.

Стив Балмер 21.02.2022 (пн) 20:59:15 No. 26011

Снимок экрана 2022-02-21 в 22_46_23.png - (220.00KB, 944×588)

Сегодня случилась странная история. Мне написали из киевской (!) геймдев-компании с предложением работы и релокации за их счет. Я попросил зарплату вдвое больше текущей - они замялись и попросили решить несколько задачек на онлайн-платформе. Задачки оказались очень легкими, запомнилось только то, что в одном месте понадобилось написать свою хеш-функцию для кастомного класса. Они в восторге.

А еще я не очень представляю, что такое UE4 и чем мне это грозит, лол.

Стив Балмер 22.02.2022 (вт) 18:58:19 No. 26012

>>26011
> Спойлер, добрый день. К сожалению, с учетом последних событий, мы приостановили найм. Буду рад оставаться с Вами на связи)

Ну вот!

Стив Балмер 23.02.2022 (ср) 05:23:35 No. 26013

>>26012
Промахнулся, дружок!

Стив Балмер 03.03.2022 (чт) 14:58:40 No. 26019

Задачка с собеса в какой-то загруженный сервис метрики вк: у нас есть миллиард чисел типа int32, они записаны куда-то в файл. Оперативной памяти, чтобы запомнить их все, нам немного не хватает. Необходимо найти число типа int32, которого там нет.

Пришло в голову только разбить числа на интервалы значений по миллиону штук, каждому интервалу привязать сумму в переменной int64. В первый проход мы заполняем суммы и определяем какого интервала у нас нет. Во второй проход мы смотрим только на числа из этого интервала и находим конкретное пропущенное.

Меня обломали тем, что числа могут повторяться, и таким образом мы не можем знать сумму интревала заранее. Возможно, вместо суммы в этом случае может подойти другая агрегирующая функция, но я хз.

Стив Балмер 03.03.2022 (чт) 15:21:40 No. 26020

94576209_p3.jpg - (1.91MB, 2733×3859)

>>26019
Если там есть хотя бы 4 GiB памяти, то на запомнить их все памяти хватит однозначно: делаем операционку выделить нам обнулённый кусок памяти в 4GiB, и делаем так, чтобы i-ому биту этого куска соответствовало наличие числа i в том файле. Потом пробегаемся по тому куску пока не найдём бит равный 0, для чего можно задействовать long-и или даже AVX-регистры. i того найденного бита и будет тем числом, которого нет в том файле. Составленная структура данных называется bitmap и её сжатые варианты широко используются в СУБД.
Если там нет даже 4-х GiB памяти, то придётся использовать те сжатые варианты. Вот эта https://roaringbitmap.org/ реализация довольно популярна.

Стив Балмер 03.03.2022 (чт) 15:33:57 No. 26022

Либо, идти в несколько проходов: скажем, сначала делаем bitmap для чисел от 0 до 2 в 31-ой, и если в нём ничего не нашли, потом делаем bitmap для чисел от 2 в 31-ой. Для миллиарда int-ов сжатие вряд ли поможет.

Стив Балмер 03.03.2022 (чт) 16:05:42 No. 26023

65569830_p1.jpg - (784.30KB, 1202×1700)

>>26020
Битовое поле с 4 млрд бит потребует 500 Мб памяти, не 4 Гб.

Стив Балмер 03.03.2022 (чт) 16:07:29 No. 26024

>>26020
Именно, что не хватит. Ориентировочно один.

>>26022
Да, именно такая идея была изначально, меня попросили подумать как уменьшить число проходов.

Стив Балмер 03.03.2022 (чт) 16:16:12 No. 26026

>>26023
Лол, действительно. Тогда понятно, чего они от меня хотели.

Стив Балмер 03.03.2022 (чт) 16:16:15 No. 26027

3d6eaf9d0ccdecc6ac3976cd21793d58.jpg - (478.23KB, 2856×2931)

>>26023
Моск лагает.

Стив Балмер 03.03.2022 (чт) 16:42:45 No. 26028

>>26024
>>26026
Ох лол. Лол.

Тогда я им уже выдавал подходящее решение - я предлагал использовать для подсчета этоментов vector<bool>, а он как раз примерно так оптимизируется для уменьшения размера (хотя зависит от имплементации). Похоже, они не заметили, что его хватит для одного прохода, точно так же, как не заметил и я.

Стив Балмер 11.03.2022 (пт) 18:51:19 No. 26031

Было немного странное собеседование на работу в знакомой мне области - поиск документов по ключевым словам. Правда, если у меня это поиск по сотням гигабайт данных в шардированных кластерах, то у них это индексация и поиск в приложении на пользовательской машине.

Вопрос: есть большой объем текстов, нужно посчитать количество использований для каждого слова - в различных падежах и склонениях. Количество уникальных слов - примерно 4 миллиона, а доступная оперативная память очень мала - несколько мегабайт.

Ответ: Слова языка используются с разной частотой и количество различных лексем в отдельно взятом документе намного меньше, чем четыре миллиона. Для каждого документа по очереди мы создаем в оперативной памяти хеш-мапу для подсчета, затем приплюсовываем результат к "общей" мапе, лежащей на диске.

Стив Балмер 16.04.2022 (сб) 10:26:58 No. 26100

IMG_20220416_122611_397.jpg - (88.13KB, 1125×1130)

ｷﾀ━━━(ﾟ∀ﾟ)━━━!!

Стив Балмер 27.08.2022 (сб) 20:52:36 No. 26547

Снимок экрана 2022-08-27 в 22_51_20.png - (192.47KB, 720×508)

Долго возился вот с этим, решение работало, но не влезало в память.
https://codeforces.com/contest/1721/problem/D

Оказалось, что при разбиении задачи на подзадачи большая часть подзадач оказывались пустыми, но затем их раз за разом разбивало на все большее число пустых подзадач, что жрало память по экспоненте

Стив Балмер 07.09.2022 (ср) 20:46:02 No. 26607

>>26547
А в чём прикол этой задачи, написать парсер ввода? Я в уме посчитал примеры.

Стив Балмер 07.09.2022 (ср) 23:28:59 No. 26612

>>26607
Примеры специально сделаны небольшими, а так размеры массивов входных данных могут достигать 10^5.

И как же ты в уме посчитал побитовые операции для всех 40320 возможных перестановок восьмиэлементного массива из этого примера?

Стив Балмер 08.09.2022 (чт) 00:05:49 No. 26613

74 - 636x935@32 [SIG5db0830a41ff79e2cd2668b789f671.jpg - (150.44KB, 636×935)

>>26612
А там что-то про перестановки говорилось? function f (A, B: Array) return x: Integer where A.Length == B.Length is C: Array = new Array<Integer>(0 .. A.Length), Ci = Ai XOR Bi for i in 0 .. n, x = C0 AND C1 AND C2 ... AND Cn. — вот что там написано.

Стив Балмер 08.09.2022 (чт) 03:10:43 No. 26615

Screenshot 2022-09-08 at 05_09_24.png - (122.68KB, 1730×150)

>>26613
Да, там говорилось про перестановки, а ты читал попой.

Стив Балмер 08.09.2022 (чт) 04:35:35 No. 26616

tumblr_mjksv2RUeq1r6jc31o1_1280.jpg - (422.09KB, 1024×768)

>>26615
Ну, там говорилось, что я могу их перетасовать (а могу и оставить), а не про то, что надо найти максимум f (A, B) при неизменном A и всех возможных вариантах упорядочивания B.
Ну а так надо упорядочить B по критерию Ai XOR Bk = max (назовём упорядоченный массив B'), и после применить f (A, B'). В самом простом случае за квадратное время. Так?

Стив Балмер 08.09.2022 (чт) 10:06:26 No. 26619

>>26616
Там прямым текстом просят максимум. Твоя сортировка не сработает с массивами [8, 3], [4, 3]

Просто напиши код так, чтобы он прошел тесты.

Стив Балмер 08.09.2022 (чт) 15:30:23 No. 26620

A10497294-2.jpg - (73.97KB, 400×533)

>>26619
Да, действительно. А если количество установленных бит посчитать? Упорядочить по критерию BitCountOf (Ai XOR Bk) = max
>Просто напиши код так, чтобы он прошел тесты.
А разве это интересно? И что делать, если тесты надо написать тебе самому?

Стив Балмер 08.09.2022 (чт) 17:19:20 No. 26624

>>26620
Уверен, что там тоже можно подобрать контрпример вида [101010101000, 11], [010101010100, 11].

> А разве это интересно?
Да, я люблю по-быстрому сделать так, чтобы оно работало хоть как-то и хоть иногда, а уже затем допиливать возможности, оптимизировать и рефакторить. Возможно, даже переписывать заново, если пришла более крутая идея в процессе.

Просто без быстрых наглядных результатов я теряю мотивацию.

> И что делать, если тесты надо написать тебе самому
Как вариант, набрать кучку случайных небольших массивов (можно добавить крайние случаи от себя), неэффективно, но набрутфорсить перестановки каждого и получить надежные ответы - а затем на основе этих данных тестировать другие алгоритмы. Но набор тестов уже есть на этой площадке.

Вообще мое решение этой задачи имело сложность n*k — произведение длины массива на разрядность элементов, и мне кажется, что это очень неплохо.

Стив Балмер 09.09.2022 (пт) 04:07:25 No. 26636

461148019.jpg - (279.99KB, 1024×768)

>>26624
Ну вот видишь, стоило только задуматься, как будем это тестировать, так сразу и стало ясно, что это NP-полная задача.
Ты рандомизацию использовал?

Стив Балмер 09.09.2022 (пт) 14:41:04 No. 26638

>>26636
> стоило только задуматься, как будем это тестировать, так сразу и стало ясно, что это NP-полная задача
Хахаха, вот только тесты-то я предложил делать за факториальное время.

> Ты рандомизацию использовал?
Для задачи? Нет, простое честное решение в лоб за гарантированное время. Под спойлером выше же намек о методе.

Стив Балмер 09.09.2022 (пт) 18:54:40 No. 26641

35 - 1024x768@32 [SIG2a1d071a6c598b1f5128436b67ba1.jpg - (423.15KB, 1024×768)

>>26638
Простое честное решение в лоб — это divide&conquer генератор перестановок; здесь можно сэкономить на вычислении f (A, B) для каждой перестановки, но худший результат всё-равно имеет сложность (n!).

Стив Балмер 09.09.2022 (пт) 19:00:36 No. 26643

>>26641
Ну значит, ты не допираешь до более простого.

Я не зря же добавил число разрядов в сложность, попробуй по ним проитерироваться и перераспределять числа так, чтобы ничего не терять на следующей итерации.

[Назад]

Имя
	[@] [?]
Тема	( ответ в 25980)
Сообщение
Файл
Пароль	(для удаления файлов и сообщений)
Параметры	[säge] [nöko]

Прежде чем постить, ознакомьтесь с правилами. Поддерживаются файлы типов GIF, JPG, MP4, PNG, WEBM, WEBP размером до 5120 кБ. Ныне 3770 unique user posts. Посмотреть каталог Предельное количество бампов нити: 500