green_fr | Задачка на SQL

You're viewing

green_fr's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

Коллеги задали задачку — элегантного решения не нашёл, а в лоб она до второго пришествия считаться будет, есть ли у кого идеи?

Дано: таблица из двух колонок — номер группы и номер несчастного случая.
Найти: идентичные группы, то есть группы, у которых полностью совпадают несчастные случаи.

Для простоты можно предположить, что один несчастный случай не может входить в одну группу более одного раза.

В принципе, не обязательно решать эту задачу на SQL, любые (практически реализуемые) варианты приветствуются.

Flat | Top-Level Comments Only

From:

mopexod.livejournal.com

Отсортировать по несчастному случаю и сгруппировать? Или я чего-то не понял?

From:

green-fr.livejournal.com

Есть группа 1, в ней несчастные случаи A, B и C. Есть группа 2, в ней случаи B, C и D. Отстортировали, и как дальше?

From:

mopexod.livejournal.com

Там

fima уже все за меня написал про сжимание таблицы и отсортированные случаи :)
Довольно часто встречающаяся задача в реальной статистике.

From:

fima.livejournal.com

Много ли в группе случаев, в среднем?
Я бы сжал таблицу до такой: в первой колонке номер группы (уникальный), во второй - отсортированный список случаев (скажем, это строка со номерами случаев через запятую). Это двухпроходная операция (второй проход нужен для сортировки случаев внутри группы). Затем нашел бы дубликаты во второй колонке (например, отсортировав бы их, но, думаю, SQL это умеет и так).

From:

a_p

хехе! (см. мой коммент ниже :)

From:

green-fr.livejournal.com

И тебе спасибо :-)

From:

green-fr.livejournal.com

Гениально!
Спасибо :-)

From:

fima.livejournal.com

:-)

From:

a_p

я бы просто захешировал список несчастных случаев для каждой группы (если обе колонки проиндексированы, это делается в один проход). После этого, опять же проиндексировав колонку с хешем и пройдя по ней в порядке индекса (опять же - в один проход) выделяется список повторяющихся величин.

В упрощённом виде:
1. извлекаем полную таблицу.
2. сортируем по двум колонкам: сперва по номеру группы, потом по номеру несчастного случая.
3. Хешируем: проходя по таблице, конкатенируем номер НС в аккумулятор. На строчках, для которых следующий номер группы не равен текущему, вписываем значение аккумулятора (хеша) в хеш-колонках во все предыдущие строки данной группы и обнуляем аккумулятор.
4. Сортируем по двум колонкам: сперва по хешу, потом по номеру группы.
5. Проходим по всем строкам: там, где значения хеша одинаковы для двух последовательных строк, а номер группы - нет, добавляем номера групп в искомую табличку совпадений.

Flat | Top-Level Comments Only

Profile

green_fr

December 2025

S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Page Summary

Style Credit

Style: Neutral Good for Practicality by timeasmymeasure

Expand Cut Tags

No cut tags

Page generated Jan. 1st, 2026 07:00 am

It's all in your mind

Задачка на SQL

Задачка на SQL

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

Profile

December 2025

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags