groupArrayResample
Описание
Комбинатор Resample
может быть применен к агрегатной функции groupArray для
разделения диапазона указанного ключевого столбца на фиксированное количество интервалов (N)
и построения результирующего массива, выбирая одно представительное значение
(соответствующее минимальному ключу) из точек данных, попадающих в каждый интервал.
Он создает уменьшенную выборку данных, а не собирает все значения.
Пример использования
Рассмотрим пример. Мы создадим таблицу, которая содержит name, age и
wage сотрудников и введем данные в нее:
Получим имена людей, чей возраст находится в интервалах [30,60)
и [60,75). Поскольку мы используем целочисленное представление для возраста, мы получаем возраста в
интервалах [30, 59] и [60,74].
Чтобы агрегировать имена в массив, мы используем агрегатную функцию groupArray.
Она принимает один аргумент. В нашем случае это столбец имени. Функция groupArrayResample
должна использовать столбец возраста для агрегирования имен по возрасту. Чтобы определить
необходимые интервалы, мы передаем 30, 75, 30 в качестве аргументов в функцию groupArrayResample: