Шаг 1
Выбрать из базы транзакций интересующие по критериям (по кондуктору, водителю, рейсу и т.д.) и отсортировать по дате и времени.
Шаг 2
Составить ряд из промежутков времени между транзакциями. И кластеризовать полученный ряд и взять нужный кластер данных
Шаг 3
Рассчитать интересующие величины (например, среднее время между соседними транзакциями, минимальное время между транзакциями, медианное время между транзакциями).
Шаг 4
Построить гистограмму полученного ряда и провести анализ полученных характеристик.
Для расчета эффективности кондукторов, мы используем облачную ERP систему JoinPAY «Транспорт», которая позволяет собирать большое количество различной информации, необходимой для построения модели оценки.
В качестве критериев эффективности работы кондуктора нами используются не только обычные интегральные характеристики (такие как, например, среднее количество денег, привозимое за рейс), но и дифференциальные характеристики, основанные не на количестве транзакций за рейс в целом, а на промежутках времени между соседними транзакциями.
Они определяются только быстротой перемещения кондуктора по салону и скоростью его работы с терминалом - насколько быстро и четко кондуктор отрывает чек, насколько редко ошибается с длительностью прикладывания карты от которой зависит пройдет ли полностью работа с картой или придется приложить еще раз и т.д.
Таким образом основным рядом данных из которого будет извлекаться информация является ряд временных промежутков между последовательными транзакциями кондуктора, который легко получается из массива времен транзакций, сохраненных в системе.
Узнайте больше информации о расчёте эффективности в нашем блоге
Приведем пример моделирования работы кондуктора, проведенного в интересах компании-перевозчика для выявления ключевых статистических характеристик временного ряда транзакций в целях определения степени фрода работника.
Как известно хорошая модель должна сохранять самые важные особенности изучаемого явления, которые верно отражают желаемые характеристики исследуемого процесса. И в то же время из модели нужно выбросить несущественное для ее максимального упрощения. И вопрос что оставить, а что выкинуть является при составлении подобных моделей одним из самых важных. По большому счету решается он методом перебора – попробуем максимально упростить модель и сравним результаты моделирования с реальностью. Если они будут эту реальность воспроизводить в главном, то можно, во-первых, пробовать определить характеристики фрода и, во-вторых, усложнять модель для более точного воспроизведения реального временного ряда транзакций.с картой или придется приложить еще раз и т.д.
Фрод моделируется следующим образом – в случае наличной транзакции случайным образом она не фиксируется в массиве времен транзакций. Это эквивалентно тому, что билет от предыдущей наличной транзакции, который пассажир не получил на руки по каким-то причинам, сразу передается пассажиру со следующей наличной оплатой.
Отметим, что даже такая относительно простая модель позволила выявить метрики, явно указывающие на наличие фрода в транзакционном ряду конкретного сотрудника.