Russian Federation
This article presents a set of methods and models for predicting traffic congestion based on the analysis of GPS tracks and road network data. It examines the stages of data preprocessing, the construction of speed estimation models, and congestion classification. A system for automati-cally updating information in real time is proposed, enabling timely responses to changing traffic conditions, reducing congestion and improving traffic safety
traffic congestion, GPS tracks, road traffic, pattern prediction, traffic speed, machine learning
Транспортные заторы – одна из ключевых проблем современных мегаполисов, требующая поиска эффективных решений [1, 2]. Основные причины возникновения заторов можно условно разделить на две категории. Первая связана с превышением пропускной способности дорожной сети – когда количество транспортных средств на дороге превышает её возможности, что приводит к образованию узких мест и заторам. Вторая – дорожно-транспортные происшествия и неблагоприятные погодные условия, которые замедляют движение и вызывают скопление транспорта. Длительные задержки в движении создают неудобства для людей и ухудшают экологическую ситуацию из-за роста выбросов углекислого газа [1].
В связи с увеличением числа транспортных средств, строительство новых дорог и автомагистралей не всегда позволяет полностью решить проблему, поскольку такие меры требуют значительных временных и финансовых затрат. Поэтому актуальной становится разработка интеллектуальных систем и моделей для прогнозирования транспортных заторов и оптимизации дорожного движения [2, 3-5].
Анализ дорожного движения можно проводить на различных уровнях детализации: микроскопическом, мезоскопическом и макроскопическом [6]. Микроскопический анализ фокусируется на поведении отдельных транспортных средств, мезоскопический – на отдельных участках и перекрестках, а макроскопический – на транспортной системе города или региона. В современных исследованиях особое внимание уделяется сбору и обработке данных о движении транспортных средств для построения моделей прогнозирования.
Для сбора данных о состоянии транспортного потока используются различные методы. Традиционные системы включают пневматические датчики, индукционные петли, радар-детекторы и видеонаблюдение, однако они требуют значительных инвестиций и технического обслуживания. Альтернативой является использование GPS-датчиков, установленных внутри транспортных средств, что позволяет получать данные о скорости, времени и маршрутах движения в реальном времени. Такой подход обеспечивает более гибкое и масштабируемое решение для мониторинга дорожной ситуации [7, 8].
Географические данные, полученные с помощью GPS-устройств, широко используются для анализа перемещений населения и транспортных средств. GPX (GPS Exchange Format) — популярный формат для хранения таких данных. Прогнозирование движения на основе треков позволяет улучшить навигационные системы, оптимизировать транспортные маршруты и повысить безопасность. Обработка собранных данных включает их проверку и структурирование. В частности, из GPS-траекторий выделяют важные параметры, такие как скорость движения на различных участках дороги, а также время, расстояние и координаты.
Рассмотрим алгоритм предварительной обработки данных с GPS-устройств, который включает следующие шаги.
1. Очистка данных: удаление выбросов и аномальных точек, таких как выпадающие или ошибочные координаты, вызванные сбоями в работе устройств или помехами сигнала.
2. Обработка пропущенных данных: заполнение пропусков или удаление участков с недостаточной точностью, чтобы обеспечить целостность набора данных.
3. Уменьшение размерности: применение методов снижения сложности данных, таких как фильтрация или кластеризация, для выделения ключевых характеристик траектории.
4. Фильтрация объектов: исключение из анализа нежелательных элементов, например, остановок вне маршрута или случайных точек, не относящихся к движению транспортных средств.
5. Структурирование: организация данных в удобные для анализа форматы, такие как таблицы или временные ряды, с учетом маршрутов, времени и других параметров.
Эти этапы позволяют получить упорядоченный набор данных, который может быть использован для дальнейшего анализа, моделирования и прогнозирования транспортных процессов. На рисунке 1 приведен пример трека маршрута на картах Google Earth. Информация сохраняется с интервалом в одну секунду и содержит следующие данные: время, высота, координаты (широта и долгота) и скорость. На рисунке 2 – структурированный набор данных в MS Excel после извлечения и обработки.
Рисунок 1 – Трек маршрута в программе Google Earth с отображением основных характеристик движения
Рисунок 2 – Структурированный набор данных о характеристиках движения по маршруту в MS Exel
Предварительно обработанная траектория может быть выражена следующим образом:
(1)
где Ti – конкретная траектория движения автомобиля, ti – время суток в местном часовом поясе, lati, loni – информация о местоположении (широта, долгота), diri – направление движения, vi – текущая скорость автомобиля.
После предварительной обработки GPS треков набор данных готов к анализу.
Карта является набором данных, представляющих детализацию конкретного местоположения с подробным описанием основных дорог и инфраструктурных объектов. Данные карты можно разделить на более мелкие наборы данных. Предположим, что дорога R представляет собой набор сегментов дороги e:
(2)
где каждый сегмент дороги состоит из начальной и конечной точек, и в свою очередь:
(3)
где lat1, lon1 представляет начальную точку, а lat2, lon2 – конечную точку сегмента дороги [5].
Рассмотрим модель прогнозирования дорожных заторов, в основу которой заложены данные GPS треков. Она включает два основных компонента: модель оценки скорости движения и модель прогнозирования дорожных заторов (рисунок 3). Процесс начинается с предварительной обработки данных GPS, собранных с движущихся транспортных средств. Помимо этого используется информация о дорожной сети, включая расположение регулируемых пересечений, остановочных пунктов на маршруте, которая служит дополнительным источником данных для модели оценки скорости [5, 9].
Рисунок 3 – Модель прогнозирования транспортных заторов
Расчетная скорость движения для каждого участка дороги сохраняется в специальной матрице, которая используется для дальнейшей обработки и анализа. Входные данные – оперативные GPS-данные и результаты модели оценки скорости подаются в алгоритмы классификации, предназначенные для прогнозирования уровня загруженности дорожных участков.
Для оценки точности и надежности модели применяется схема перекрестной проверки K-Fold, которая помогает избежать переобучения и обеспечивает более объективную оценку производительности модели. Итоговые результаты прогнозирования отображаются на цифровой карте, что позволяет участникам дорожного движения своевременно получать информацию о текущей ситуации и уровне загруженности дорог.
Дополнительно в системе реализованы механизмы автоматического обновления данных в реальном времени, что обеспечивает актуальность информации и помогает в управлении дорожным движением, снижая заторы и повышая безопасность на дорогах. Для анализа траекторий движения транспортных средств анализируемые маршруты разделяются на сегменты в соответствии с координатами по Гринвичу, которые затем преобразуются в декартовы координаты. Каждому сегменту подбирается полиномиальная функция методом наименьших квадратов, для моделирования движения по участку [5, 7, 10, 11].
Из-за снижения интенсивности движения в определённые периоды суток, возникают участки дороги, по которым транспортные средства не проходят в этот промежуток времени. Для решения этой проблемы используется наложение исторических траекторий GPS, что позволяет определить среднюю скорость движения на каждом участке дороги. Статистические показатели, такие как средняя скорость, стандартное отклонение, минимальная и максимальная скорость, рассчитываются каждые 5 минут и сохраняются для анализа. На основе статистических данных, текущей информации и коэффициентов задержки движения на каждом участке, скорость движения регулярно рассчитывается и обновляется. Это обеспечивает актуальную оценку скорости и помогает в дальнейшем прогнозировании дорожных условий.
После того, как средняя скорость движения по всему маршруту сохранена в матрице по сегментам, прогнозирование заторов завершено. Исходные данные GPS упрощаются с помощью предварительного анализа (п. 3 алгоритма), и рассчитывается предполагаемая скорость движения по маршруту.
Прогнозирование заторов осуществляется с использованием древовидных классификаторов, а именно алгоритма дерева принятия решений. Данные GPS-треков из модели оценки скорости движения используются в качестве обучающих и тестовых данных для подгонки моделей. Обучающие данные включают информацию о времени, скорости, направлении, пробеге и местоположении (широта, долгота), а также об уровне заторов. Поскольку связь между независимыми переменными и целевой переменной имеет ключевое значение для классификации, выполняется анализ обучающих данных. Это необходимо для того, чтобы удостовериться, что при использовании моделей машинного обучения учитываются только те признаки, которые действительно важны.
Реализованные модели позволяют своевременно оценивать текущую ситуацию на дорогах и предсказывать уровень загруженности участков в реальном времени. Такой подход способствует оптимизации управления дорожным движением, снижению заторов и повышению безопасности на дорогах. Внедрение автоматизированных систем на базе предложенных методов может значительно улучшить качество транспортных потоков и повысить комфорт для участников дорожного движения [1, 4].
1. Lebedeva, O.A. Transportnaya infrastruktura kak osnovopolagayuschiy faktor effektivnogo funkcionirovaniya ekonomiki strany / O. A. Lebedeva, Yu. O. Poltavskaya, Z. N. Gammaeva, T. V. Kondratenko. – Tekst: neposredstvennyy // Sbor-nik nauchnyh trudov Angarskogo gosudarstvennogo tehnicheskogo universiteta. – 2018. – T. 1. № 15. – S. 125-130.
2. Lagerev, R.Yu. Metodika preduprezhdeniya setevyh transportnyh zatorov / R. Yu. Lagerev, A. Yu. Mihaylov, S. V. Lagereva. – Tekst: neposredstvennyy // Vestnik NCBZhD. – 2010. – № 5. – S. 82-88.
3. Poltavskaya, Yu.O. Ocenka usloviy dvizheniya transportnyh potokov s primeneniem geoinformacionnyh tehnologiy / Yu. O. Poltavskaya, M. N. Kripak, V. E. Gozbenko. – Tekst: neposredstvennyy // Sovremennye tehnologii. Sistemnyy analiz. Modelirovanie. – 2016. – № 1 (49). – S. 155-161.
4. Poltavskaya, Yu.O. Primenenie geoinformacionnyh sistem dlya obespecheniya ustoychivogo razvitiya transportnoy sistemy goroda / Yu. O. Poltavskaya. – Tekst: neposredstvennyy // V sbornike: Informacionnye tehnologii v nauke, upravlenii, social'noy sfere i medicine. Sbornik nauchnyh trudov VI Mezhdu-narodnoy nauchnoy konferencii. Pod redakciey O.G. Berestnevoy, V.V. Spicyna, A.I. Trufanov, T.A. Gladkovoy. – 2019. – S. 164-167.
5. Kyaw, T. Predicting on-road traffic congestion from public transport GPS data / T. Kyaw, N. N. Oo, W. Zaw // International Journal of Advances in Scientific Research and Engineering. – Vol 6 (3). – 2020. – p. 233-241.
6. Mahmud, K. Possible causes and so-lutions of traffic jam and their impact on the economy of Dhaka city / K. Mahmud, K. Gope, S. M. R. Chowdhury // Journal of Management and Sustainability. – Vol. 2(2). – 2012. –112 p.
7. Pirov, Zh.T. Vliyanie raspredeleniya transportnyh potokov na skorost' so-obscheniya na segmentah gorodskih ulic s reguliruemym dvizheniem / Zh. T. Pirov, A. Yu. Mihaylov. – Tekst: neposredstvennyy // Intellekt. Innovacii. Investicii. – 2020. – № 2. – S. 115-124.
8. Kerner, B.S. Introduction to modern traffic flow theory and control / B. S. Kerner // Springer-Verlag Berlin Heidelberg. – 2009. – p 45.
9. Poltavskaya, Yu.O. Modelirovanie prodolzhitel'nosti dvizheniya po marshrutu s uchetom harakteristik ulichno-dorozhnoy seti / Yu. O. Poltavskaya, O. A. Lebedeva. – Tekst: neposredstvennyy // V knige: Novye informacionnye tehnologii v issledovanii slozhnyh struktur. materialy Trinadcatoy Mezhdunarodnoy konferencii. Tomskiy gosudarstvennyy universitet. Tomsk. – 2020. – S. 101-102.
10. Mihaylov, A.Yu. Integral'nyy kriteriy ocenki kachestva funkcionirovaniya ulichno-dorozhnyh setey / A. Yu. Mihaylov. – Tekst: neposredstvennyy // Izvestiya Irkutskoy gosudarstvennoy ekonomicheskoy akademii. – 2004. – № 2. – S. 50-53.
11. Kripak, M.N. Ocenka sostoyaniya ulichno-dorozhnoy seti krupnogo goroda / M. N. Kripak, O. A. Lebedeva. – Tekst: neposredstvennyy // Sovremennye tehnologii. Sistemnyy analiz. Modelirovanie. – 2016. – № 3 (51). – S. 171-174.



