This paper provides a brief overview of the statistical methods used in transport research in recent years to find the relationship between traffic flow estimates and the demand that generates these data. This problem is formulated within the framework of the general task of evaluating the correspondence matrix
traffic flow, intensity estimation, correspondence matrix
Проведем обзор статистических методов, которые были разработаны за последние годы для поиска взаимосвязи между подсчетами потока, собранными в дискретных точках времени и пространства, и спросом, который порождает эти данные. Эти задачи сформулированы в рамках общей оценки интенсивности. Поэтому внимание уделяется исследованиям, в которых изучалась роль информации и возможность прогнозирования по данным детекторов дорожного движения с учетом поведенческих моделей [1, 2].
Основными задачами, рассматриваемыми в исследовании, являются следующие: поиск вероятной матрицы и неопределенность этого отношения при заданном положении и количестве счетчиков потока; и наоборот, учитывая топологию и характеристики сети, поиск оптимального расположения и количества детекторов для максимизации информации в сети и оценки потоков.
Кратко рассмотрим методы и их основные характеристики.
Статистические модели – матрицы поездок восстанавливались посредством обработки существующих данных. Первоначально матрицы оценивались двумя способами: опросами (прямой выборочной оценкой) и оценкой модели, то есть путем применения системы моделей – физических и/или поведенческих, – которые вычисляют приблизительное количество поездок, совершенных определенным видом транспорта в течение рассматриваемого периода времени.
Связь между матрицами поездок и подсчетами потока возникла в конце 70-х годов. Ключевым вопросом при оценке матрицы поездки на основе подсчета потока является идентификация пары отправления-назначения (OD) (в поездках используется конкретное звено). Оценка матриц и определение положения на маршруте считается двойной задачей. Общая основа, которая явно связывает эти две характеристики – сетевой поток, то есть его распределение по различным маршрутам, соединяющим каждую пару. Первоначально для такой задачи было предложено два типа назначений: пропорциональное назначение, то есть доля потоков, приходящих от пары, не зависит от матрицы, и равновесное назначение, то есть потоки распределяются так, что стоимость/затраты на маршруте (всех используемых маршрутов) от любой пары одинаковы.
Максимум энтропии/минимум информации. Основная трудность оценки пар по подсчетам потока заключается в недостаточной спецификации проблемы, то есть существует несколько решений, которые сопоставляют количество звеньев с потоками. Возможно решить эту проблему с помощью обобщенной гравитационной модели, которая представляет собой баланс между затратами на поездку для пары и измеряемыми потоками. Основной недостаток заключается в том, что модель вынуждает матрицу поездки следовать модели гравитационного типа и не в полной мере использует информацию, содержащуюся в реальных подсчетах. Эта проблема может быть решена путем введения априорной или целевой матрицы. Как минимизация информации, так и максимизация максимальной энтропии разработаны с целью получения апостериорной матрицы из целевой, но с целью придать последней наименьший вес. Оба подхода приводят к одним и тем же результатам. Основная философия, которую разделяют эти подходы, проста: можно связать для каждого потока звенья пропорцией, которая начинается и заканчивается в одной паре OD и, следовательно, вычисляется вероятность того, что эта часть потока исходит от определенного OD. Задача состоит в том, чтобы найти апостериорную матрицу, которая максимизирует общую вероятность генерации наблюдаемых потоков звена, начиная с априорной матрицы. Необходимость в априорной матрице очевидна, учитывая возможные множественные решения этой задачи максимизации и потребность в начальном исходном решении.
При решении этим методом в качестве начального условия используется априорная матрица, но при условии минимизации использования данных наибольшее значение придается подсчету потока. Целевая матрица получена из ранее проведенных исследований, но может иметь некоторую степень ошибки (из-за ошибок вывода; изменений в потоках; модальных сдвигах; увеличении численности населения). Но подсчет потока может включать ошибки. Пропорциональный подход, связывающий два уровня, содержит некоторую степень неопределенности. Это означает, что рассматривать априорную матрицу как наименее «надежную» информацию в этом процессе сложно. В некоторых экспериментах может применяться больше методов измерения: камеры на некоторых участках въезда-выезда; плавающие данные об автомобиле, которые делают оценки целевой матрицы надежнее, чем учет потоков. Кроме того, дополнительная информация, собранная из других источников информации, может позволить исправить ошибки в подсчете звеньев и предоставить другие показатели, такие как частичное и общее время в пути по отдельному маршруту. Использование пропорционального назначения не применяется в перегруженных сетях, где наблюдаются малые скорости потока. На этот метод влияют транспортные заторы и явления обратного потока в городских районах и его влияние на пропорции маршрутного потока.
В качестве альтернативы критерию максимальной энтропии – минимальной информации рассмотрим применение байесовского статистического метода для объединения надежности информации, полученной из априорной матрицы, и информации, полученной из подсчета потока по звену. Этот метод подходит для задач оценки поворотных потоков на перекрестках. Главной особенностью этого подхода является назначение набора весов для априорной матрицы поездки, в то время как предыдущий подход давал наименьшее возможное доверие к этой матрице. Если поток контролируется камерами на выходе(ах) из зоны О, а также на входе(ах) в зону D и применяется распознавание номерных знаков, то эта информация должна быть учтена в паре OD и ей следует придавать больший вес, чем другим. Таким образом, этот метод обладает двумя свойствами: расширяет критерий максимальной энтропии/минимума информации, будучи равным, когда наименьшие априорные оценки равномерно распределяются между парами OD; может потенциально сбалансировать информацию о подсчетах потока на звене со многими другими источниками информации, помимо априорной матрицы поездки.
Байесовский метод является точным и надежным методом распределения ценности источников информации, но вся методология основана на подходе пропорционального распределения. Этот метод может привести к небольшим ошибкам, поскольку выбор маршрута и перегрузка сети сильно коррелированы. Все вышеперечисленные модели являются статистическими и применимы для планирования и проектирования, но сомнительны относительно динамического состояния. Прямая оценка потоков позволяет получить: общее и частичное время в пути, чтобы добраться до любого узла или звена в сети. С другой стороны, прямая оценка взаимосвязана между наблюдаемыми и ненаблюдаемыми потоками, и может быть способом получения информации для стратегий динамического управления дорожным движением.
Помимо относительной надежности каждого доступного источника информации (опросы, счетчики на сети, модели), вопрос заключается в том, справляются ли вышеуказанные модели с относительным качеством информации в одном и том же наборе данных счетчиков на сети. Некоторые счетчики на сети предоставляют больше информации, чем другие, так как они являются высокопроизводительными и востребованными звеньями или соединяют несколько маршрутов и, следовательно, сообщают информацию о большем количестве OD-пар. С другой стороны, чем больше маршрутов перекрывается на конкретном пути следования, тем меньше надежность этой информации. Кажется, что ни один из методов не рассматривал проблему, что на практике некоторые потоки могут быть «завышены», а некоторые другие могут быть нулевыми, потому что счетчики потока их не учитывают. Оценка статических матриц, то есть игнорирование смещения времени отправления между транспортными средствами, учитываемыми на каком-либо звене, может сильно повлиять на оценку «истинной» матрицы. Ошибки в подсчете, в выводе известной матрицы из опроса населения в разное время и годы, или неверная спецификация параметров в моделях выбора — все это ошибки, которые могут существовать, и они не являются «отделимыми».
Оценка надежности подсчета на сети целевой матрицы, предполагаемых моделей выбора маршрута, времени отправления — непростая задача, которая остается нерешенной до сих пор, и зависит от цели исследования, и имеющихся данных.
1. Kripak, M.N. Ocenka sostoyaniya ulichno-dorozhnoy seti krupnogo goroda / M. N. Kripak, O. A. Lebedeva // Sovremennye tehnologii. Sistemnyy analiz. Modelirovanie. 2016. № 3 (51). S. 171-174.
2. Lebedeva, O.A. Bayesovskiy metod ocenki matricy korrespondenciy / O. A. Lebedeva, A. Yu. Mihaylov // Sbornik nauchnyh trudov №6 «Tehnologiya, organizaciya i upravlenie avtomobil'nymi perevozkami. Teoriya i praktika». FGBOU VPO «SibADI». 2013. S. 56-58.