A TOOL FOR STATISTICAL ANALYSIS AND VISUALIZATION OF POPULATIONS IN RESEARCH
Abstract and keywords
Abstract (English):
An application developed for statistical analysis and visualization of populations is being considered. The tool is designed to isolate populations from statistical samples and visualize their characteristics. The key functions of the application are described, such as dividing the sample into groups in manual and automatic mode using clustering algorithms, interactive visualization of the obtained populations and calculation of their statistical characteristics. This application can be used to improve data analy-sis and informed decision-making in scientific research

Keywords:
statistics, visualization, clustering algorithms
Text
Text (PDF): Read Download

В современном мире объем данных, с которыми работают исследователи, постоянно растет. Эффективный анализ и визуализация этих данных становятся ключевыми факторами для получения значимых выводов. Очевидно, что данные могут содержать скрытые структуры и закономерности. Выявить разные группы или подгруппы и проанализировать, как они влияют на общую картину, позволит статистический анализ популяций [1].

В работе рассматривается инструмент, разработанный для выделения популяций из статистических выборок и визуализации их характеристик.

Основные функции инструмента:

  • Выделение популяций: Использование алгоритмов кластеризации для группировки данных на основе схожих характеристик.
  • Визуализация распределений: Создание графиков, таких как гистограммы и плотности распределения, для наглядного представления данных.
  • Определение статистических характеристик: Расчет ключевых статистических показателей, таких как среднее, медиана и др.

Реализация производилась в среде разработки Embarcadero RAD Studio на языке Delphi 12.

Одной из ключевых возможностей инструмента является разложение кривой распределения на отдельные составляющие, что позволяет проводить анализ мультимодального распределения статистических величин.

При использовании инструмента пользователь может интерактивно указывать границы популяций на гистограмме. По умолчанию предусмотрено разложение на три популяции, однако при необходимости пользователь может увеличить их количество. На рисунке 1 представлено разделение совокупности на три группы с помощью разработанного инструмента, а полученные статистические характеристики представлены на рисунке 2. Возможно также автоматическое определение мультимодального распределения.

Рисунок 1 – Гистограмма с разделением популяций и визуализацией нормального распределения

Рисунок 2 – Статистические характеристики популяций

Таким образом, разработанный инструмент для статистического анализа и визуализации популяций позволяет эффективно выявлять скрытые структуры и закономерности, что позволяет лучше понять динамику и характеристики исследуемых выборок.

References

1. Bel'ko, I.V. Teoriya veroyatnostey, matematicheskaya statistika, matematicheskoe programmirovanie: uchebnoe posobie / I.V. Bel'ko, I.M. Morozova, E.A. Krishtapovich. — Moskva : INFRA-M, 2025. – 299 s.

Login or Create
* Forgot password?