Справочник адресов Волгограда

Архитектура и составление базы
Справочник адресов Волгограда представляет собой реляционную базу данных, построенную на движке PostgreSQL с расширением PostGIS для пространственных запросов. Исходный массив включает порядка 180 000 записей, каждая из которых содержит уникальный идентификатор (UUID v4), привязку к границам муниципальных образований, почтовый индекс и кодировку по ФИАС (Федеральная информационная адресная система).
Спецификация записи:
- Поле street_name (VARCHAR(200)) — приведено к общему лексикографическому стандарту: сокращения типа «ул.», «пр-кт», «пер.» унифицированы согласно ГОСТ Р 7.0.12-2011.
- Поле house_code (VARCHAR(20)) — включает литеры и дробные номера (например, «125А/2»), прошедшие морфологическую валидацию.
- Поле geo_point (GEOMETRY Point, 4326) — координаты с точностью до 0,000001° для соответствия стандарту ГЛОНАСС/GPS.
Технология верификации
В отличие от типовых справочников, использующих единый источник, данная БД проходит тройную ревизию: сенсорную чистку от дубликатов по алгоритму Левенштейна (порог 0,85), перекрестную сверку с данными Росреестра и автоматическую корректировку границ зданий по спутниковым снимкам разрешения 0,5 м/пиксель. Материалы для калибровки — открытые карты OpenStreetMap с актуализацией 2025–2026 года, срощенные с локальными архивами БТИ Волгограда.
Отличия от аналогов
- Полнота покрытия: в справочник включены не только основные улицы, но и микрорайоны частной застройки (посёлки Дачный, Водный, Микрорайон 134), которые отсутствуют в 90% коммерческих баз.
- Временные метки: каждая запись содержит поле valid_from и valid_to, позволяющее отслеживать историю переименований и сноса зданий. В других базах такие данные либо отсутствуют, либо обновляются раз в 2–3 года.
- Индексация: используется составной индекс (street_name, house_code, zip_code), обеспечивающий скорость поиска менее 15 мс на запрос при нагрузке до 500 RPS.
- Формат выдачи: поддержка JSON, GeoJSON и XML. У конкурентов часто ограничиваются только XML или CSV.
Качество и стандарты изготовления
Производство базы ведется по регламенту, аналогичному ISO 8000 (качество данных). Каждый квартал проводится аудит случайной выборки — 5% записей проверяются полевыми инспекторами с помощью мобильных терминалов. Уровень дефектности (неверные номера домов, опечатки в названиях) не превышает 0,03% по итогам 2025 года. Для сравнения: у аналогов (базы «2ГИС» и «Яндекс.Справочник») этот показатель варьируется от 0,1% до 1,5% из-за менее частого обновления и автоматизированной парсинговой схемы.
Технические требования к серверной части: минимальный объем RAM — 4 ГБ, частота процессора — от 2,2 GHz, диск — SSD с отказоустойчивостью RAID 1. Пропускная способность канала для экспорта данных — не менее 100 Мбит/с. Все транзакции проходят через протокол HTTPS с шифрованием TLS 1.3.
Сборка и поддержка
Первоначальная сборка справочника выполнена с помощью ETL-процессов (Python 3.12, библиотеки Pandas и Geopandas). Трудоёмкость первичной обработки — 220 человеко-часов. Последующие инкрементальные обновления (ежемесячные) добавляют данные от муниципальных служб в формате DBF и XML. Система сама отфильтровывает записи с пустыми полями geo_point.
Добавлено: 12.05.2026
