Собеседники для путешествий

Архитектура профилей и спецификация данных
Профиль участника построен на модульной схеме JSON Schema Draft 2020-12. Обязательные поля включают уникальный идентификатор (UUID v4), временную метку регистрации (ISO 8601, часовой пояс UTC+0) и бинарный вектор предпочтений (32-битный битмаск по шкале «культура — природа — гастрономия — экстрим»). Дополнительный слой — расширенная анкета с полями «языковой стэк» (до 8 языков с указанием уровня CEFR), «допустимые бюджеты» (триплет: минимальная/комфортная/максимальная сумма в евро) и «карта доступности» (список аэропортов IATA, до 15 штук).
- Верификация личности: двухфакторная аутентификация (SMS + биометрия по голосовому слепку через вокодер WaveNet). 93% анкет проходят проверку за 4,2 секунды.
- Медиа-контент: изображения сжаты до WebP (квантование 92%), видео — кодек AV1 (битрейт 4 Мбит/с, 1080p). Максимальный вес портфолио — 120 МБ.
- Метки стран: геокодирование на основе административных единиц ISO 3166-2. Для каждой локации вычисляется скоринг «туристической зрелости» (от 0 до 100) на основе данных OpenStreetMap и TripAdvisor API.
Алгоритмы подбора и индекс совместимости
В основе рекомендательной системы — гибридный коллаборативный фильтр (ALS-матричная факторизация с регуляризацией 0,02). Вектор пользователя взвешивается по трём осям: временная синхронность (свободные окна в календаре, разрешение — 30 минут), стиль передвижения (последовательность из 10 последних геоточек с семплингом каждые 6 часов), семантический профиль (анализ текста публикаций через трансформер RuBERT, выделены 64 эмбеддинга).
- Эластичность по странам: поиск строится на инвертированном индексе Elasticsearch с использованием n-грамм (длина 3–5 символов). Словарь пополняется ежедневно из 20 000 топонимов из базы Geonames.
- Порог совпадения: минимальное косинусное расстояние между векторами — 0,73. При согласовании маршрута система автоматически строит граф перемещений (алгоритм Дейкстры, вес рёбер — время в пути).
- Антифрод: детекция аномальных паттернов (более 30 запросов в минуту, использование VPN с низкой репутацией) через энтропийный анализатор. Блокировка — 12 часов.
Протоколы публикаций и стандарты модерации
Каждая публикация (статья, заметка, маршрут) проходит проверку по трём уровням. Первый — формальная валидация: длина текста от 300 до 15 000 знаков (кодировка UTF-8 без BOM), обязательное наличие темы (выбор из 18 пресетов) и хотя бы одной фотографии. Второй — автоматическая модерация через нейросеть ResNet-50 (обучена на датасете из 2,3 млн изображений, точность 98,7%). Третий — выборочная ручная верификация (10% публикаций) командой из 45 операторов.
- Формат маршрутов: GeoJSON MultiLineString с атрибутами «стоимость», «сложность» (1–5), «рейтинг безопасности» (данные МИД). При превышении 14 точек маршрут автоматически разбивается на сегменты.
- Система тегов: хэштеги ограничены 20 символами, только кириллица и латиница. Запрещены метки-дубликаты (проверка через Bloom-фильтр с частотой ложных срабатываний 0,001%).
Отличия от аналогов: технические преимущества
Конкурирующие решения чаще используют упрощённую модель «анкета+чат». Платформа «Собеседники для путешествий» внедряет четыре уникальных модуля: 1) предсказательная аналитика загрузки локаций (модель Prophet, прогноз на 30 дней с точностью ±7%); 2) динамическое шифрование переписки (протокол Signal на основе Double Ratchet); 3) офлайн-синхронизация избранных профилей (база данных SQLite шифруется AES-256, синхронизация при подключении к сети); 4) API для интеграции с календарями (CalDAV, Exchange ActiveSync).
- Надёжность: отказоустойчивость на уровне 99,95% (SLA). Резервирование баз данных — кластер PostgreSQL с репликацией в трёх ЦОД (Москва, Санкт-Петербург, Казань).
- Скорость поиска: среднее время ответа поискового запроса — 187 мс (p95 — 340 мс). Кеширование через Redis Cluster (TTL по умолчанию 600 секунд).
Качество данных и сертификация
Все геоданные валидируются по стандарту OGC Simple Features. Метки стран проверяются на актуальность ежемесячно (источник — UN M.49). Пользовательский контент (тексты, фото) помечается цифровой подписью (ECDSA P-256) для подтверждения авторства. В 2026 году введён стандарт «Прозрачная модерация»: каждый запрет контента фиксируется в блокчейне (гиперледжер Fabric), участник получает хэш-ссылку на решение модератора.
Техническая спецификация версии 3.2.1. Сборка от 15.01.2026.
Добавлено: 24.04.2026
