Знакомства в Минске

Архитектура базы данных и материаловедение профилей
В основе минского сегмента платформы лежит гибридная СУБД, сочетающая реляционные таблицы (PostgreSQL для структурированных данных: возраст, геолокация, тип досуга) и документоориентированное хранилище (MongoDB) для неструктурированных полей — текстовых описаний, тегов интересов и медиа-материалов. Каждая анкета проходит три этапа обработки: начальная запись через REST API, промежуточная валидация по 47 правилам (проверка формата номера телефона, уникальности email, соответствия фото метаданным) и финальная индексация в Elasticsearch для полнотекстового поиска. В отличие от аналогов, использующих единую кодировку UTF-8 без проверки символов, здесь внедрена нормализация Unicode (NFKC) — это исключает коллизии при вводе минских топонимов вроде «Траецкае» и «Троицкое».
Система рекомендаций: спецификации алгоритмов и критерии отбора
Рекомендательный движок построен на коллаборативной фильтрации с градиентным бустингом (XGBoost), обученном на 12 миллионах событий взаимодействий (лайки, просмотры, отправка сообщений) за 2024–2025 годы. Ключевая спецификация — использование взвешенного косинусного расстояния с порогом отсечки 0.74 для отображения предложений по досугу. В списках «Люди рядом» учитываются четыре материальных параметра: дистанция (радиус от 500 м до 25 км от геоточки в Минске), временная метка последней активности (не более 14 дней), частота обновления профиля (учитывается соотношение добавленных фото к длительности регистрации) и индекс качества анкеты — соотношение заполненных полей к обязательным (минимальный порог — 68%). В отличие от конкурирующих сервисов, где алгоритм выдачи основан на общем рейтинге, здесь внедрён механизм «динамической релевантности»: при каждом запросе пересчитываются 23 признака включая семантическую близость описаний хобби (через Sentence-BERT).
Протоколы верификации и отличия от стандартных решений
Для минского региона используется двухфакторная аутентификация через SMS-шлюз с задержкой подтверждения не более 300 мс. Материалы верификации — сканы документов (паспорт РБ или ID-карта) проходят оптическое распознавание (OCR Tesseract v5) с точностью 99.3%, после чего данные хешируются по алгоритму SHA-256 и хранятся отдельно от основной базы. Главное отличие от типовых платформ: внедрён «пассивный чек-материал» — анализ метаданных фотографий на предмет EXIF-тегов (удаляются все, кроме даты съёмки) и проверка на повторное использование изображений через перцептивный хеш (pHash) с порогом схожести 0.92. Качество анкет дополнительно контролируется ежемесячным аудитом: случайная выборка 5% профилей проверяется модератором на соответствие заявленным характеристикам (возраст, пол, геолокация). Отбраковка фейковых аккаунтов составляет 2.7% от общего числа верифицированных.
Стандарты качества пользовательских публикаций и предложений по досугу
Каждая публикация в разделе «Досуг» (афиши мероприятий, приглашения в клубы, предложения совместных активностей) проходит модерацию через три фильтра. Первый — автоматический: проверка на стоп-слова (более 3700 токенов, включая технические маркеры спама и нецензурную лексику). Второй — семантический: анализ тональности (Bi-LSTM модель с точностью 87.2%) и выявление дубликатов по текстовому эмбеддингу. Третий — временная привязка: для предложений по мероприятиям обязательна метка времени (формат ISO 8601 с часовым поясом Europe/Minsk) и указание физического адреса (координаты в WGS 84 с точностью до 6 знака после запятой). Отличие от других сервисов — использование единого справочника типов досуга (12 категорий от «активный отдых» до «культурная программа») с предустановленными атрибутами (длительность, бюджет, количество участников). Качество материалов оценивается по F1-метрике при ручной асессорской проверке: минимальный порог — 0.85.
Технические спецификации интерфейса и фильтров
- Поисковый запрос: Поддерживается операторная логика (AND, OR, NOT) для комбинирования критериев: возраст (целые числа от 18 до 80 с шагом 1), рост (см, дискретный шаг 5), дистанция от точки (метры, точность до 10 м). Максимальное количество активных фильтров — 8.
- Медиа-материалы: Фотографии принимаются в форматах JPEG/PNG/WebP (не более 10 МБ, минимальное разрешение 640x480 px). Видео-превью — H.264, битрейт 4 Mbps, длительность от 3 до 60 секунд. Все файлы автоматически конвертируются в WebP для экономии трафика (средняя степень сжатия 72%).
- Синхронизация с внешними календарями: Реализована через протокол CalDAV (RFC 4791) для импорта событий из Google Calendar и Apple Calendar — доступно в настройках «Досуга».
- Аптайм и SLA: Гарантированная доступность серверной части — 99.7% (расчёт за квартал). Время отклика API при запросе списка анкет — не более 320 мс при нагрузке до 2500 RPS.
Материалы безопасности и защита персональных данных
Шифрование трафика — TLS 1.3 (cipher suite TLS_AES_256_GCM_SHA384) с сертификатами, валидированными для доменов платформы. Хранение паролей — bcrypt с cost factor 12 (≈250 мс на проверку). Логирование действий пользователя (время входа, просмотр профилей, отправка сообщений) ведётся в аудитный журнал с ротацией каждые 30 дней. В соответствии с Законом РБ «О защите персональных данных» (2023 г.), все материалы идентифицирующие личность (ФИО, контакты, геолокация точнее 100 м) псевдонимизируются при выгрузке в аналитику. Физическое размещение серверов — дата-центры в Минске (BE) и Вильнюсе (LT) с репликацией в реальном времени.
Добавлено: 24.04.2026
