uCheckeruChecker

Пакетная проверка email

Пакетная проверка email (bulk verification) - массовая валидация целого списка адресов за одну операцию. Вы загружаете файл с тысячами или миллионами строк, система проверяет каждый адрес и возвращает результат с разбивкой по статусам.

Как устроен процесс

Загрузка начинается с файла. Обычно это CSV или TXT, реже - XLSX. Система парсит файл, извлекает столбец с email-адресами и ставит их в очередь обработки.

Каждый адрес проходит те же этапы, что и при единичной проверке: синтаксический анализ, DNS/MX-запрос, SMTP-подключение, дополнительные проверки (catch-all, одноразовые почты, ролевые адреса). Разница - в масштабе и оптимизации.

При пакетной обработке валидатор группирует адреса по доменам. Вместо того чтобы делать DNS-запрос для каждого адреса на gmail.com отдельно, система запрашивает MX-запись один раз и применяет результат ко всем адресам этого домена. Аналогичная оптимизация применяется к SMTP-подключениям: несколько адресов одного домена проверяются через одно соединение.

Скорость обработки

Профессиональные сервисы проверяют от 10 000 до 100 000 адресов в час. На скорость влияет несколько факторов: время ответа почтовых серверов, наличие грейлистинга, rate limiting со стороны крупных провайдеров, количество уникальных доменов в списке.

Список из 50 000 адресов, в основном на Gmail и Яндексе, обрабатывается за 20-40 минут. Список такого же размера с сотнями разных корпоративных доменов может занять несколько часов: для каждого домена нужен отдельный DNS-запрос и SMTP-подключение.

Результаты проверки

На выходе вы получаете файл, где каждому адресу присвоен статус. Типичная разбивка:

  • Valid - адрес существует, сервер подтвердил приём.
  • Invalid - адрес не существует или домен без почтового сервера.
  • Risky - catch-all домен, ролевой адрес, одноразовая почта. Адрес может работать, но с ним связаны риски.
  • Unknown - сервер не ответил, тайм-аут или временная ошибка. Повторная проверка может дать результат.

Хороший сервис также возвращает дополнительные флаги: is_disposable, is_role, is_catch_all, is_free_provider. Это позволяет фильтровать результат по нескольким критериям, а не только по бинарному «валиден/невалиден».

Когда использовать

Пакетная проверка нужна в нескольких ситуациях. Первая - перед запуском рассылки по старой базе. Если список не проверялся несколько месяцев, в нём накопились невалидные адреса: люди сменили почту, домены перестали существовать, ящики переполнились.

Вторая - миграция между ESP. При переезде с одного сервиса рассылок на другой полезно очистить базу. Новый ESP оценивает репутацию отправителя с нуля, и высокий bounce rate на первых кампаниях может испортить её навсегда.

Третья - регулярная гигиена. Даже если вы используете real-time проверку на входе, базу стоит перепроверять каждые 3-6 месяцев. Адреса устаревают: корпоративные ящики закрываются при увольнении сотрудников, бесплатные - при длительном неиспользовании.

Требования к входным данным

Один email на строку - самый простой формат. CSV с несколькими столбцами тоже работает: валидатор определяет столбец с адресами автоматически или просит указать его вручную.

Кодировка файла - UTF-8. Если файл в другой кодировке (CP1251, ISO-8859-1), могут возникнуть проблемы с адресами, содержащими нелатинские символы. Большинство сервисов умеют определять кодировку, но лучше конвертировать заранее.

uChecker поддерживает пакетную проверку: загрузите CSV или TXT, получите результат с детализацией по каждому адресу. Группировка по доменам, кэширование DNS и параллельные SMTP-подключения обеспечивают высокую скорость даже на больших списках.

bulk verificationмассовая проверказагрузка спискаочистка базыпакетная валидация
← Глоссарий