Пакетная проверка email
Пакетная проверка email (bulk verification) - массовая валидация целого списка адресов за одну операцию. Вы загружаете файл с тысячами или миллионами строк, система проверяет каждый адрес и возвращает результат с разбивкой по статусам.
Как устроен процесс
Загрузка начинается с файла. Обычно это CSV или TXT, реже - XLSX. Система парсит файл, извлекает столбец с email-адресами и ставит их в очередь обработки.
Каждый адрес проходит те же этапы, что и при единичной проверке: синтаксический анализ, DNS/MX-запрос, SMTP-подключение, дополнительные проверки (catch-all, одноразовые почты, ролевые адреса). Разница - в масштабе и оптимизации.
При пакетной обработке валидатор группирует адреса по доменам. Вместо того чтобы делать DNS-запрос для каждого адреса на gmail.com отдельно, система запрашивает MX-запись один раз и применяет результат ко всем адресам этого домена. Аналогичная оптимизация применяется к SMTP-подключениям: несколько адресов одного домена проверяются через одно соединение.
Скорость обработки
Профессиональные сервисы проверяют от 10 000 до 100 000 адресов в час. На скорость влияет несколько факторов: время ответа почтовых серверов, наличие грейлистинга, rate limiting со стороны крупных провайдеров, количество уникальных доменов в списке.
Список из 50 000 адресов, в основном на Gmail и Яндексе, обрабатывается за 20-40 минут. Список такого же размера с сотнями разных корпоративных доменов может занять несколько часов: для каждого домена нужен отдельный DNS-запрос и SMTP-подключение.
Результаты проверки
На выходе вы получаете файл, где каждому адресу присвоен статус. Типичная разбивка:
- Valid - адрес существует, сервер подтвердил приём.
- Invalid - адрес не существует или домен без почтового сервера.
- Risky - catch-all домен, ролевой адрес, одноразовая почта. Адрес может работать, но с ним связаны риски.
- Unknown - сервер не ответил, тайм-аут или временная ошибка. Повторная проверка может дать результат.
Хороший сервис также возвращает дополнительные флаги: is_disposable, is_role, is_catch_all, is_free_provider. Это позволяет фильтровать результат по нескольким критериям, а не только по бинарному «валиден/невалиден».
Когда использовать
Пакетная проверка нужна в нескольких ситуациях. Первая - перед запуском рассылки по старой базе. Если список не проверялся несколько месяцев, в нём накопились невалидные адреса: люди сменили почту, домены перестали существовать, ящики переполнились.
Вторая - миграция между ESP. При переезде с одного сервиса рассылок на другой полезно очистить базу. Новый ESP оценивает репутацию отправителя с нуля, и высокий bounce rate на первых кампаниях может испортить её навсегда.
Третья - регулярная гигиена. Даже если вы используете real-time проверку на входе, базу стоит перепроверять каждые 3-6 месяцев. Адреса устаревают: корпоративные ящики закрываются при увольнении сотрудников, бесплатные - при длительном неиспользовании.
Требования к входным данным
Один email на строку - самый простой формат. CSV с несколькими столбцами тоже работает: валидатор определяет столбец с адресами автоматически или просит указать его вручную.
Кодировка файла - UTF-8. Если файл в другой кодировке (CP1251, ISO-8859-1), могут возникнуть проблемы с адресами, содержащими нелатинские символы. Большинство сервисов умеют определять кодировку, но лучше конвертировать заранее.
uChecker поддерживает пакетную проверку: загрузите CSV или TXT, получите результат с детализацией по каждому адресу. Группировка по доменам, кэширование DNS и параллельные SMTP-подключения обеспечивают высокую скорость даже на больших списках.
