Чтобы получить телефонные номера и email-адреса с множества сайтов, не нужно тратить драгоценное время на ручной сбор информации. В этом посте я покажу, как автоматизировать процесс сбора данных и облегчить себе работу с помощью программы Screaming Frog.
Инструкция очень простая в реализации и данное действие может выполнить любой человек, умеющий пользоваться компьютером.
Разрешить краулеру сканировать закрытые страницы
На страницах, которые могут быть закрыты от индексации, также могут быть ненужные почты и номера. Поэтому перед сканированием разрешаем краулеру ходить по страницам, которые закрыты мета-тегом или в robots.txt - ссылка на инструкцию.
Сбор контактных данных с 1 сайта
1. Запускаем Screaming Frog. Переходим в раздел “Configuration” – “Custom” – “Custom Extraction”.
2. Дважды нажимаем на кнопку "+Add". Первое поле будет использовано для поиска email адресов, а второе для телефонных номеров
3. В названия полей пишем названия того, что мы будем искать (Почты и Номера)
4. В поле Enter Xpath вставляем значения, которые указаны ниже
//a[starts-with(@href, 'mailto')]
Данная конструкция ищет все почты на вашем сайте. Её вставляем в строку "Почты"
//a[starts-with(@href, 'tel')]
Ищет номера телефонов. Её вставляем в строку "Номера"
5. Нажимаем "OK" и запускаем сканирование сайта, нажав на кнопку "Start" 6. После окончания парсинга переходим в раздел Custom Extraction, в котором вы увидите все почты и номера, которые фигурируют на страницах вашего сайта.
Остались вопросы?
Оставьте свой номер телефона и я отвечу на все вопросы
Нажимая на кнопку, вы даете согласие на обработку своих персональных данных и соглашаетесь с политикой конфиденциальности