Qanday qilib Screaming Frog-ning SEO Spider-dan foydalanib katta saytni skanerlash va ma'lumotlarni chiqarib olish
Biz hozirda bir nechta mijozlarga Marketo migratsiyasida yordam beryapmiz. Yirik kompaniyalar shunga o'xshash korporativ yechimlardan foydalanar ekan, bu o'rgimchak to'riga o'xshaydi, u yillar davomida jarayonlar va platformalarda to'qiladi, toki kompaniyalar har bir teginish nuqtasidan xabardor bo'lmaguncha.
Marketo kabi korporativ marketingni avtomatlashtirish platformasi bilan shakllar saytlar va ochilish sahifalaridagi ma'lumotlarning kirish nuqtasidir. Kompaniyalar ko'pincha o'z saytlarida yangilanish uchun aniqlanishi kerak bo'lgan minglab sahifalar va yuzlab shakllarga ega.
Buning uchun ajoyib vosita Qurbaqaning SEO o'rgimchisi... saytdan ma'lumotlarni skanerlash, tekshirish va olish uchun SEO bozoridagi eng mashhur platforma. Xususiyatlarga boy platforma sizga kerak bo'lgan deyarli har bir vazifa uchun yuzlab variantlarni taklif etadi. Xususiyatlar qidiruvni optimallashtirishdan ancha kengaydi, ammo saytingiz tekshirilayotganda ma'lumotlarni olish uchun ajoyib foydali xususiyat mavjud.
Qichqiriq qurbaqasi SEO o'rgimchak: sudralib chiqish
Screaming Frog SEO Spider-ning asosiy xususiyati shundaki, siz unga asoslangan ekstraktsiyalarni amalga oshirishingiz mumkin regex, XPathyoki CSSPath xususiyatlari. Bu juda foydali, chunki biz mijozning saytlarini skanerlash va MunchkinID va FormId qiymatlarini sahifalardan tekshirish va qo'lga kiritishni xohlaymiz.
Asbob bilan oching Konfiguratsiya> Maxsus> Ekstraktsiya ajratib olishni istagan elementlarni aniqlash uchun.
Ekstraksiya ekrani deyarli cheksiz ma'lumot to'plashga imkon beradi:
Regex, XPath va CSSPath ekstrakti
MunchkinID uchun identifikator sahifadagi ariza skriptida joylashgan:
<script type='text/javascript' id='marketo-fat-js-extra'>
/* <![CDATA[ */
var marketoFat = {
"id": "123-ABC-456",
"prepopulate": "",
"ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
"popout": {
"enabled": false
}
};
/* ]]> */
Keyin biz murojaat qilamiz Regex qoidasi sahifaga kiritilgan skript yorlig'i ichidan idni olish uchun:
Regex: ["']id["']: *["'](.*?)["']
Forma identifikatori uchun ma'lumotlar Marketo formasidagi kirish yorlig'ida joylashgan:
<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">
Biz murojaat qilamiz XPath qoidasi sahifaga kiritilgan shakl ichidan identifikatorni olish uchun. XPath so'rovi nomi bilan kiritiladigan shaklni qidiradi qo'rqinchli, keyin qazib olish tejaydi qiymati:
XPath: //form/input[@name="formid"]/@value
Inline Style teglarini ajratib oling
Biz mijozga sahifa bilan deyarli har bir elementni sozlash uchun Elementor plaginidagi inline uslublardan foydalangan saytni tozalashda yordam beramiz. Inline uslublar qayerda ishlatilganligini aniqlash uchun biz saytni maxsus chiqarish uchun bir nechta RegEx qoidalari bilan qirib tashladik:
- Span Inline uslubi:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Anchor yorlig'ining inline uslubi:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Div Tag Inline uslubi:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Sarlavha yorlig'ining ichki uslubi:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
Istisnolar
At Martech Zone, biz saytga turli subdomenlarda bir nechta tillarda xizmat qilamiz. Ushbu tarjimalarni skanerlash shart emas, chunki barcha aktivlar va maʼlumotlar asosiy saytga asoslangan. Shu sababli, biz istisnolar ro'yxati konfiguratsiyasini yoqdik va quyidagi qoidani qo'shdik:
.*\.martech.zone
Bundan tashqari, teglar kabi keraksiz yo'llarni o'tkazib yuborish uchun ham foydalanishingiz mumkin:
martech.zone/tag/.*
Shuningdek, biz bilan tugaydigan AMP sahifalarimizni skanerlashni xohlamaymiz ?amp=1
, shuning uchun ichida
https?://[^\s]+?\?amp=1
Platformada hatto ba'zilarni sinab ko'rish uchun yaxshi usul mavjud URL saytingizni skanerlashdan oldin ularning to'g'ri ishlashini ta'minlash uchun qoidalarga qarshi.
Screaming Frog SEO Spider JavaScript Rendering
Screaming Frog-ning yana bir ajoyib varianti shundaki, siz ular bilan cheklanmaysiz HTML sahifada siz saytingizga shakllar qo'yadigan har qanday JavaScript-ni ko'rsatishingiz mumkin. Ichida Konfiguratsiya> O'rgimchak, siz Renderlash yorlig'iga o'tishingiz va uni yoqishingiz mumkin.
Bu saytni ko'rib chiqish uchun biroz ko'proq vaqt talab etadi, albatta, lekin siz JavaScript-ni mijoz tomonidan ko'rsatiladigan shakllar va server tomoniga qo'shilgan shakllarni olasiz.
Bu juda aniq dastur bo'lsa-da, katta saytlar bilan ishlashda juda foydali dastur. Siz o'zingizning shakllaringiz saytga joylashtirilgan joyni tekshirishni mutlaqo xohlaysiz.
Screaming Frog SEO Spider-ni yuklab oling
oshkor: Martech Zone ushbu maqolada o'zining sheriklik havolalaridan foydalanmoqda.