Screaming Frog-un SEO Spider-dən istifadə edərək necə böyük bir sayt tarama və məlumat çıxarmaq olar
Hazırda bir neçə müştəriyə Marketo köçürmələri ilə kömək edirik. Böyük şirkətlər bu kimi korporativ həllərdən istifadə etdikcə, şirkətlər hər toxunma nöqtəsindən belə xəbərdar olmayana qədər illər ərzində özünü proseslərə və platformalara bağlayan hörümçək toru kimidir.
Marketo kimi müəssisə marketinqinin avtomatlaşdırılması platforması ilə formalar saytlar və açılış səhifələrində məlumatların giriş nöqtəsidir. Şirkətlərin tez-tez saytlarında yenilənmək üçün müəyyən edilməli olan minlərlə səhifə və yüzlərlə forma var.
Bunun üçün əla bir vasitədir Frog-un SEO Hörümçəyini Qışqırmaq… bəlkə də saytdan məlumatların taranması, yoxlanılması və çıxarılması üçün SEO bazarında ən populyar platformadır. Xüsusiyyətlərlə zəngin platforma, demək olar ki, tələb etdiyiniz hər bir tapşırıq üçün yüzlərlə seçim təklif edir. Xüsusiyyətlər axtarış üçün optimallaşdırmadan xeyli kənara çıxır, bununla belə saytınızdan məlumatların taranarkən çıxarılması üçün inanılmaz faydalı bir xüsusiyyət var.
Screaming Frog SEO Spider: Tarama və çıxarış
Screaming Frog SEO Spider-in əsas xüsusiyyəti, xüsusi çıxarışları əsas götürərək yerinə yetirməyinizdir regex, XPathvə ya CSSP yolu xüsusiyyətləri. Bu çox faydalıdır, çünki biz müştərinin saytlarını taramaq və səhifələrdən MunchkinID və FormId dəyərlərini yoxlamaq və ələ keçirmək istəyirik.
Alətlə, açın Konfiqurasiya> Xüsusi> Çıxarış çıxarmaq istədiyiniz elementləri müəyyən etmək.
Ekstraksiya ekranı demək olar ki, məhdudiyyətsiz məlumat toplanmasına imkan verir:
Regex, XPath və CSSPath çıxarılması
MunchkinID üçün identifikator səhifədəki forma skriptində yerləşir:
<script type='text/javascript' id='marketo-fat-js-extra'>
/* <![CDATA[ */
var marketoFat = {
"id": "123-ABC-456",
"prepopulate": "",
"ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
"popout": {
"enabled": false
}
};
/* ]]> */
Sonra tətbiq edirik Regex qaydası səhifəyə daxil edilmiş skript etiketinin içindən id-i tutmaq üçün:
Regex: ["']id["']: *["'](.*?)["']
Form ID üçün məlumatlar Marketo forması daxilindəki bir giriş etiketindədir:
<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">
Tətbiq edirik XPath qaydası səhifəyə daxil edilmiş formadan id-i tutmaq üçün. XPath sorğusu adı olan girişi olan formanı axtarır qorxunc, sonra çıxarış dəyər:
XPath: //form/input[@name="formid"]/@value
Daxili Stil Teqlərini çıxarın
Biz müştəriyə səhifə ilə faktiki olaraq hər elementi fərdiləşdirmək üçün Elementor plaginində daxili üslublardan istifadə etdiyi saytı təmizləməyə kömək edirik. Daxili üslubların harada istifadə edildiyini müəyyən etmək üçün saytı xüsusi çıxarış üçün bir neçə RegEx qaydaları ilə sındırdıq:
- Xətti Üslubu əhatə edin:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Çapa etiketinin daxili üslubu:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Div Tag Inline Style:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
- Başlıq etiketi daxili üslubu:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
Istisnalar
At Martech Zone, biz müxtəlif subdomenlərdə sayta bir çox dillərdə xidmət göstəririk. Bu tərcümələri taramaq lazım deyil, çünki bütün aktivlər və məlumatlar əsas sayta əsaslanır. Buna görə, biz İstisna Siyahı Konfiqurasiyasını aktiv etdik və aşağıdakı qaydanı əlavə etdik:
.*\.martech.zone
Bundan əlavə, etiketlər kimi lazımsız yolları keçmək üçün də istifadə edə bilərsiniz:
martech.zone/tag/.*
Biz həmçinin bitən AMP səhifələrimizi taramaq istəmirik ?amp=1
, belə ki
https?://[^\s]+?\?amp=1
Platformada hətta bəzilərini sınamaq üçün gözəl bir üsul var URL'ler Saytınızı taramadan əvvəl onların düzgün işləməsini təmin etmək üçün qaydalara qarşı.
Screaming Frog SEO Spider JavaScript Rendering
Screaming Frog-un başqa bir əla variantı, bununla məhdudlaşmamağınızdır HTML səhifədə siz saytınıza formalar daxil edəcək istənilən JavaScript-i göstərə bilərsiniz. İçində Konfiqurasiya> Hörümçək, göstərmə nişanına gedib bunu aktivləşdirə bilərsiniz.
Əlbətdə bu saytın taranması bir az daha uzun çəkir, ancaq JavaScript tərəfindən müştəri tərəfində göstərilən formaları və server tərəfinə daxil edilmiş formaları əldə edəcəksiniz.
Bu çox spesifik bir tətbiq olsa da, böyük saytlarla işləyərkən inanılmaz dərəcədə faydalıdır. Formalarınızın saytın daxilində yerləşdiyini mütləq yoxlamaq istərdiniz.
Screaming Frog SEO Spider yükləyin
Açıqlanması: Martech Zone bu məqalədə öz filial bağlantılarından istifadə edir.