Google Analytics uchun Regex filtrlarini qanday yozish va sinovdan o'tkazish (misollar bilan)

Doimiy iboralar Regex Google Analytics Filtrlari

Bu erdagi ko'plab maqolalarim singari, men mijoz uchun bir oz tadqiqot o'tkazaman va keyin bu erda yozaman. Rostini aytsam, buning bir nechta sabablari bor ... birinchi navbatda, mening xotiram dahshatli va ko'pincha o'z veb-saytimni ma'lumot olish uchun izlayman. Ikkinchidan, ma'lumot qidirayotganlarga yordam berish.

Muntazam ifoda (Regex) nima?

Regex - bu matn ichidagi belgilar naqshini izlash va aniqlash uchun matnni moslashtirish yoki almashtirish uchun ishlab chiqish usuli. Barcha zamonaviy dasturlash tillari muntazam ifodalarni qo'llab-quvvatlaydi.

Men doimiy iboralarni yaxshi ko'raman (regex) lekin ular o'rganish va sinovdan o'tkazish uchun ozgina asabiylashtirishi yoki g'azablantirishi mumkin. Google Analytics-ning ajoyib qobiliyatlari bor ... bu erda siz oddiy iboralar yordamida ko'rinishlar yaratishingiz yoki ma'lumotlaringizni oddiy iboralar ichida filtrlashingiz mumkin.

Masalan, men yorliq sahifalarimdagi trafikni ko'rishni istasam, permalink tuzilmasida / tag / uchun filtrlashim mumkin:

/tag\/

Sintaksis u erda juda muhimdir. Agar men shunchaki "yorliq" dan foydalansam, unda barcha varaqlarda termin yorlig'i bor edi. Agar men "/ tag" dan foydalansam, u holda teg bilan boshlanadigan har qanday URL manzil qo'shiladi, masalan / tag-management chunki Google Analytics odatiy ifodadan keyin har qanday belgini qo'shish uchun sukut saqlaydi. Shunday qilib, menda quyidagi slash mavjudligini ta'minlashim kerak ... lekin u qochish belgisiga ega bo'lishi kerak.

sahifa filtri regex

Regex sintaksis asoslari

Syntax Tavsif
^ Bilan boshlanadi
$ Tugaydi
. Har qanday belgi uchun joker belgi
* Oldingi elementning nol yoki undan ko'pi
.* Belgilarga mos keladi
? Nolinchi yoki oldingi elementning bir marta
+ Oldingi elementning bir yoki bir necha marta
| OR operatori
[abc] A yoki b yoki c (har qanday sonli belgi bo'lishi mumkin)
[az] A to z oralig'i (har qanday sonli belgi bo'lishi mumkin)
[AZ] A dan Z gacha (katta harflar bilan yozilgan)
[0-9] 0 dan 9 gacha bo'lgan oraliq (har qanday raqam bo'lishi mumkin)
[a-zA-Z] A dan Z gacha yoki A dan Z gacha bo'lgan diapazon
[a-zA-Z0-9] Barcha alfasayısal belgilar
{1} To'liq 1 ta misol (har qanday raqam bo'lishi mumkin)
{1-4} 1 dan 4 gacha bo'lgan holatlar oralig'i (har qanday raqam bo'lishi mumkin)
{1,} 1 yoki undan ortiq misol (har qanday raqam bo'lishi mumkin)
() Qoidalaringizni guruhlang
\ Maxsus belgilardan qochish
\d Raqamli belgi
\D Raqamli bo'lmagan belgi
\s Oq bo'shliq
\S Bo'sh joy
\w so'z
\W So'zsiz (tinish belgilari)

Google Analytics uchun Regex misollari

Keling, ba'zi birlari uchun ba'zi misollarni keltiraylik Maxsus filtrlar. Mening hamkasblarimdan biri ichki sahifani aniqlash yo'li bilan yordam so'radi /indeks doimiy ravishda doimiy ravishda yozilgan barcha blog postlariga qo'shimcha ravishda:

Filtr maydoni uchun maxsus filtr naqshim So'rov URL manzili:

^/(index|[0-9]{4}\/)

Bu asosan / indeksni yoki har qanday 4 xonali raqamli chiziq bilan yakunlangan chiziq bilan yakunlanishini qidirishni bildiradi. Men Analytics-da ko'rinish yaratdim va buni filtr sifatida qo'shdim:

Google Analytics ko'rish filtri

Yana bir nechta misol:

  • Sizda URL-ning doimiy bog'lanish yo'lida yozilgan blogingiz bor va siz ro'yxatni istalgan yilga filtrlashni xohlaysiz. Shunday qilib, men har qanday 4 ta raqamni, so'ngra oxirgi chiziqni xohlayman. URl filtri namunasini so'rang:

^/[0-9]{4}\/

  • Sarlavha joylashgan barcha sahifalaringizni taqqoslamoqchisiz guvohnoma or tasdiqlash unda. Sahifa sarlavhasi filtri namunasi:

(.*)certificat(.*)

  • Ikki ochilgan sahifani ularning ichida o'tkazilgan Kampaniya Mediumi asosida taqqoslamoqchisiz Google Analytics kampaniyasining URL manzili utm_medium = sifatida to'g'ridan-to'g'ri pochta or pulli qidiruv.

(direct\smail|paid\ssearch)

  • Siz URL-ga asoslangan erkaklar ko'ylaklari bo'lgan barcha mahsulotlarni taqqoslamoqchisiz. URl filtri namunasini so'rang:

^/mens/shirt/(.*)

  • Siz URL bilan yakunlangan barcha sahifalarni raqam bilan taqqoslamoqchisiz. URl filtri namunasini so'rang:

^/page/[1-9]*/$

  • Siz bir qator IP-manzillarni chiqarib tashlamoqchisiz. IP-manzil filtri naqshini chiqarib tashlang:

123\.456\.789\.[0-9]

  • Querystring success = true asosida yuborish muvaffaqiyatli bo'lgan thankyou.html sahifasini qo'shmoqchisiz. URl filtri namunasini so'rang:

thankyou\.html\?success=true

Regex Expressions-ni qanday tekshirish kerak

Google Analytics-dagi sinov va xatolardan ko'ra, men tez-tez o'tib ketaman 101, doimiy iboralarni sinab ko'rish uchun ajoyib vosita. Hatto bu sizning sintaksisingizni buzadi va odatiy ifodangizning tafsilotlarini beradi:

regex101 doimiy iboralari

Regex dasturini tuzish, sinash va disk raskadrovka

Siz nima deb o'ylaysiz?

Ushbu sayt spamni kamaytirish uchun Akismet-dan foydalanadi. Fikringiz ma'lumotlarining qanday ishlashini bilib oling.