KAIP VEIKIA INTERNETINĖ PAIEŠKOS SISTEMA?

Pagrindinis / Straipsniai / KAIP VEIKIA INTERNETINĖ PAIEŠKOS SISTEMA?

KAIP VEIKIA INTERNETINĖ PAIEŠKOS SISTEMA?


Internetinė paieškos sistema kiekvienam interneto vartotojui suteikia galimybę surasti reikalingą informaciją, į paieškos sistemą suvedant reikiamus raktinius žodžius, susijusius su dominančia tema.

Pasaulyje egzistuoja ne viena paieškos sistema. Populiariausios iš jų – Google, Yahoo, Bing, Yandex, tačiau šiame straipsnyje didžiausias dėmesys bus kreipiamas į Google paieškos sistemą, kuri vienintelė palaiko funkcijas lietuvių kalba. Be to, ši paieškos sistema vykdo paiešką ne tik interneto puslapių pavadinimuose (kaip dauguma kitų), bet ir dokumentų tekstuose, o tai dar vienas svarbus šios sistemos privalumas.

Iš esmės, visos paieškos sistemos veikia panašiai – internete surenka duomenis, iš kurių sukuria dideles duomenų bazes, reitinguoja raktinius žodžius. Beje, paieškos sistema reitinguoja kiekvieną interneto puslapį pagal daugiau nei 100 kriterijų (pavyzdžiui, šalį, puslapio gyvavimo trukmę, URL adresą ir pan.), todėl šis procesas laikomas gana sudėtingu.

Kaip veikia paieškos sistemos?

Paieškos sistemos veiklai svarbūs trys aspektai: tikrinimas ir indeksavimas; algoritmai; kova su šlamštu. Ir kiekvieną iš jų šiame straipsnyje mes aptarsime išsamiau.

  1. Tikrinimas ir indeksavimas

Iš tiesų, užklausa pradedama vykdyti dar net nepateikus jos paieškos sistemai, nes pirmiausia turi būti tikrinamas ir indeksuojamas daugybę dokumentų apimantis žiniatinklis.  

Tikrinimas. Tam, kad būtų rasti viešai pasiekiami interneto puslapiai, naudojama populiariausia žiniatinklio tikrinimo priemonė Googlebot, kuri lankosi nuorodose, pateiktose tam tikruose puslapiuose, ir Google serveriams pateikia reikiamus duomenis.

Taigi esminiai tikrinimo žingsniai yra žiniatinklio adresų sąrašo tikrinimas ir nuorodų paieška. Svarbiausi tikrinimo kriterijai į kuriuos paieškos sistema kreipia dėmesį – naujų svetainių atsiradimas, pokyčiai esamose svetainėse (ar puslapiuose) ir neveikiančios nuorodos.

Indeksavimas. Tai svarbi ir nuo tikrinimo neatsiejama paieškos sistemos funkcija. Google tikrindama puslapius sukuria indeksą, kad būtų aišku, kaip ieškoti informacijos.

Indeksuodama Google atsižvelgia į daugybę kriterijų, tokių kaip informacijos paskelbimo laikas, turinio pobūdis (pavyzdžiui, ar juose skelbti vaizdai ar vaizdo įrašai) ir kt.

Vis dėlto, norime atkreipti Jūsų dėmesį, jog vartotojas turi pasirinkimą – jis gali arba leisti paieškos sistemai tikrinti ir indeksuoti jo puslapį arba pasinaudoti robot.txt, kuris suteikia galimybę pasirinkti, kad Googlebot netikrintų puslapio.  

  1. Algoritmai

Paprastai kalbant, algoritmai tai kompiuterinės programos, ieškančios tam tikrų signalų (ženklų), kad galėtų pateikti vartotojams kuo tikslesnius rezultatus (būtent tai, ko ieško vartotojas). Dėl šios priežasties paieškos sistemos nuolat atnaujinamos, kad teiktų kuo geresnius ir vartotojų lūkesčius pateisinančius rezultatus.

Pristatome pagrindinius ir svarbiausius paieškos sistemų kriterijus.

  • Atsakymų greitis. Paieškos sistema operatyviai suteikia informaciją, kurios ieškoma.
  • Pateikiama naujausia (vėliausia) ir aktualiausia informacija, aktualijos.
  • Savaime numatoma užklausos pabaiga. Paieškos sistema nuspėja, ko vartotojas galėtų ieškoti. Privalumu laikoma ir tai, kad paieškos sistema supranta terminus, turinčius daugiau nei vieną reikšmę.
  • Užklausos suvokimas. Įvertinama įvestų žodžių reikšmė. Atpažįstami panašios reikšmės žodžiai.
  • Intuityvioji paieška. Tai reiškia, kad rezultatus paieškos sistema pateikia iškart, vos vartotojas pradeda vesti tekstą.
  • Įvairios publikacijos. Randama informacija iš viso pasaulio bibliotekų ir leidėjų (knygos, moksliniai straipsniai, disertacijos ir pan.).
  • Naudojamasi duomenų rinkimo ir saugojimo sistemomis.
  • Žinių schema. Visi rodomi rezultatai yra pagrįsti realių žmonių, vietų, objektų duomenimis.
  • Išmanieji įrenginiai. Pateikiami duomenys apima išmaniesiems įrenginiams (mobiliesiems, planšetėms) skirtus patobulinimus.
  • Patikslinimai, susiję su paieška. Paieškos sistema pateikia du paieškos būdus – paprastąją ar išplėstinę paiešką.

Paprastoji paieška. Google norėdama pateikti Jums svarbius ir kuo tiksliau Jūsų užklausą atitinkančius puslapius, naudoja teksto sulyginimo sistemą, kuri yra gana sudėtinga. Pavyzdžiui, paieškos sistema vertindama puslapį, peržiūri, kaip kiti puslapiai, kuriuose pateikiamos nuorodos į pateikiamą puslapį, jį apibūdina.

Išplėstinė paieška. Tai tokia paieška, kuri padeda derinti ir tikslinti paieškos užklausą.

  • Paieškos metodai. Paieškos sistema pateikia įvairius paieškos būdus – informacijos paiešką, paiešką pagal vaizdus, paiešką balsu ir pan.
  • Stengiamasi mažinti suaugusiems skirtų puslapių rezultatų skaičių.
  • Rodomi fragmentai. Įvykdant vartotojo užklausą, pateikiama kiekvieno rezultato esminė informacija – puslapio pavadinimas ir trumpas aprašas.
  • Klaidų taisymas. Paieškos sistema jau aptinka ir ištaiso galimas rašybos klaidas. Maža to, pateikiami alternatyvūs pasiūlymai.
  • Paieškos sistemos pateikiami rezultatai skirstomi pagal kalbą ir vietą (šalį).
  • Vertinama svetainės ar puslapio kokybė. Kai žmogus atlieka internetinę paiešką, paieškos sistema aplanko (peržiūri) milijardus dokumentų ir atlieka du dalykus: pirma, pateikia vartotojui tik tuos rezultatus, kurie yra svarbūs arba naudingi ir atitinkantys užklausą; antra, reikiamus rezultatus atrenka pagal informacijos tinklalapių populiarumą, kuriam didelę įtaką gali daryti ir SEO.

Kaip paieškos sistemos nustato svetainės (ar puslapio) aktualumą ir populiarumą?

Paieškos sistemai tinkamumo kriterijus reiškia daugiau, nei rasti svetainę ar puslapį su tinkamais raktiniais žodžiais. Anksčiau paieškos sistemos varikliai nesugebėdavo atlikti daugiau už šį paprastą (elementarų) veiksmą ir paieškos rezultatai buvo abejotinos vertės. Ilgainiui buvo sukurti įvairūs būdai, padedantys suderinti rezultatus su vartotojų (ieškovų) užklausomis. Šiandien šimtai veiksnių daro įtaką svetainės ar puslapio aktualumui.

Paieškos sistemos paprastai mano, kad kuo populiaresnė svetainė, puslapis ar dokumentas, tuo vertingesnė jame pateikiama informacija (turinys) turi būti. Ši prielaida pasirodė gana taikli (ir netgi sėkminga), vertinant vartotojų pasitenkinimą gaunamais paieškos rezultatais.

Populiarumas ir aktualumas nėra nustatomi rankiniu būdu. Šiam tikslui paieškos sistemos varikliai naudoja algoritmus, kad atskirtų tinkamas svetaines ar puslapius ir juos reitinguotų pagal kokybę (populiarumą). Šie algoritmai dažnai apima šimtus kintamųjų, paieškos rinkodaros (angl. search marketing) srityje vadinamų „reitingavimo veiksniais“.

Taigi apžvelgę algoritmų funkcijas, matome, kad jie yra sudėtinga, tačiau labai svarbi paieškos sistemos veikimo dalis.

  1. Kova su šlamštu

Kasdien sukuriama begalė nenaudingų, beverčių ir visiškai neaktualių puslapių, dažniausiai vadinamų šlamštu (angl. Spam). Sukuriant ir naudojant tokias svetaines ar puslapius bandoma apgauti paieškos sistemas ir pelnyti aukštesnes paieškos rezultatų pozicijas. Tokie veiksmai kenkia paieškai, nes apsunkina galimybę surasti tinkamas ir geras svetaines (ar puslapius).

Paieškos sistemos stebi tokias svetaines ar puslapius, kurie naudojasi neskaidriomis technikomis ir ilgainiui vis daugiau jų geba atpažinti.

Pateikiame populiariausius šlamšto (netinkamų svetainių ar puslapių) tipus.

  • Tokiu būdu vartotojai gali būti peradresuojami visai į kitą puslapį negu matomas / rodomas paieškos sistemai. Tai reiškia, kad vartotojams pateikiamas vienoks turinys, o paieškos sistemoms – kitoks.
  • Daug kartų kartojami raktiniai žodžiai. Kuomet svetainės ar puslapio tekstas būna arba užslėptas, arba su pertekliniais raktiniais žodžiais, taip pat kenkia paieškai.
  • Užgrobta svetainė. Pašalinių asmenų į Jūsų svetainę teikiamas kenksmingas turinys ar nuorodos. Tai pastebėję, turėtumėte nedelsdami imtis veiksmų.
  • Nenaudojami domenai. Tai rezervuotos svetainės, kuriose nėra tinkamo (unikalaus ir kokybiško) turinio. Jos funkcionuoja netinkamai.
  • Prastas turinys. Nekokybiški ir paviršutiniškai sukurti puslapiai, nesuteikiantys jokios naudos (ir vertės) vartotojams.
  • Blogos nuorodos. Šiuo atveju gali būti tiek iš svetainės skleidžiamos nuorodos, tiek į kitą svetainę nukreipiančios nuorodos. Tai dirbtinės ar klaidinančios nuorodos, kurios dažniausiai atsiranda parduodant arba perkant nuorodas.

Vis dėlto, nerimauti neverta, nes Google paieškos sistemos algoritmai gali aptikti didžiąją dalį šlamšto ir savaime sumažinti jų reitingus.

Ir dar ...

  1. Google paieškos sistema pateikia tik tokius rezultatus, kuriuose buvo aptikti visi Jūsų užklausoje pateikti žodžiai.
  2. Google paieškos sistema įvertina ne į visus užklausoje pateiktus žodžius ar simbolius. Pazvydžiui, jai visiškai nesvarbūs trumpiniai „http“ arba „com“, taip pat skaičiai ar pavienės raidės, nes tai nepadeda susiaurinti paieškos ir gali daryti jai neigiamą įtaką – sulėtinti.
  3. Google paieškos sistema pateikia puslapių ištraukas, kuriose galite matyti kokiame kontekste vartojami Jūsų užklausoje pateikti žodžiai.
  4. Google paieškos sistema neatsižvelgia į raidžių dydį (mažąsias ir didžiąsias), kirtį ir diakritinius ženklus.

 

Pabaigai mes norime pateikti patarimą svetainės kūrėjams – kurkite svetainę su aiškia hierarchija ir tekstinėmis nuorodomis. Pasistenkite, jog Jūsų svetainės turinys būtų naudingas, unikalus ir vertingas. Įsitikinkite, kad jūsų <title> elementai ir ALT atributai yra aprašyti ir tikslūs. Naudokite raktinius žodžius, kad galėtumėte kurti aprašomus, žmonėms tinkamus ir palankius (draugiškus) URL. Nesukčiaukite ir negudraukite didindami svetainės reitingus. Tai svarbūs kriterijai, kurie gali padėti pelnyti paieškos sistemų palankumą.