Najdi.si vse slovenske strani?

10. 2. 2009 v kategoriji Za lastnike spletnih strani in SEO

Vsi vemo, da Najdi.si išče po vseh slovenskih spletnih straneh. Kako pa iskalnik ve, katere strani so slovenske?

Nimamo še umetne inteligence, prav tako iskalnik še ne prepozna jezika, v katerem je stran napisana. V resnici je problem rešen precej bolj “po kmečko”.

Iskalnik deluje tako, da iskalni pajki (roboti, boti) brskajo po sletnih straneh, se obnašajo podobno kot človeški uporabnik, vsebina strani pa se shrani in doda v zbirko podatkov, po kateri potem išče uporabnik iskalnika.

Najdi.si-jevi pajki pa morajo vedeti, katero spletno stran lahko obiščejo in katere ne smejo, ker verjetno ni slovenska.

Kam torej smejo Najdi.si-jevi iskalni pajki?

  1. Najdi.si-jevi pajki imajo dovoljenje, da sami obiščejo katero koli stran, ki ima domensko končnico .si, tudi če stran ne gostuje na strežniku v Sloveiniji in tudi, če vsebina ni v slovenščini.
  2. Najdi.si pajki lahko obiščejo katero koli stran, ki gostuje na strežniku v Sloveniji. Vsaka država ima dodeljen seznam IP številk … na vse te IP-je Najdi.si-jevi pajki lahko dostopajo.

Vse ostale strani, ki ne izpolnujejo enega od teh pogojev, ne bodo nikoli samodejno prišle v Najdi.si.

Treba jih je torej ročno vpisati na naslovu:
http://www.najdi.si/publishers/addpage.html

V iskalnik vam ni treba vpisati vseh podstrani spletišča, zadostuje, da vpišete vstopno stran. Vsak vpis seveda preveri urednik, ki določi, do kam na tem spletišču pajki smejo. Ponavadi je to kar celotna domena.

Če imate torej slovensko spletno stran oz. spletno stran namenjeno slovenskih uporabnikom, ki pa nima domene s končnico .si in ki gostuje na strežniku v tujini, potem stran vpišite v Najdi.si, če želite, da jo bo iskalnik našel.

POMEMBNO: Če ima spletišče tudi poddomene (npr. http://poddomena.domena.com), potem vpišite v iskalnik tudi vse obstoječe poddomene ali pa nas obvestite o tem na urednistvo@najdi.si.


Pozdrav do prihodnjič,
Rok Zorko


P.S. Če kdaj opazite med rezultati iskanj kako tujo spletno stran, ki očitno ne spada v Najdi.si, je to verjetno zato, ker gostuje na slovenskem strežniku in so jo iskalni pajki samodejno obiskali. Opozorite nas na naslov urednistvo@najdi.si. Hvaležni vam bomo. :-)

3 Odzivov to “Najdi.si vse slovenske strani?”

  • Boštjan
    12. 2. 2009 ob 7:49

    To je pa sramota da najdi.si še nima algoritma za prepoznavanje jezika. Če ima stran dovolj teksta (>100 besed) je statistična analiza pogostosti črk in zlogov več kot dovolj natančna. Algoritem napisan v phpju:
    http://boxoffice.ch/pseudo/

  • Marko
    17. 2. 2009 ob 6:39

    Sepravi kaj… ti bi spideriral celoten splet, kar bi posledično pomenilo dosti počasnejše osveževanje slovenskih vsebin in dosti večje stroške?…

  • Boštjan
    19. 2. 2009 ob 9:25

    No, ne pretiravat :)
    To bi lahko bil dodaten pregled, če spider pride do spletne strani na angleškem strežniku in ugotovi da je vsebina slovenska (kar kot vemo se dogaja), potem sledi povezave naprej v nasprotnem primeru se ustavi. Vsekor pa bi to pomenilo večje stroške.