Google Crawling og indeksering

24. september, 2007 af Martin Østergaard

De 2 termer indenfor Google’s måde at optage sider på er ordene crawling og indexing (indeksering). Mange går dog i den tro at disse 2 ord dækker for det samme, hvilket ikke er tilfældet.

Crawling

Når google opdager dit website igennem links, begynder den at crawle websitet. Dette vil sige at den følger alle de links den finder, indtil den har kortlagt hele websitet. Når den har gjort dette begynder den med indekseringen.

Indeksering

Indeksering betyder at den nu har kortlagt alle dine sider på websitet, og nu vælger at vise dem i google resultaterne. Siderne kan herefter blive fundet ved en søgning efter ord som forekommer på dit website.

Sammenlagt

I overført betydning går google på opdagelse (crawling) for hele websitet, når den har opdaget alt hvad der er at opdage, laver den et kort (indekserer) og derefter udgiver dette kort (dit websitet bliver fundet via en søgning på google).

Det er derfor vigtigt at pointere at google sagtens kan have opdaget alle dine sider, selvom den ikke har indekseret dem. Dette sker f.eks. ved at man laver et meta tag med no-index, eller en robots.txt. Den eneste måde at du kan beskytte sider 100% mod at blive fundet på google, er via et login til samtlige sider. Hvis blot én af siderne kan tilgåes udenom login, så vil google finde den med tiden, og derefter også resten af siderne.

Så derfor, vær lidt varsom med at ligge alle informationer på nettet, chancen for at google finder dem er stor 😉

Skrevet i Dit og Dat | Kommentar 14 kommentarer »

Kommentarer:
  1. Thomas Justesen

    Cool indlæg. Der har lige været en debat på Amino om netop den problemstilling, så jeg linkede lige til dit indlæg 🙂


  2. Martin Østergaard

    Må vist til at følge lidt mere med på Amino så 🙂


  3. Thomas Justesen

    Ja, det må du hellere 🙂


  4. Anders Jakobik Kolding

    God artikel. Tak fordi du skærer det ud i pap.


  5. Peter K

    Indeksering …
    Måske mere over i at Goolge sammenligner det den mener din side handler om med andre sider den mener også handler om det samme og derefter kommer så den dejlige algoritme udregning ingen ved hvordan fungere og sætter din side ind i søgeresultatet hvor google mener det er bedst for de brugere der skal se på søgeresultatet. Sådan helt forenklet.. 🙂

    Peter


  6. Signe Krusell

    Hej Martin,
    Ovenstående er jeg med på, men når jeg kører mit site igennem seomoz crawl test, får jeg en besked om at der kun er fire sider indexeret i google. (har skrevet mange sider) Google kan dog godt finde siderne hvis jeg søger efter noget unikt inhold på en bestemt side. Jeg bruger typo3, og har en mistanke om at det er noget med det at gøre. Håber der er nogle der kan hjælpe:-)


  7. Martin Østergaard

    Hej Signe,

    Du kan jo altid lave en site søgning på Google, og se hvilke sider Google har indekseret. Du gør ved at skrive “site:www.itf.dk” (uden “‘er) på Google, og så kan du se hvad Google kender til.

    Prøv også http://tools.summitmedia.co.uk/spider/ og tjek dit website der igennem. Deres spider kan hurtigt give et svar på hvordan dit website ser ud totalt set. 🙂


  8. Mette Andreasen

    Fra ikke nørden, men en som gerne vil lære! 🙂

    Kan i hjælpe mig?

    Når jeg forsøger mig på site søgning på google, site:www.kasamia.dk kommer “siden kan ikke vises” frem. Skal man bruge et specielt program for at åbne denne side?


  9. Martin Østergaard

    Hej Mette,

    Dine side kasamia.dk kommer fint frem her. Husk på at hvis du lige har oprettet domænet kan der gå noget tid inden du kan skrive en “site” anmodning på google som giver resultater.


  10. Christian Kransbjerg

    Godt og meget relevant indlæg i disse “se-mig-se-mig” tider, hvor alle ønsker at komme frem i google. 🙂
    Der er nemlig også en del info, man ønsker holdt privat til en lukket gruppe af modtagere, og her er det netop relevant at ens data/information ikke er at finde på google.


  11. Thomas Justesen

    @Mette: Du skal søge på site:kasamia.dk (uden www), så virker det fint her 😉


  12. Kristian

    Spændende artikel 🙂

    Mvh Kristian


  13. Heine

    Jeg har faktisk altid troet at de to ord havde samme betydning i sidste ende – well, så blev man da lidt klogere 🙂


  14. klaus

    tak for en god letforståelig artikel.

    mvh klaus


Kommentar

Nyeste indlæg

Seneste kommentarer


Fatal error: Uncaught Error: Call to undefined function split() in /var/www/bcool.dk/public_html/wp-content/plugins/recentCommentsWidget.php:138 Stack trace: #0 /var/www/bcool.dk/public_html/wp-content/themes/bcool/sidebar.php(42): fp_get_recent_comments(5, 10, 10, 0) #1 /var/www/bcool.dk/public_html/wp-includes/template.php(572): require_once('/var/www/bcool....') #2 /var/www/bcool.dk/public_html/wp-includes/template.php(531): load_template('/var/www/bcool....', true) #3 /var/www/bcool.dk/public_html/wp-includes/general-template.php(122): locate_template(Array, true) #4 /var/www/bcool.dk/public_html/wp-content/themes/bcool/single.php(36): get_sidebar() #5 /var/www/bcool.dk/public_html/wp-includes/template-loader.php(75): include('/var/www/bcool....') #6 /var/www/bcool.dk/public_html/wp-blog-header.php(19): require_once('/var/www/bcool....') #7 /var/www/bcool.dk/public_html/index.php(17): require('/var/www/bcool....') #8 {main} thrown in /var/www/bcool.dk/public_html/wp-content/plugins/recentCommentsWidget.php on line 138