European Business Connect Blog» Blogarchiv » Logfile-Analysen: Was tun Crawler auf der Website?

Logfile-Analysen: Was tun Crawler auf der Website?

FÃ¼r die Suchmaschinenoptimierung/SEO ist es wichtig zu wissen, wie sich der Crawler der Suchmaschine auf der eigenen Website verhÃ¤lt: welche URL wird oft gecrawlt, welcher HTTP-Statuscode ausgegeben, was behindert die Indexierung der Website? Logfile-Analysen kÃ¶nnen hier hilfreiche Antworten liefern.

Logfiles, die Spuren der Besucher

Logfiles sind die aufgezeichneten Zugriffe auf einen Server. Ob Suchmaschine, User oder Tool, alle Zugriffe hinterlassen einen Eintrag im Logfile des Servers. WÃ¤hrend das Nutzerverhalten mittlerweile besser mit Tools wie Google Analytics interpretiert werden kann, sind Logfiles fÃ¼r die Crawler-Analyse immer noch ein guter Ausgangspunkt.

Wenn der Crawler die Datei nicht findet

Werden Website-Inhalte vom Crawler erst spÃ¤t gefunden und indexiert, ist dies ein Wettbewerbsnachteil, der durch SEO-MaÃŸnahmen korrigiert werden kann. Dazu muss der Crawling-Engpass aber erst erkannt werden. Meist handelt es sich dabei um ein Mix verschiedener Probleme, die den Bot an der Indexierung hindern.

Logfiles des Crawlers kÃ¶nnen gefiltert werden

Ãœber die Reverse-DNS-Lookup der Windows Console kann Ã¼ber die Server-IP die Herkunft einer Anfrage als Googlebot bestimmt werden. Da die Zahl der Zugriffe aber Regionen erreichen kann, die kaum noch zu validieren sind, wird bei Ã¼ber 10 Mio. Zugriffen des Googlebot innerhalb eines Monats nur noch der IP-Bereich 66.249.*.*. analysiert. Ein Vergleich der Zugriffe mit den â€šCrawl Statistikenâ€˜ der Google-Search-Console empfiehlt sich an dieser Stelle. Je lÃ¤nger der Betrachtungszeitraum und je umfangreicher die Daten, desto aussagekrÃ¤ftiger sind AuffÃ¤lligkeiten und â€šBottlenecksâ€˜ im Crawling-Verhalten.

Userdaten zusammenfassen und extrahieren

Mit der Windows Console, GREP oder Terminal fÃ¼r Mac-User lassen sich die Daten zusammenfassen und auswerten. Dabei sind insbesondere Zugriffsdatum und Zeit, die vollstÃ¤ndige Anfrage, Statuscode, GrÃ¶ÃŸe und der Useragent interessant. Mit Logfile-Analyse-Tools wie Screaming-Frog-Analyzer kÃ¶nnen die Datenelemente in weitere Bestandteile zerlegt werden.

Statuscode signalisiert strukturelle Schwierigkeiten

Der Statuscode ist die erste Antwort, die ein Crawler bei einem Seitenabruf erhÃ¤lt. Er teilt die Erreichbarkeit oder eine Weiterleitung einer URL mit, aber auch, wenn Ã¼bermÃ¤ÃŸig viele URL nicht mit dem regulÃ¤ren 200er-Code aufgerufen werden. Weiterleitungen mit 301-Code sind zwar Ã¼blich, belasten aber das Crawelbudget. TemporÃ¤re 302-Weiterleitungen werden oft fÃ¼r permanente Weiterleitungen benutzt, wodurch die Ranking-Signale nicht auf die Ziel-URL Ã¼bertragen werden. Zahlreiche 404-Codes fÃ¼r nicht auffindbare Inhalte kÃ¶nnen auf strukturelle Probleme der Website hinweisen. Weitere Statuscodes im 5er-Bereich deuten auf Schwierigkeiten mit der Serverarchitektur hin.

Parameter kÃ¶nnen Crawlereffizienz schwÃ¤chen

Parameter fÃ¼r die Generierung spezieller Inhalte werden vom Crawler case-sensitiv interpretiert. Das bedeutet, dass jede Abweichung wie GroÃŸ- oder Kleinschreibung neu mit den einzelnen URL kombiniert wird. Solche URL mÃ¼ssen von der Indexierung ausgeschlossen werden, da sie Duplicate Content erzeugen und die Crawlereffizienz einschrÃ¤nken.

Weitere Spuren des Bots verraten viel Ã¼ber die Website-Sichtbarkeit

Weitere interessante Punkte, die sich aus einer Logfile-Analyse ergeben sind die Crawlfrequenz, die Crawltiefe in den Verzeichnissen, der Aufruf irrelevanter URLs oder die Frage ob Bing und Google beim Crawlen zu unterschiedlichen Ergebnissen kommen. Auch das hÃ¤ufigere Crawlen responsiver Websites im Rahmen von Googles Mobile-First-Index ist feststellbar. Weitere Analysedaten zu Traffic oder Backlinks lassen je nach Analyseziel weitere RÃ¼ckschlÃ¼sse Ã¼ber das Crawl-Verhalten zu.

Logfile-Analyse ist nur ein Teil der SEO-Optimierung

Um Websites im Hinblick auf ihre Indexierung zu optimieren, ist neben einer Logfile-Analyse aber stets ein enger Zusammenhang mit SEO-abgestimmten Content und weiteren On- und Offpage-MaÃŸnahmen erforderlich.

Der Beitrag wurde am Montag, den 23. April 2018 um 11:51 Uhr veröffentlicht und wurde unter Suchmaschinenoptimierung abgelegt. du kannst die Kommentare zu diesen Eintrag durch den RSS 2.0 Feed verfolgen. Kommentare sind derzeit geschlossen, aber du kannst dennoch einen Trackback auf deiner Seite einrichten.

Die Kommentarfunktion ist geschlossen.

Seiten

Startseite Blog
Startseite Branchenverzeichnis

Archive
- Februar 2024
- Januar 2024
- Dezember 2023
- Oktober 2023
- September 2023
- August 2023
- Juni 2023
- April 2023
- Februar 2023
- Januar 2023
- Dezember 2022
- November 2022
- September 2022
- Juli 2022
- Mai 2022
- April 2022
- März 2022
- Januar 2022
- Dezember 2021
- November 2021
- Oktober 2021
- September 2021
- August 2021
- Juni 2021
- Mai 2021
- April 2021
- Februar 2021
- Januar 2021
- Dezember 2020
- November 2020
- September 2020
- August 2020
- Juli 2020
- Mai 2020
- April 2020
- März 2020
- Januar 2020
- November 2019
- Oktober 2019
- September 2019
- August 2019
- Juni 2019
- Mai 2019
- März 2019
- Februar 2019
- Januar 2019
- November 2018
- Oktober 2018
- September 2018
- Juli 2018
- Mai 2018
- April 2018
- Februar 2018
- Dezember 2017
- Oktober 2017
- August 2017
- Juni 2017
- März 2017
- Februar 2017
- Januar 2017
- November 2016
- Oktober 2016
- September 2016
- August 2016
- Juli 2016
- Mai 2016
- März 2016
- Februar 2016
- Dezember 2015
- November 2015
- Oktober 2015
- September 2015
- August 2015
- Juli 2015
- Juni 2015
- Mai 2015
- April 2015
- März 2015
- Februar 2015
- Januar 2015
- Dezember 2014
- November 2014
- Oktober 2014
- September 2014
- August 2014
- Juli 2014
- Juni 2014
- Mai 2014
- April 2014
- März 2014
- Februar 2014
- Januar 2014
- Dezember 2013
- Oktober 2013
- September 2013
- August 2013
- Juni 2013
- April 2013
- März 2013
- Februar 2013
- Januar 2013
- Dezember 2012
- November 2012
- September 2012
- August 2012
- Juli 2012
- Juni 2012
- November 2011
- März 2011
- Juni 2010
- März 2010
- November 2009
- September 2009
- Juli 2009
- Mai 2009
- April 2009
- Februar 2009
- Dezember 2008
- Oktober 2008
- August 2008
- Juli 2008
- April 2008
- März 2008
Kategorien
- Allgemein (39)
- Backlink Checker (15)
- Branchenbuch (20)
- Branchenverzeichnis (14)
- Firmenportale (12)
- Industriefirmen (12)
- Online-Marketing (31)
- Suchmaschinenoptimierung (98)
- Webkatalog (12)
- Webverzeichnis (12)

Kalender
März 2025

M D M D F S S

« Feb

1 2

3 4 5 6 7 8 9

10 11 12 13 14 15 16

17 18 19 20 21 22 23

24 25 26 27 28 29 30

31

März 2025
M	D	M	D	F	S	S
« Feb
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Branchenbuch

Logfile-Analysen: Was tun Crawler auf der Website?

Ueber uns

Seiten

Archive

Kategorien

Kalender