	{"id":96434,"date":"2023-01-14T09:34:11","date_gmt":"2023-01-14T09:34:11","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=cases&#038;p=96434"},"modified":"2024-09-20T17:39:26","modified_gmt":"2024-09-20T16:39:26","slug":"otto-s-cloud-crawling-setup","status":"publish","type":"cases","link":"https:\/\/www.artefact.com\/de\/cases\/otto-s-cloud-crawling-setup\/","title":{"rendered":"<span class=\"highlight\">OTTO <\/span>\u2018den ma\u00dfgeschneiderten Crawler zur Optimierung der SEO-Werte"},"content":{"rendered":"<article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling case-content\" style=\"--link_color: var(--awb-color6);--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-padding-right-medium:5%;--awb-padding-left-medium:5%;--awb-background-color:var(--awb-color1);--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-space-between fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column text-image-block-video-content1\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><p>OTTO ist eines der gr\u00f6\u00dften Online-Kaufh\u00e4user in den Niederlanden. Mit einem breiten Sortiment von mehr als 160.000 Produkten, darunter women-, Herren- und Kindermode, Multimedia, Heim-, Haushalts- und Gartenger\u00e4te, finden Kunden bei OTTO fast alles f\u00fcr das Haus und den Haushalt. <a href=\"https:\/\/www.otto.nl\/\" target=\"_blank\" rel=\"noopener\">OTTO<\/a>.<\/p>\n<p>Aufgrund dieses gro\u00dfen Produktsortiments, das immer auf dem neuesten Stand sein muss, ist es von gro\u00dfer Bedeutung, dass alle data gut strukturiert sind und dass alle Prozesse reibungslos ablaufen. Die Informationen, die OTTO auf seiner Website bereitstellt, \u00e4ndern sich st\u00e4ndig, was sich auf die organischen Suchergebnisse der Suchmaschinen auswirkt. \u00c4nderungen an der Website k\u00f6nnen daher gro\u00dfe, aber auch katastrophale Folgen f\u00fcr die SEO-Ergebnisse haben. Um sich einen Wettbewerbsvorteil zu verschaffen, ist es wichtig, dass genaue Produktbeschreibungen, Lagerbest\u00e4nde, Preise usw. gut \u00fcberwacht werden, damit OTTO bei organischen Suchbegriffen weiterhin gut abschneidet.<\/p>\n<p>Um den Zustand der Website im Auge zu behalten und SEO-bezogene Probleme fr\u00fchzeitig zu erkennen, wollte OTTO ein internes \u00dcberwachungssystem, das die Informationen \u00fcber einen l\u00e4ngeren Zeitraum verfolgt. Mit dieser Frage wandte man sich an Artefact.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-top:40px;--awb-margin-bottom:20px;--awb-margin-bottom-small:8px;--awb-font-size:var(--awb-custom_typography_4-font-size);\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:var(--awb-custom_typography_4-font-family);font-weight:var(--awb-custom_typography_4-font-weight);font-style:var(--awb-custom_typography_4-font-style);margin:0;letter-spacing:var(--awb-custom_typography_4-letter-spacing);text-transform:var(--awb-custom_typography_4-text-transform);font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\">Die Voraussetzungen f\u00fcr unser \u00dcberwachungssystem<\/h2><\/div><div class=\"fusion-text fusion-text-2\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><p>Nachdem wir die Herausforderung mit OTTO besprochen hatten, kamen wir auf mehrere Anforderungen an das \u00dcberwachungssystem. Es muss sein:<\/p>\n<ul>\n<li>Sie sind in der Lage, w\u00f6chentlich aktuelle data abzurufen;<\/li>\n<li>Verf\u00fcgbar auf einer automatisierten Ebene;<\/li>\n<li>Kann gro\u00dfe Mengen von data verarbeiten;<\/li>\n<li>GDPR-konforme und sichere Speicherung von data;<\/li>\n<li>Geben Sie die volle Kontrolle dar\u00fcber, wer, was, wo und wann das data abgerufen wird und wie der Zugriff auf das data erfolgt;<\/li>\n<li>Ein \u00fcbersichtliches Dashboard, das sowohl f\u00fcr SEO-Spezialisten als auch f\u00fcr Laien sofortige \u00c4nderungen anzeigt;<\/li>\n<li>Sie k\u00f6nnen Push-Benachrichtigungen anzeigen, wenn ein gro\u00dfer Fehler entdeckt wird.<\/li>\n<\/ul>\n<p>Wenn das \u00dcberwachungssystem all diese Anforderungen erf\u00fcllen w\u00fcrde, w\u00e4re es schlie\u00dflich in der Lage, den Prozentsatz der Website-Fehler f\u00fcr SEO-Bewertungen von 10% auf 5% zu reduzieren.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-top:40px;--awb-margin-bottom:20px;--awb-margin-bottom-small:8px;--awb-font-size:var(--awb-custom_typography_4-font-size);\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:var(--awb-custom_typography_4-font-family);font-weight:var(--awb-custom_typography_4-font-weight);font-style:var(--awb-custom_typography_4-font-style);margin:0;letter-spacing:var(--awb-custom_typography_4-letter-spacing);text-transform:var(--awb-custom_typography_4-text-transform);font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\">Die L\u00f6sung: ein eigener Crawler<\/h2><\/div><div class=\"fusion-text fusion-text-3\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><p>Wir fanden schnell heraus, dass ein Crawler die beste L\u00f6sung f\u00fcr unseren Bedarf ist. Ein Crawler ist ein Algorithmus, der automatisierte Studien (d.h. Crawls) \u00fcber den technischen Zustand der Website durchf\u00fchrt. Die Ergebnisse der Crawls werden in einem \u00fcbersichtlichen Dashboard dargestellt, das als strategisches Instrument zur \u00dcberwachung und Verbesserung der technischen Aspekte sowie der Inhalte der Website genutzt werden kann. Obwohl OTTO bereits einen Crawler einsetzte, erf\u00fcllte dieser bestehende Crawler nicht alle unsere Anforderungen. Daher beschlossen wir, einen eigenen Crawler zu entwickeln, der OTTO vollst\u00e4ndig geh\u00f6rt und der uns aktuelle Erkenntnisse liefert, um die SEO-Werte zu verbessern. Dieser Crawler musste kartieren, wo auf der Website Fehler (4XX und 5XX Statuscodes) auftraten, um diese schnell aufzusp\u00fcren und zu bearbeiten.<\/p>\n<p>Es ist wichtig, dass Sie schnell \u00fcber Fehler informiert werden, um die Crawlability der Website zu optimieren. W\u00f6chentliche automatisierte Audits durch den Crawler helfen dabei, Fehler wie tote Links und fehlende Seiten zu identifizieren und zu korrigieren, wobei die Automatisierung der wichtigste Teil ist. Automatisierte Tools und Skripte erm\u00f6glichen eine schnelle Probleml\u00f6sung, die manuell nicht zu realisieren ist. Au\u00dferdem spart OTTO dadurch Zeit und Kosten.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-top:40px;--awb-margin-bottom:20px;--awb-margin-bottom-small:8px;--awb-font-size:var(--awb-custom_typography_4-font-size);\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:var(--awb-custom_typography_4-font-family);font-weight:var(--awb-custom_typography_4-font-weight);font-style:var(--awb-custom_typography_4-font-style);margin:0;letter-spacing:var(--awb-custom_typography_4-letter-spacing);text-transform:var(--awb-custom_typography_4-text-transform);font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\">Schritte zur Umsetzung<\/h2><\/div><div class=\"fusion-text fusion-text-4\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><p>Wir haben mehrere Schritte unternommen, um den Crawler zu erstellen, von denen einige sehr n\u00fctzlich waren, andere wiederum nicht so sehr. Wir werden die wichtigsten davon hervorheben:<\/p>\n<\/div><ul style=\"--awb-iconcolor:var(--awb-color2);--awb-textcolor:var(--awb-color5);--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons client-cases\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Der erste Schritt war die Erlangung der Zertifizierung \u2018Google Cloud Certified Cloud Digital Leader\u2019 von Google f\u00fcr das gesamte SEO-Team.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Nachdem wir die Zertifizierung erhalten hatten, tauchten wir in die Google Cloud ein und testeten verschiedene Serverkonfigurationen (viel Speicher + weniger RAM oder weniger Speicher + viel RAM) und Schnittstellen (GUI, Headless), um die Effizienz zu optimieren.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Als der erste Proof-of-Work abgeschlossen war, begannen wir mit dem Testen der BigQuery-Verbindung zur Erstellung des Dashboards in LookerStudio. Der erste Test war erfolgreich, musste aber in Bezug auf die Skalierbarkeit noch verbessert werden. Gemeinsam mit unseren Teams Data Engineering und Data Analytics erstellten wir ein Proof-of-Concept, um die Machbarkeit der Entwicklung eines eigenen Crawlers zu pr\u00fcfen. Die wichtigsten Faktoren waren dabei die Skalierbarkeit und die Pr\u00e4zision des data.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Als n\u00e4chstes f\u00fcgten wir dem data einen Kategoriefilter und zus\u00e4tzliche Felder hinzu, um \u00dcbersichten zu erstellen, die sowohl f\u00fcr SEO-Spezialisten als auch f\u00fcr Laien leicht zu verstehen und herunterzuladen sind.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Schlie\u00dflich haben wir ein \u00fcbersichtliches Dashboard auf der Grundlage der Screaming Frog-Vorlage erstellt.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-top:40px;--awb-margin-bottom:20px;--awb-margin-bottom-small:8px;--awb-font-size:var(--awb-custom_typography_4-font-size);\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:var(--awb-custom_typography_4-font-family);font-weight:var(--awb-custom_typography_4-font-weight);font-style:var(--awb-custom_typography_4-font-style);margin:0;letter-spacing:var(--awb-custom_typography_4-letter-spacing);text-transform:var(--awb-custom_typography_4-text-transform);font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\">Verbesserung der CTR und der Website-Fehler in Minutenschnelle<\/h2><\/div><div class=\"fusion-text fusion-text-5\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><p>Der Crawler wurde soeben auf der Website von OTTO gestartet und beginnt, data zu sammeln. Obwohl der Crawler noch nicht lange in Betrieb ist, k\u00f6nnen wir Ihnen schon einige vorl\u00e4ufige Ergebnisse mitteilen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-top:40px;--awb-margin-bottom:20px;--awb-margin-bottom-small:8px;--awb-font-size:var(--awb-custom_typography_4-font-size);\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:var(--awb-custom_typography_4-font-family);font-weight:var(--awb-custom_typography_4-font-weight);font-style:var(--awb-custom_typography_4-font-style);margin:0;letter-spacing:var(--awb-custom_typography_4-letter-spacing);text-transform:var(--awb-custom_typography_4-text-transform);font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\">Erzielte Ergebnisse<\/h3><\/div><div class=\"fusion-text fusion-text-6\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><ul>\n<li>Erkennung von ca. 130.000 falschen\/fehlenden\/zu kurzen oder langen Meta-Titeln und -Beschreibungen, was zu einer verbesserten CTR f\u00fchrt, nachdem diese Probleme behoben wurden;<\/li>\n<li>50% verringert sich auf 4XX Seiten;<\/li>\n<li>Der Prozentsatz der 404-URLs ist von 6,6% auf 3% gesunken;<\/li>\n<li>Die Anzahl der nicht indizierten URLs mit einer Tiefe von \u22656 wurde von 6200 auf 0 reduziert.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-text-color:var(--awb-color6);--awb-margin-top:40px;--awb-margin-bottom:20px;--awb-margin-bottom-small:8px;--awb-font-size:var(--awb-custom_typography_4-font-size);\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"font-family:var(--awb-custom_typography_4-font-family);font-weight:var(--awb-custom_typography_4-font-weight);font-style:var(--awb-custom_typography_4-font-style);margin:0;letter-spacing:var(--awb-custom_typography_4-letter-spacing);text-transform:var(--awb-custom_typography_4-text-transform);font-size:1em;--fontSize:14;--minFontSize:14;line-height:1.6;\">Erwartete Ergebnisse<\/h3><\/div><div class=\"fusion-text fusion-text-7\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><ul>\n<li>Verbesserungen in der Sitemap;<\/li>\n<li>Verringern Sie die Anzahl konkurrierender URLs mit Hilfe von kanonischen Tags und internen Links;<\/li>\n<li>Verringern Sie die Anzahl der indizierten URLs, die kanonisiert werden;<\/li>\n<li>Verbessern Sie die interne Linkstruktur;<\/li>\n<li>Optimieren Sie die L\u00e4nge der Kopfzeilen und vermeiden Sie doppelte\/mehrere Kopfzeilen auf derselben Seite;<\/li>\n<li>Optimierungen des Pagespeed;<\/li>\n<li>Optimierungen f\u00fcr verwaiste Seiten.<\/li>\n<\/ul>\n<\/div><div class=\"fusion-text fusion-text-8\" style=\"--awb-font-size:var(--awb-typography1-font-size);--awb-line-height:var(--awb-typography3-line-height);--awb-text-color:var(--awb-color5);\"><p>Die Voraussetzungen, die f\u00fcr den Crawler festgelegt wurden, sind alle erf\u00fcllt. Die gr\u00f6\u00dften Vorteile dieses Crawlers sind, dass er vollst\u00e4ndig im Besitz von OTTO ist und dass die data nicht mehr manuell in Stapeln abgerufen werden m\u00fcssen, was eine Menge Zeit spart. Dar\u00fcber hinaus haben wir die volle Kontrolle dar\u00fcber, was der Crawler tut, wer Zugriff darauf hat und wo die data GDPR-konform gespeichert wird.<\/p>\n<\/div><\/div><\/div><\/div><\/article>","protected":false},"excerpt":{"rendered":"","protected":false},"featured_media":96435,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"categories":[91],"class_list":["post-96434","cases","type-cases","status-publish","has-post-thumbnail","hentry","category-retail"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/cases\/96434","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/cases"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/cases"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/96435"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=96434"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/categories?post=96434"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}