• Wissensdatenbank
  • Videos
  • Serverstatus
  • Ticketsystem
  • Wissensdatenbank
  • Videos
  • Serverstatus
  • Ticketsystem
home/Wissensdatenbank/Web Hosting/Webserver/Zugriffe/Blockierte und limitierte Crawler
Beliebte Suchbegriffe:Cloud Server einrichten, Drucker, Email Einstellungen
Zugriffe
  • Blockierte und limitierte Crawler
  • Geoblocking einrichten (Länderspezifische Zugriffssperren)
KB Categories
  • Web Hosting
    • Webserver
      • Zugriffe
  • Passwd Cloud
  • Mail Hosting
    • Mail Hosting Basics
  • Web-Hosting
    • DNS
    • Web Hosting Basics
    • DirectAdmin Hosting Panel
    • JTL-Shop
  • Kundencenter
  • Verrechnung
  • Office 365 & Exchange Email
  • Cloud Hosting
    • Managed Nextcloud
    • VOIP Telefonanlage
    • Cloud Server
      • SQL-Server
      • Cloud Browser Access
      • Drucker
      • JTL-WAWI
      • Remote Desktop
Popular Articles
  • Cloud Server einrichten (Windows)
  • Cloud Server einrichten (macOS, iOS)
  • MAC – Sonderzeichen wie das @ "at" können nicht übermittelt werden
  • UserAdmin – schwarzer Bildschirm
  • JTL-WAWI lokal nutzen (DB Hosting Einrichtung)

Blockierte und limitierte Crawler

414 views 1 27. Juni 2024

In diesem Artikel finden Sie eine Übersicht aller Web-Crawler, die wir auf unseren Webservern per Web Application Firewall (WAF) blockieren oder limitieren. Die Auswahl basiert auf einer sorgfältigen Analyse der Auswirkungen dieser Crawler auf Serverressourcen und Nutzererfahrung.

Auf Webservern kann übermäßiger Crawler-Traffic die Performance Ihrer Webseite spürbar beeinträchtigen. Durch das Limitieren oder Blockieren bestimmter Bots stellen wir sicher, dass die verfügbaren Ressourcen Ihren Besuchern zur Verfügung stehen.

📌 Sollte ein hier gelisteter Crawler für Ihre Domain wichtig sein – etwa Bingbot für die Sichtbarkeit in der Bing-Suche – können Sie die entsprechende Regel gezielt für Ihre Domain ausnehmen.

Eine ausführliche Anleitung dazu finden Sie HIER

Limitierte Crawler – 429 Too Many Requests

Folgende Crawler werden nicht vollständig blockiert, sondern bei zu hoher Anfragefrequenz mit dem HTTP-Statuscode 429 Too Many Requests ausgebremst.

Ein kontrollierter Zugriff bleibt damit weiterhin möglich.

CrawlerBeschreibungMehr Infos
BingbotWebcrawler von Microsoft. Findet, indiziert und bewertet Webseiten für die Suchmaschine Bing.bing.com
Meta-ExternalAdsDurchsucht das Web zur Verbesserung von Werbeanzeigen und anderen geschäftsbezogenen Produkten von Meta.developers.facebook.com
Meta-WebIndexerSammelt Inhalte zur Verbesserung der Meta-AI-Suchergebnisse.developers.facebook.com
Meta-ExternalAgentCrawlt das Web zum Trainieren von KI-Modellen und zur direkten Indizierung von Inhalten.developers.facebook.com
GPTBotSammelt Webinhalte für das Training der generativen KI-Grundmodelle von OpenAI.developers.openai.com
ClaudeBotCrawler von Anthropic. Sammelt Webinhalte, die für das Training der Claude-KI-Modelle verwendet werden können.support.claude.com

Blockierte Crawler – 403 Forbidden

Folgende Crawler erhalten den HTTP-Statuscode 403 Forbidden und werden grundsätzlich abgewiesen.

CrawlerBeschreibungMehr Infos
AmazonProductDiscoveryErfasst öffentlich zugängliche Produktdaten von Verkaufspartner-Webseiten zur Verwendung auf Amazon.vendorcentral.amazon.com
AmazonBotVerbessert Amazon-Produkte und -Dienstleistungen. Kann auch zum Training von Amazon-KI-Modellen verwendet werden.developer.amazon.com
BytespiderWebcrawler von ByteDance, dem Unternehmen hinter TikTok.bytedance.com
SeekportBotSuchmaschine und SEO-Dienstleister mit Sitz in Deutschland.seekport.com
PetalBotCrawler für Petal Search, Huaweis Alternative zu Google-Diensten außerhalb Chinas.aspiegel.com
Sogou web spiderCrawler der chinesischen Suchmaschine Sogou.sogou.com
VelenPublicWebCrawlerAnalysiert monatlich Millionen öffentlicher Webseiten für maschinelles Lernen.velen.io
SeznamBotCrawler des tschechischen Internetportals und Suchmaschinenanbieters Seznam.seznam.cz
netEstateBietet Webseiten-Analysen, Domain-Informationen und Marketing-Tools.website-datenbank.de
coccocbot-webCrawler des vietnamesischen Webbrowsers Cốc Cốc auf Chromium-Basis.coccoc.com
BarkrowlerSEO-Analyse-Crawler von Babbar. Untersucht Linkstrukturen und SEO-Faktoren.babbar.tech
MJ12botSpezialsuchmaschine von Majestic (UK) zur Erstellung unabhängiger Internet-Karten.mj12bot.com
timpibotCrawler von Timpi. Der erstellte Index kann zum Training großer Sprachmodelle (LLMs) verwendet werden.timpi.io

Crawler-Zugriffe auf Ihre Domain analysieren

Welche Crawler tatsächlich auf Ihre Domain zugreifen, sehen Sie im Audit-Log der WAF-Übersicht.

Eine umfassendere Auswertung aller Webserver-Zugriffe ist über GoAccess möglich. Eine Anleitung dazu finden Sie HIER

✅ Sie kennen nun die Liste der blockierten und limitierten Crawler!

Zuletzt aktualisiert: 29. April 2026
Tags:crawlerproductMJ12botMeta-WebIndexerClaudeBotdiscoverywafMeta-ExternalAgentBytespiderAmazonBotwebspiderSeekportBottiktokbotaiGPTBothuaweicrawlsearchPetalBotsoguuseragentMetaVelenPublicWebCrawlertimpibotagentchatgptSeznamBotbingbotclaudenetEstateseoAmazonProductDiscoverycoccocbot-webUseramazonBarkrowlermeta-externalads

Was this helpful?

1 Yes  No

Didn't find your answer? Contact Us

Geoblocking einrichten (Länderspezifische Zugriffssperren)  

ecomDATA Hilfe Seite

Dies ist die Hilfeseite der ecomDATA GmbH auf der Sie viele Hilfeartikel, ein Forum sowie Videos zu Cloud- und Webhosting in Verbindung mit JTL, Shopware sowie anderen ERP Systemen finden.

Support Links
  • Wissensdatenbank
  • Videos
  • ecomDATA Kundencenter
Informationen
  • AGB
  • Datenschutzerklärung
  • Impressum
  • ecomDATA Blog
  • Cookie-Einstellungen

Wir sind Technologie und Service Partner gängiger ERP sowie Shop Systeme.

Beliebte Suchbegriffe:Cloud Server einrichten, Drucker, Email Einstellungen