{"id":9375,"date":"2025-04-25T10:36:25","date_gmt":"2025-04-25T08:36:25","guid":{"rendered":"https:\/\/loehn-digital.com\/glossary\/robotstxt-file\/"},"modified":"2025-04-25T10:36:25","modified_gmt":"2025-04-25T08:36:25","slug":"robotstxt-file","status":"publish","type":"glossary","link":"https:\/\/loehn-digital.com\/en\/glossary\/robotstxt-file\/","title":{"rendered":"Robots.txt File"},"content":{"rendered":"<p>Die <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/robots-txt\">robots.txt<\/a><\/code>-Datei ist eine Textdatei, die im Root-Verzeichnis einer Website gespeichert wird und eine wichtige Rolle im Bereich des <a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/web-development\">Web-Developments<\/a> und <a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/online-marketing\">Online-Marketing<\/a> spielt. Sie dient dazu, mit sogenannten <a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/web-crawler\">Web-Crawlern<\/a>, also automatisierten Programmen wie <a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/suchmaschinen-bots\">Suchmaschinen-Bots<\/a>, zu kommunizieren. \u00dcber diese Datei k\u00f6nnen Website-Betreiber festlegen, welche Bereiche ihrer Seite von diesen Bots durchsucht werden d\u00fcrfen und welche nicht.<\/p>\n<p>Die <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/robots-txt\">robots.txt<\/a><\/code>-Datei folgt einem spezifischen Format, das von den meisten Crawlern verstanden wird. In ihr werden Anweisungen in Form von Direktiven wie <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/user-agent\">User-agent<\/a><\/code>, <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/allow\">Allow<\/a><\/code> und <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/disallow\">Disallow<\/a><\/code> verwendet. Der <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/user-agent\">User-agent<\/a><\/code> definiert, welche Crawler oder Bots die Anweisungen beachten sollen. Mit <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/allow\">Allow<\/a><\/code> wird angegeben, welche Pfade oder Dateien zug\u00e4nglich sind, w\u00e4hrend <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/disallow\">Disallow<\/a><\/code> bestimmte Bereiche sperren kann. Beispielsweise kann eine Website mit folgendem Eintrag in der <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/robots-txt\">robots.txt<\/a><\/code>-Datei verhindern, dass bestimmte Verzeichnisse von Suchmaschinen indiziert werden:<\/p>\n<pre><code>User-agent: *\nDisallow: \/verwaltung\/\nAllow: \/verwaltung\/login\n<\/code><\/pre>\n<p>Diese Datei ist insbesondere im Rahmen der <a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/suchmaschinenoptimierung\">Suchmaschinenoptimierung<\/a> (<a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/seo\">SEO<\/a>) relevant, da sie hilft, die Indizierung der Website zu steuern. Indem bestimmte Bereiche von der Durchsuchung ausgeschlossen werden, k\u00f6nnen beispielsweise interne Tools oder Login-Bereiche vor dem Zugriff durch Suchmaschinen gesch\u00fctzt werden. Gleichzeitig kann dies dazu beitragen, Doppelinhalte zu vermeiden und die Ladezeit der Website zu optimieren, indem unn\u00f6tige Anfragen von Bots reduziert werden.<\/p>\n<p>Es ist jedoch wichtig zu beachten, dass die <code><a class=\"glossary-link--invalid\" href=\"https:\/\/loehn-digital.com\/glossary\/robots-txt\">robots.txt<\/a><\/code>-Datei keine gesicherte Sicherheitsma\u00dfnahme darstellt. Sie ist lediglich ein Standard, der von den meisten Bots beachtet wird, aber nicht zwangsl\u00e4ufig eingehalten werden muss. Trotzdem ist sie ein unverzichtbares Werkzeug f\u00fcr Website-Betreiber, um die Vorschriften f\u00fcr die automatisierte Durchsuchung ihrer Inhalte festzulegen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die robots.txt-Datei ist eine Textdatei, die im Root-Verzeichnis einer Website gespeichert wird und eine wichtige Rolle im Bereich des Web-Developments und Online-Marketing spielt. Sie dient dazu, mit sogenannten Web-Crawlern, also automatisierten Programmen wie Suchmaschinen-Bots, zu kommunizieren. \u00dcber diese Datei k\u00f6nnen Website-Betreiber festlegen, welche Bereiche ihrer Seite von diesen Bots durchsucht werden d\u00fcrfen und welche nicht. [&hellip;]<\/p>\n","protected":false},"featured_media":0,"template":"Glossary Entry","class_list":["post-9375","glossary","type-glossary","status-publish","hentry"],"acf":[],"_links":{"self":[{"href":"https:\/\/loehn-digital.com\/en\/wp-json\/wp\/v2\/glossary\/9375","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/loehn-digital.com\/en\/wp-json\/wp\/v2\/glossary"}],"about":[{"href":"https:\/\/loehn-digital.com\/en\/wp-json\/wp\/v2\/types\/glossary"}],"wp:attachment":[{"href":"https:\/\/loehn-digital.com\/en\/wp-json\/wp\/v2\/media?parent=9375"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}