Wie schon auf meinen Seiten "Rechtliches" und "Zugriffsstatistik" erwähnt, werden sämtliche Zugriffe auf meine Webseiten aufgezeichnet. Die dabei gewonnenen Daten dienen ausschließlich zur Erstellung von Statistiken und zur Optimierung der Seiten.
Bei der gelegentlichen Durchsicht der aufgezeichneten Zugiffe fiel mir auf, daß meine Seiten von einigen IP-Adressen in einer recht "ungewöhnlichen" Weise abgefragt wurden: Es wurden z.B. sämtliche Seiten in einer Geschwindigkeit angefordert, in der sie kein menschlicher Nutzer hätte lesen können. Mein erster Verdacht fiel auf Programme von Suchmaschinen (Bots), die aus dem gelesenen Inhalt Suchbegriffe extrahieren. Ein solches Verhalten ist ja prinzipiell erwünscht, denn welchen Nutzen hat denn eine Webseite, die niemand findet? Nur aus welchem Grund rufen diese Programme u.a. auch Binärdateien ab, die keinerlei verwertbare/indizierbare Texte enthalten (und schon anhand der Dateiextension als "nicht indizierbar" erkennbar sind)?
Um die unnötigen (und auch nicht erwünschten) Zugriffe auf bestimmte Dateien zu unterbinden, fügte ich entsprechende Metatags in meine Seiten ein. Und tatsächlich reagierten einige der als Bots erkennbaren Programme darauf, und hielten sich an die eingefügten Anweisungen. Aber viele andere (insbesondere von "mietbaren Servern"/Webhosts ausgehende) Programme ignorierten diese "freundlichen Hinweise". Also habe ich mein "Hausrecht" auf meinen Seiten wahrgenommen, und verbot den Zugriff von bestimmten Adressen auf meine Seiten (→ "Hier gelten meine Spielregeln: Wer sich nicht benehmen kann, und entsprechende Anweisungen ignoriert, fliegt raus"). Die Liste der abzuweisenden IP-Adressen habe ich im Laufe der Zeit (je nach gefundenen "ungewöhnlichen" Zugriffen) erweitert.
Was die diversen (dubiosen?) "Services" mit meinen Daten anstellen wollen, ist mir unklar. Aber ich finde es schon etwas verwunderlich, daß nun (alle paar Tage) Zugriffe auf einzelne Dateien (von den nun gesperrten Adressen) versucht werden. Außerdem wundert es mich etwas, daß nun gelegentlich Zugriffe auf Dateien meiner Seiten versucht werden, die schon seit Jahren nicht mehr existieren → Eine HTML-Antwort 403 ("forbidden") oder 404 ("not found") scheinen diese Programme ebenfalls zu ignorieren. Mal sehen, was ich über diese seltsamen Services noch so alles herausbekomme ...
Hier mal ein paar Statistiken über die abgewiesenen Zugriffe:
2019
Abgewiesene Zugriffe insgesamt: 10115
Wo kommen die Zugriffe her?
39.3% | broadband.kyivstar.net |
30.4% | ip-54-36-148.eu |
14.0% | ip-54-36-149.eu |
11.6% | ahrefs.com |
2.3% | static.clients.your-server.de |
1.8% | startdedicated.de |
Oops... "kyivstar (Київстар)" ist ein ukrainischer Mobilfunk- und Internet-Provider. Das muss ich mir wohl doch noch einmal genauer ansehen → Ich will ja nicht sämtliche Mobil-Zugriffe eines Landes ausschließen ... Die restlichen sind irgendwelche "seltsame" Miet-Services, die bleiben gesperrt.
Welche Seiten werden am häufigsten aufgerufen?
39.7% | "/c3/" →Ergibt auch ohne Sperrung "403 forbidden" |
1.5% | |
1.0% | |
0.6% | |
0.5% | |
0.5% | |
0.5% | |
0.5% | |
0.5% | |
0.5% |
Ansonsten sind die Zugriffe relativ gleichmäßig auf alle Dateien (sowohl HTML, als auch Grafiken und Binärdaten) verteilt.
Auf welchem Wege erfolgen die Zugriffe?
Immerhin enthalten 39.6% der Zugriffe eine Referenzinformation, die normalerweise ein Browser bei der Aktivierung eines Links auf einer Webseite mit übermittelt. Nur sämtliche Referenzen sind mir gänzlich unbekannt, und haben keinerlei Bezug zu den Themen meiner Seiten. Daß es Links auf meine Seiten dort gibt, halte ich für ausgeschlossen.
Die "Top Level Domains" der Referenzinformationen:
31.0% | .ru |
30.9% | .com |
6.6% | .ua |
4.1% | .net |
3.7% | .info |
2.7% | .su |
2.6% | .org |
Startseite Zugiffsstatistik Rechtliches Kontakt Darstellung