Hallo Ihr Lieben.
Ich möchte mich einfach hier mal beteiligen, obwohl der Beitrag ja nicht ganz neu ist.
Aber ich kenne es von eigenen Forensuchen, daß ich mich ärgere, wenn man einen Beitrag durcharbeitet und es am Ende keine Lösungsansätze gibt denen man weiter Folgen kann.
Aber zum Thema:
Ich bin in den letzten zwei Wochen fast in der Klappse gelandet, weil ich beim Scrapen immer wieder das gleiche Problem hatte.
Ich liebe die Serie ein Käfig voller Helden.
Und genau bei der hatte ich das gleiche Problem wie jacky.
1-3 Staffel wurden erkannt und gescraped. Staffel 1 und 2 vollständig, Staffel 3 nur bis Episode 11.
Die Staffeln 4-6 fehlten vollständig.
Ich habe alles versucht. Verschiedene Scraper mit verschiedenen Einstellungen, Umbenennen der Ordner(Serienname) / Unterordner(Staffeln), sogar das Umbenennen der einzelnen Episoden.
Diesen habe ich dann auch den Seriennamen hinzugefügt, weil ich den verdachte hatte, das es daran liegen könnte, obwohl das ja bei den gefunden Folgen offensichtlich nicht notwendig war.
Ich habe auf der sql-datenbank sogar die notwenigen Felder von "Text" auf "Longtext" geändert, weil ich dachte vielleicht wird beim einlesen irgendwas wichtiges "abgeschnitten".
Beim durchtesten der Scraper bekam ich dann zwar unterschiedliche Ergebnisse, aber die waren noch schlechter, als die mit TVDB.
Ich habe dann nach 2 Wochen (Ja, ich habe wie ein Irrer in den verschiedensten Foren und Hilfeseiten gesucht, aber keinen Ansatz gefunden, der beim Problem half) per Zufall eine "Erleuchtung" gehabt.
Ich beschäftige mich mit Webdesign, und habe div Seiten auf Basis von Joomla. Dort musste ich eine Datei direkt auf dem Server bearbeiten.
In dieser kam stiess ich auf einen klassischen Anzeigefehler.
Die Zeichenkodierung
Programmierte Dateien (xml, php, html usw) sollten ja immer UTF-8 kodiert sein.
Ihr habt sicher schon mal auf einer Website gesehen das unsere lieben "deutschen" Buchstaben (aÄ öÖ üÜ ß) dort dann plötzlich durch kyptische Zeichenfolgen dargestellt werden.
Oder auch, das manchmal das "Leerzeichen" durch ein "%20" ersetzt werden.
Ich habe dann nochmal den Scraper mit TVDB laufen lassen und mich durch das Log-File geackert.
Und siehe da:
Mal tauchte im Log-File "Ein Käfig voller Helden" auf und in manchen Zeilen war das "ä" aus "Käfig" durch kryptische Zeichen ersetzt.
Ich habe dann einfach die Staffel aus dem Kodi entfernt und NUR den Serien-Ordner auf der Festplatte geändert in "Ein Kaefig voller Helden"
Neu ins Kodi eingefügt, gescraped und schon waren alle Staffeln und Episoden vorhanden.
Ich kann leider nicht nachvollziehen welcher Teil genau das Problem verursachte (Kodi, Scraper, SQL, oder auch der Info-Anbieter), aber irgendwo "springt" die Zeichenkodierung um.
Auch bei Serien die zuvor als Serie erkannt wurden, aber in denen weder Staffeln noch Episoden zu finden waren (Mit denen hatte ich mich bis zu dem Zeitpunkt nicht beschäftigt) wurden nach ändern von Ä Ö Ü und ß alle korrekt gescraped.
Und das, so weit ich es sehen kann, auch mir den anderen Infoanbietern wo die Serien zuvor ja gar nicht gefunden wurden
Ich kann mir vorstellen, das bei Jacky teilweise das gleiche Problem war. da ja die Serie das Wort "Bürgermeister" enthält.
Ich hoffe das meine Ausführung irgendwem hilft.
Sollte teilweise vielleicht "unwichtiges" in meinem Post stehen, sehr es mir bitte nach.
Aufgrund meines ADHS habe ich eine ungewöhnlich Denk- und Herangehensweise an Dinge und schweife manchmal ab oder definiere Dinge und Infos als wichtig, obwohl sie es vielleicht nicht sind
Schöne Ostertage für euch.