Welchen Scraper bei Serien??

  • Hallo an alle,
    ich hab in meinen NVidia Shielt per USB den Speicher erweitert und nun musste ich alles neu einstellen und einlesen.
    Dabei dachte ich mir, probier doch mal einen anderen SCRAPER aus.

    Ich nutze nun den "The TVDB v4"
    Es werden von 480 Serien ca 10-15 nicht eingelesen.
    https://www.themoviedb.org/tv/82596-emily…ris?language=de (Die hier wird z.b. nicht gefunden)

    Wäre der "The TVDB (new)" besser gewesen?

    Früher nutzte ich "The Movie Database", aber ich dachte, evtl ist ein anderer besser?

    Wie steht ihr dazu?


    Wo finde ich eien Aufstellung, welcher welche Vorzüge bringt?

    Gruß Strahlemann

  • dabei zB TVDB V4:

    Ich nutze ein Notebook (noch Kodi 19.5) zum testen.
    Erst versuche ich V4, wenn das nicht geht new.
    Vorher schaue ich nach wie die Serie bei TVDB eingetragen ist.

  • Grundlegend nutze ich fürs Scrapen eine ganz separate Kodi Instanz. Das ist auch meist ein jungfräuliches Kodi ohne irgendwelche Datenbanken. Ist aber auch etwas aufwendig.

    Wenn ich eine Serie habe, die ich Scrapen möchte, dann

    • schaue ich, welche Seite mir die besseren Ergebnisse liefert
    • stelle die temporäre Quelle auf den Scraper ein
    • lasse Kodi seine Arbeit machen
    • exportiere die Daten in NFO Dateien (inkl. Fanart, Cover, Banner, Schauspiel-Thumbs etc. Halt alles, was an Bilder benötigt wird)

    Dann bereinige ich das Kodi, welches ich zum Scrapen benutzt habe wieder und lese dann zur Kontrolle die gleichen Daten auf dem gleichen Kodi nochmal via "local information only" ein und schaue mir die Ergebnisse an. Ist das alles zu meiner Zufriedenheit, dann schiebe ich die Daten auf mein NAS und lasse dann meine echten Kodi Clients die Daten wieder per "local information only" einlesen.

    Kommen neue Staffeln zu einer Serie hinzu, kann es natürlich sein, dass sich die tvshow.nfo ändert. Somit muss ich, wenn ich neue Staffeln hinzufüge, immer einmal die ganze Serie mit allen seinen Staffeln Scrapen und dann die geänderten Dateien austauschen. Dafür nutze ich dann immer "Dummy"-Dateien um die Existenz echter Dateien zu simulieren. Das ist 1-2 Befehlen erledigt.

    Ich kann daher nicht sagen, welcher besser oder schlechter ist. Ich schaue halt vorher nach und entscheide individuell.

  • Moin, ich nutze auch The TVDB v4, was ja noch det aktuellste ist. Funzt auch super, aber er zieht keine Ratings der Episoden, wie das vorher andere gemacht haben :( Einstellungsmöglichkeiten habe ich dazu auch nicht gefunden. Gibt es das einfach nicht mehr? :(

  • Ich nutze die internen Scraper von KODI nicht, ist mir zu unflexibel, fehlerträchtig und ungenau.

    Statt dessen lasse ich den Tini Media Manager die Film- und Serien-Verzeichnisse befüllen.

    KODI holt sich diese dann über die Einstellung 'nur lokale Daten'.

  • Ich nutze auch TVDB V4 und in der Vergangenheit wurden viele Serien nicht eingelesen. Dabei fiel mir auf, dass das dann der Fall war, wenn es mehrere Serien mit dem selben Namen gibt. Ich habe daraufhin mir die Mühe gemacht und für alle Serien die passende Jahreszahl hinter dem Namen in Klammern hinzugefügt. Das passende Erscheinungsjahr habe ich auf der TVDB Seite ermittelt. Seit dem ich das gemacht habe gibt es a. keine Fehlermeldungen vom Scrapper mehr und b. werden alle meine Serien erkannt.

  • Das schafft nichtmal die beste KI.

    Mein Media-Buddy kann das ohne "KI", denn dafür wird "NI" genutzt. (NI = Natürliche Intelligenz). Ich muss ihm nur irgendwie die TVDB-ID mitteilen. Geht z.B. dadurch, einfach eine Datei mit dem Namen TVDB-1234567.txt ins Serien- Verzeichnis zu legen (wobei 1234567 die TVDB-ID der Serie sein sollte). Geht das nicht, weil es die Serie auf TVDB gar nicht gibt, kann ich dasselbe auch mit TMDB machen, dann halt TMDB-7654321.txt. Gibt es die Serie weder auf TVBD noch auf TMDB (kommt tatsächlich vor), auch damit kann MediaBuddy umgehen. Für so einen Fall kann man ein Set von "leeren" .nfo erzeugen lassen, die man dann selbst mit Inhalt füllen kann/muss (z.B. aus fernsehserien.de oder der Website des Senders heraus kopiert). Man gibt dann später am besten eine Fake- ID für TVDB an, irgendeine negative Zahl sollte funktionieren. Somit kommen dann auch alle zusätzliche Addons in Kodi mit dieser Serie ganz normal klar.

    Hier ist z.B. so eine Serie ohne TVDB/TMDB in meinem Kodi:

    Die Serie ist ein Projekt der Fernseh- Akademie des NDR und wurde von Studenten produziert. Sie wurde dann im NDR Fernsehen ausgestrahlt.

    Ich habe übrigens schon deutlich schlechtere Serien gesehen. Dazu gab es weder auf TVDB noch TMDB oder auf fernsehserien.de irgendwelche Infos. Aber der NDR hatte natürlich auf seiner Webseite etwas darüber stehen. Das ist nun in meinem Kodi auch vorhanden. Mir ist kein anderes Programm bekannt, mit dem das (so einfach) gehen würde. Ich weiß ja schon, warum ich mir die extrem viele Arbeit beim Schreiben von Media-Buddy antue/angetan habe.

    Ist eine Serie schon lokal vorhanden, wird die tvshow.nfo ausgewertet. Die TVDB-xxxxxx.txt ist nur bei im eigenen Bestand neuen Serien notwendig. Seitdem wir vor vielen Jahren diese Option eingebaut haben, hatte ich noch nie eine Serie, die falsch oder gar nicht gescrappt wurde, sofern sie Online überhaupt existiert.

    Die Sache mit der Jahreszahl hilft oft, aber nicht immer. Denn es kommt tatsächlich auch vor, das es zwei Filme oder Serien mit demselben Titel gibt, die im selben Jahr erschienen sind. Das einzige, das wirklich eindeutig ist, ist die jeweilige ID (TVDB/TMDB/IMDB).

    -------------------------------------
    Danke fürs lesen, Claus

  • Welche?

    Was mir gleich aus dem Stand einfällt ist Thor 2011. Da habe ich nämlich beide Filme, einmal den "großen" Marvel Film und einmal den recht unbekannten TV Film. War nicht ganz einfach mit dem Ordner, der bei mir eigentlich beides mal "Thor (2011)" heißen müsste, wenn ich mein Namensschema durchziehen würde. Bei Serien gab es das aber so weit ich weiß vor vielen Jahren auch schon mal, zumindest in bestimmten Sprachen (wie Deutsch). Da müsste ich aber tiefer nachforschen. Auf jeden Fall ist es nicht ausgeschlossen, speziell bei eher "nichtssagenden" Titeln und den unzähligen Streamingdiensten, die permanent neuen Krempel auf den Markt schmeißen. Als ob die sich jedes Mal bei der Namensgebung absprechen würden.

    Außerdem kann man (konnte man bisher auf jeden Fall) bei TMDB das Jahr gar nicht als Suchparameter an die API übergeben. Da würde das Jahr dann sowieso nichts bringen. Ob sich da etwas in den letzten paar Jahren geändert hat, kann ich aus dem Stand gar nicht sagen. Bei mir funktioniert halt schon sehr lange alles genau so, wie ich das möchte. Mit der ID klappt es zu 100% immer. Denn da gibt es garantiert keine "Doppelten". Bei Name plus Jahr bin ich mir da hingegen keinesfalls sicher...

    -------------------------------------
    Danke fürs lesen, Claus

  • ...weil es die Serie auf TVDB gar nicht gibt,...

    Dann lege ich die Serie auf TVDB an und kann sie anschließend auch scrapen. Vorteil: der Rest der Welt kann das dann auch nutzen ;)


    Gruß Gz

    2x Android TV-Box Amlogic t95zPlus,1x Android TV-Box Amlogic t95zPlus 6K, 2x Qnap 1x Synology NAS, LG 55" 3D-TV + 1x 40", Surround

  • Ich brauche bloß ein kleines CLI Programm, was ich automatisch auf jeweils die neuen TV Aufnahmen loslassen kann, und das mir dann erkennt, welche Serie/Episode eine Aufzeichnung ist. Also quasi minimal Erkennung von Filenamen nach Serie/Episode. Den Rest, so wie umbenennen und merken was man schon hat krieg ich selbst programmiert...

    Ich hatte so Scraper immer wieder mal neu geschrieben, erst fuer Wikipedia fuer ein paar Serien und dann für fernsehserien.de, aber natuerlich aendert sich dauern das Format, und fernsehserien.de will das ja auch nicht,die haben ihre Formattierung gerade so kompliziert gemacht, das ich da keine Lust habe, das zu machen. TheTVDB will auch das man irgendeine verkackte neue V4 API verwendet, die alte API war auch nicht so einfach. Aka: macht echt keinen Spass der Mist.

    Irgendeine Empfehlung ?

  • Dann lege ich die Serie auf TVDB an und kann sie anschließend auch scrapen.

    Sowas habe ich früher oft gemacht. Mal ganz abgesehen davon, das es mindestens ein paar Tage dauert, bis das in der API angekommen ist und ich die Daten sowieso manuell in die .nfo eintragen muss um die Videos gleich in meine Mediathek aufnehmen zu können, wird das in 80% der Fälle einfach ohne Kommentar wieder gelöscht, da es sich nicht um "Mainstream" handelt.

    Endgültig aufgehört, sowas zu machen habe ich dann, als die plötzlich meinten, Kostenpflichtig werden zu müssen. Daraufhin habe ich meinen Account gelöscht und werde nie wieder einen aufmachen. Die wollen Geld mit meiner Arbeit verdienen und ich soll dann auch noch dafür bezahlen, meine eigene Arbeit nutzen zu können. Soo blöd kann ich doch gar nicht sein. Daneben war es nahezu unmöglich, dort Fehler zu korrigieren. Speziell bei langlaufenden deutschen Serien stimmen die Staffeln und Episoden nie. Aber korrigieren darf man das nicht, selbst wenn man das durch Verweise auf die Webseiten der Sender belegen kann. Anfänglich waren die bei TMDB nicht so übel wie bei TVDB drauf. Aber auch dort ist die "Wir sind die Götter" Mentalität immer heftiger durch gekommen. Auch ganz schlimm, TheAudioDB. Ebenfalls erst mal alle Leute ködern um den Datenbestand aufzustocken um dann alles hinter einer Paywall verschwinden zu lassen. Also nein Danke, nicht mit mir. Bei sowas mache ich garantiert nicht mehr mit, niemals.

    Wenn ich sowieso alles nachträglich noch korrigieren muss, dann kann ich es auch gleich ganz lokal machen. Mehr als eine "Bastelgrundlage" sind die Online Daten sowieso nicht mehr. Das einzige, das ich wirklich brauche ist die ID, damit sowas wie "WatchedList" problemlos funktioniert. Und die kann zur Not auch Fake sein. Für alles andere brauche ich die Online Datenbanken sowieso nicht unbedingt. Klar, es ist komfortabler, sofern die Daten tatsächlich mal stimmen. Aber bei dem, was ich so sammele, ist das nur selten überhaupt mal und praktisch nie vollständig der Fall. Da muss ich doch sowieso auf fernsehserien.de (passt auch immer seltener) oder auf den Mediathek Seiten nachschauen und die relevanten Daten per copy&paste in die .nfo einfügen.

    -------------------------------------
    Danke fürs lesen, Claus

  • Endgültig aufgehört, sowas zu machen habe ich dann, als die plötzlich meinten, Kostenpflichtig werden zu müssen.

    Von welchen Seiten sprichst du ??

    Abgesehen von IMDB in der PRO-Version ist alles kostenfrei.

    Gruß Gz

    2x Android TV-Box Amlogic t95zPlus,1x Android TV-Box Amlogic t95zPlus 6K, 2x Qnap 1x Synology NAS, LG 55" 3D-TV + 1x 40", Surround

  • Abgesehen von IMDB in der PRO-Version ist alles kostenfrei.

    Bei TMDB stimmt das, noch. Betonung auf Noch. Sonst ist nur die jeweilige Webseite frei (damit man auch weiterhin brav Daten einpflegen kann), aber nicht die API. Doch genau die API ist das, was wir in unseren Programmen nutzen müssen, was jeder Scrapper nutzt, egal ob Kodi selbst, Media-Buddy, tMM, Ember oder was auch immer und grade nicht die Webseite. Und für die API muss man inzwischen fast überall heftig blechen. Ich soll also bei TVDB oder TADB dafür bezahlen, die von mir eigegebenen Daten in dem von mir geschriebenen Programm nutzen zu dürfen. Pervers, oder? Es hat Jahre gedauert, bis ich TVDB wieder zurück in Media-Buddy bringen konnte, da die dort ein wenig eingelenkt sind und zumindest für private OpenSource Projekte auf Antrag einen kostenlosen API Key bereit stellen, sofern sie denn wollen (ich habe ca 4 Jahre nach der Einführung der kostenpflichtigen API endlich einen Gratis- Key bekommen).

    Bei TADB muss man sogar prinzipiell immer blechen, es sei denn, man will nur die Band Coldplay grabben. Das bekommt man auch mit dem kostenlosen Test- Key hin. Aber für nur einen einzigen Interpreten brauche ich keinen Scrapper zu schreiben. Und in beide Online- Datenbanken habe ich damals unzählige Stunden an Arbeit rein gesteckt, nur damit die sich daran eine goldene Nase verdienen und ich ausgesperrt werde. Das ich darauf aber mal so gar keinen Bock mehr habe, dürfte ja wohl nachvollziehbar sein, oder?

    Ein Null- Kommerz Programm kann doch nicht Hunderte von € pro Jahr aufbringen, nur um kostenlos diese Daten für andere aufzubereiten. Die einzige Alternative wäre die Kosten auf die Nutzer, also auf euch abzuwälzen, sprich das Programm zu kommerzialisieren. Und dann ist es fraglich, ob man überhaupt genug Nutzer findet, die dafür bereit sind zu bezahlen. Das Risiko wäre mir zu hoch. Dann verzichte ich lieber auf solche geldgierigen Dienste und biete mein Programm auch weiterhin kostenlos an.

    -------------------------------------
    Danke fürs lesen, Claus

  • Bei TMDB stimmt das, noch. Betonung auf Noch. Sonst ist nur die jeweilige Webseite frei (damit man auch weiterhin brav Daten einpflegen kann), aber nicht die API. Doch genau die API ist das, was wir in unseren Programmen nutzen müssen,

    Hallo?
    Bei meinem Post ging es um das einpflegen bzw. erstellen neuer Serien/Staffeln/Episoden. Das hat nix, aber auch gar nix mit der API zu tun. ;)

    Deine Romane dazu sind also völlig am Thema, und am Thema insgesammt, vorbei.

    Nochmal: die Daten bitte in die Databases einfügen, dann haben alle was davon. Denn davon lebt die Community: Danke

    Gruß Gz

    2x Android TV-Box Amlogic t95zPlus,1x Android TV-Box Amlogic t95zPlus 6K, 2x Qnap 1x Synology NAS, LG 55" 3D-TV + 1x 40", Surround

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!