Semalt-Ratschläge zur Verwendung von Deep Learning zur Optimierung Ihres automatisierten Titel-Tags



Eine schnelle Möglichkeit, die Führung in Ihrem SEO-Ranking zu übernehmen, besteht darin, ein Top-Keyword in das Titel-Tag aufzunehmen. Und wenn Sie eine Minute darüber nachdenken, werden Sie feststellen, dass es sich tatsächlich um eine intelligente Lösung handelt. Wenn Sie eine Seite haben, die bereits für ein Keyword rangiert, ohne dass dieses Keyword im Titel vorhanden ist, stellen Sie sich vor, wie wichtig es ist, das Keyword im Titel zu haben. Sie werden natürlich häufiger für dieses Keyword indiziert. daher rangierst du besser.

Wenn wir dieses Schlüsselwort nun zu Ihrer Meta-Beschreibung hinzugefügt haben, werden sie in den Suchergebnissen hervorgehoben angezeigt, was bedeutet, dass wahrscheinlich mehr Suchmaschinenbenutzer darauf klicken. Dies kommt natürlich der Website zugute.

Stellen Sie sich vor, Semalt arbeitet an einer Website mit Hunderten, Tausenden oder Millionen von Seiten. Wenn wir dies manuell tun müssten, wäre es zeitaufwändig und würde ziemlich schnell teuer werden. Wie können wir dann die Seite analysieren und jeden Titel und jede Meta-Beschreibung optimieren? Die Lösung besteht darin, eine Maschine zu verwenden. Indem wir einer Maschine beibringen, auf jeder Seite die Keywords mit dem höchsten Rang zu finden, sparen wir Zeit und Kosten. Die Verwendung einer Maschine kann zu einer besseren und schnelleren Leistung führen als die Dateneingabe.

Lassen Sie uns Ubers Ludwig und Googles T5 wieder einführen

Durch die Kombination von Ubers Ludwig und Googles T5 erhalten Sie ein ziemlich leistungsfähiges System.

Zusammenfassend ist Ludwig ein Open-Source-Auto-ML-Tool, mit dem Benutzer fortgeschrittene Modelle trainieren können, ohne Code schreiben zu müssen.

Google T5 hingegen ist eine überlegene Version von Modellen im SERT-Stil. Der T5 kann Suchanfragen sowie viele andere Funktionen zusammenfassen, übersetzen, beantworten und klassifizieren. Kurz gesagt, es ist ein sehr leistungsfähiges Modell.

Es gibt jedoch keinen Hinweis darauf, dass T5 für die Optimierung von Titel-Tags trainiert wurde. Aber vielleicht können wir das und hier ist, wie:
  • Wir erhalten einen trainierten Datensatz mit Beispielen aus:
    • Originale Titel-Tags ohne unser Ziel-Keyword
    • Unsere Ziel-Keywords
    • Optimierte Titel-Tags mit den Ziel-Keywords
  • Ein T5-Tuning-Code und zu verwendende Tutorials
  • Haben Sie eine Reihe von Titeln, die nicht optimiert wurden, damit wir unser Modell testen können
Wir beginnen mit einem Datensatz, der bereits erstellt wurde, und geben eine Anleitung, wie wir den Datensatz erstellt haben.

Die Autoren von T5 waren großzügig genug, um uns ein detailliertes Google Colab-Notizbuch zur Verfügung zu stellen, mit dem wir T5 optimieren. Nachdem wir Zeit damit verbracht hatten, es zu studieren, konnten wir beliebige Trivia-Fragen beantworten. Das Colab-Notebook enthält auch Richtlinien zur Feinabstimmung des T5 für neue Aufgaben. Wenn Sie sich jedoch die Codeänderungen und die erforderliche Datenaufbereitung ansehen, stellen Sie fest, dass dies viel Arbeit erfordert und dass unsere Ideen möglicherweise perfekt sind.

Aber was wäre, wenn es einfacher sein könnte? Dank Uber Ludwig Version 3, die vor einigen Monaten veröffentlicht wurde, haben wir eine Kombination einiger sehr nützlicher Funktionen. Die 3.0-Version von Ludwig enthält:
  • Ein Mechanismus zur Optimierung von Hyperparametern, der zusätzliche Leistung aus Modellen ableitet.
  • Codefreie Integration in das Transformers-Repository von Hugging Face. Dadurch erhalten Benutzer Zugriff auf aktualisierte Modelle wie GPT-2, T5, DistilBERT und Electra für Aufgaben zur Verarbeitung natürlicher Sprache. Einige dieser Aufgaben umfassen die Analyse der Klassifizierungsstimmung, die Erkennung benannter Entitäten, die Beantwortung von Fragen und vieles mehr.
  • Es ist neuer, schneller, modular und verfügt über ein erweiterbares Backend, das auf TensorFlow 2 basiert.
  • Es bietet Unterstützung für viele neue Datenformate wie Apache Parquet, TSV und JSON.
  • Es verfügt über eine sofort einsatzbereite k-fache Kreuzvalidierungsaktivierung.
  • Wenn es in Weights and Biases integriert ist, kann es zum Verwalten und Überwachen mehrerer Modellschulungsprozesse verwendet werden.
  • Es hat einen neuen Vektordatentyp, der verrauschte Beschriftungen unterstützt. Das ist praktisch, wenn es sich um schwache Aufsichten handelt.
Es gibt mehrere neue Funktionen, aber wir finden die Integration in die Transformers von Hugging Face als eine der nützlichsten Funktionen. Hugging Face Pipelines können verwendet werden, um die SEO-Bemühungen für Titel und die Erstellung von Meta-Beschreibungen erheblich zu verbessern.

Die Verwendung von Pipeline ist ideal, um Vorhersagen für Modelle auszuführen, die bereits trainiert wurden und bereits im Modell Bub verfügbar sind. Derzeit gibt es jedoch keine Modelle, die das tun können, was wir von ihnen benötigen. Daher kombinieren wir Ludwig und Pipeline, um für jede Seite einer Website einen beeindruckenden automatischen Titel und eine Meta-Beschreibung zu erstellen.

Wie verwenden wir Ludwig, um T5 fein abzustimmen?

Dies ist eine wichtige Frage, da wir versuchen, unseren Kunden genau zu zeigen, was im Hintergrund ihrer Website vor sich geht. Hier gibt es ein Klischee: "Ludwig für das Training von T5 zu verwenden ist so einfach, dass wir darüber nachdenken sollten, es illegal zu machen." Die Wahrheit ist, wir hätten unseren Kunden viel höhere Gebühren berechnet, wenn wir einen KI-Ingenieur einstellen müssten, um das Äquivalent zu tun.

Hier erfahren Sie, wie wir T5 optimieren.
  • Schritt 1: Öffnen Sie ein neues Google Colab-Notizbuch. Danach ändern wir die Laufzeit, um die GPU zu verwenden.
  • Wir laden den bereits zusammengestellten Hootsuite-Datensatz herunter.
  • Wir installieren dann Ludwig.
  • Nach der Installation laden wir den Trainingsdatensatz in einen Pandas-Datenrahmen und überprüfen ihn, um festzustellen, wie er aussieht.
  • Dann stehen wir vor der größten Hürde, nämlich die Erstellung der richtigen Konfigurationsdatei.
Der Aufbau des perfekten Systems erfordert die Dokumentation für T5 und ständiges Ausprobieren, bis wir es richtig verstanden haben. (Es wäre ein langer Weg, wenn Sie den zu produzierenden Python-Code hier finden könnten.)

Überprüfen Sie die Wörterbücher der Eingabe- und Ausgabefunktionen und stellen Sie sicher, dass Ihre Einstellungen korrekt übernommen wurden. Wenn es richtig gemacht wird, wird Ludwig anfangen, 't5-small' als laufendes Modell zu verwenden. Bei größeren T5-Modellen ist es einfacher, den Modell-Hub zu ändern und möglicherweise die Generierung zu verbessern.

Nachdem wir ein Modell mehrere Stunden lang trainiert haben, erhalten wir eine beeindruckende Validierungsgenauigkeit.

Es ist wichtig, dass Sie beachten, dass Ludwig andere wichtige Messungen zur Texterzeugung automatisch auswählt, hauptsächlich Ratlosigkeit und Bearbeitungsabstand. Dies sind beide niedrige Zahlen, die richtig zu uns passen.

Wie wir unsere trainierten Modelle verwenden, um Titel zu optimieren

Das Testen unserer Modelle ist der wirklich interessante Teil.

Zunächst laden wir einen Testdatensatz mit nicht optimierten Hootsuite-Titeln herunter, die während des Trainings vom Modell nicht gesehen wurden. Mit diesem Befehl können Sie eine Vorschau des Datensatzes anzeigen:

!Kopf

Hootsuite_titles_to_optimize.csv

Es ist sehr beeindruckend, dass Ludwig und T5 mit jedem kleinen Trainingssatz so viel können, und sie erfordern keine fortgeschrittene Hyperparameter-Abstimmung. Der richtige Test hängt davon ab, wie er mit unseren Ziel-Keywords interagiert. Wie gut passt es?

Erstellen einer App zur Optimierung von Titel-Tags mit Streamlight

Inhaltsschreiber finden diese Anwendung am nützlichsten. Wäre es nicht erstaunlich, eine einfach zu bedienende App zu haben, die nicht viel technisches Wissen erfordert? Genau dafür ist Streamlight da.

Die Installation und Verwendung ist recht einfach. Sie können es installieren mit:

! pip Install Streamline

Wir haben eine App erstellt, die dieses Modell nutzt. Bei Bedarf können wir es an derselben Stelle ausführen, an der wir ein Modell trainieren, oder wir können ein bereits trainiertes Modell an die Stelle herunterladen, an der wir das Skript ausführen möchten. Wir haben auch eine CSV-Datei mit den Titeln und Schlüsselwörtern vorbereitet, die wir optimieren möchten.

Jetzt starten wir die App. Um das Modell ausführen zu können, müssen wir den Pfad zur CSV-Datei angeben, die die Titel und Schlüsselwörter enthält, die wir optimieren möchten. Die CSV-Spaltennamen müssen mit den Namen während des Trainings von Ludwig übereinstimmen. Wenn das Modell nicht alle Titel optimiert, sollten Sie nicht in Panik geraten. Eine anständige Zahl richtig zu machen, ist auch ein großer Schritt nach vorne.

Als Python-Experten sind wir sehr aufgeregt, wenn wir damit arbeiten, da dies normalerweise unser Blut zum Pumpen bringt.

So erstellen Sie einen benutzerdefinierten Datensatz zum Trainieren

Mit Hootsuite-Titeln können wir Modelle trainieren, die für unsere Kunden gut funktionieren, für ihre Konkurrenten jedoch möglicherweise Standard sind. Deshalb stellen wir sicher, dass wir unseren eigenen Datensatz erstellen, und so machen wir das.
  • Wir nutzen unsere eigenen Daten aus der Google Search Console oder den Bing Webmaster-Tools.
  • Alternativ können wir auch die Wettbewerbsdaten unserer Kunden von SEMrush, Moz, Ahrefs usw. abrufen.
  • Wir schreiben dann ein Skript für Titel-Tags und teilen dann Titel auf, die das Ziel-Schlüsselwort haben und nicht.
  • Wir nehmen die Titel, die mithilfe von Schlüsselwörtern optimiert wurden, und ersetzen die Schlüsselwörter durch Synonyme, oder wir verwenden andere Methoden, damit der Titel "deoptimiert" wird.

Fazit

Semalt ist hier, um Ihnen zu helfen, Ihre Titel-Tags sowie Meta-Beschreibungen automatisch zu optimieren. Auf diese Weise können Sie bei SERP die Nase vorn haben. Die Analyse einer Website ist nie einfach. Deshalb spart die Schulung einer Maschine, die uns dabei hilft, nicht nur Kosten, sondern auch Zeit.

Bei Semalt gibt es Profis, die Ihren Datensatz Ludwig und T5 so einrichten, dass Sie immer gewinnen können.

Rufen Sie uns noch heute an.

mass gmail