Die Mitgliedschaft ist KOSTENLOS und bietet allen registrierten Nutzern unbegrenzten Zugriff auf alle Funktionen, Ressourcen und Tools von ConsultDomain.de! Optionale Mitgliedschaftsupgrades schalten exklusive Vorteile frei, wie Profil-Signaturen mit Links, Bannerplatzierungen, Erwähnungen im wöchentlichen Newsletter und vieles mehr – individuell angepasst an Ihr Mitgliedschaftslevel!

Willkommen!

Durch Ihre Registrierung bei uns können Sie mit anderen Mitgliedern unserer Community diskutieren, teilen und private Nachrichten austauschen.

Jetzt anmelden!

Keywordliste mit 6 Mio. Keywords

Arithmos

Erfahrener Benutzer
Registriert
06. Sep. 2007
Beiträge
3.929
Ich habe aus ca. 2,5 Mio. de.wikipedia.org-Seiten (ca. 40 GB Daten) eine Liste mit ca. 6,5 Mio. verschiedenen Keywords erstellt.

Die Liste ist utf-8 codiert und enthält auch Wörter mit deutschen Umlauten und ß.

Wörter mit mehr als 2 gleichen Vokalen oder mehr als 3 gleichen Konsonanten in Folge sind schon entfernt, ebenso Wörter mit mehr als 64 Zeichen.

Ansonsten enthält die Liste eben jedes unterschiedliche Wort, das auf diesen 2,5 Mio de.wikipedia.org-Seiten vorkommt. Also auch jede Menge Merkwürdigkeiten, Typos, Markennamen, Fremdwörter, Wortfragmente usw.

Dennoch sicherlich hilfreich für jeden, der eine umfangreiche Keyword-Datenbank aufbauen will.

Die Liste ist ungezippt ca. 80 MB groß.

Besteht Interesse und zu welchem Preis?

Anfragen gerne auch per PM.

Gruß
Arithmos
 
Die Idee finde ich nicht schlecht und die Liste hat sicher eine Menge Arbeit gemacht. Ich staune aber vor allem dass es überhaupt soviele verschiedene Begriffe geben soll. Selbst ein sehr gutes Wörterbuch enthält nur einen winzigen Bruchteil davon, gerade wenn das nur von den deutschen Seiten kommt. Da sind sicher ein paar Perlen drunter versteckt an die noch keiner bei Domains gedacht hat, viel Erfolg damit!
 
A propos Keywords, da ich sie selbst gerade brauchte, habe ich sie mal als Anhang beigefügt: Alle LLL-Möglichkeiten ohne Umlaute. Falls jemand sie zufällig noch benötigt, wollte dafür nicht noch einen eigenen Thread eröffnen.

Gruß,
Custer :bandit:
 

Anhänge

Wörter mit mehr als 2 gleichen Vokalen oder mehr als 3 gleichen Konsonanten in Folge sind schon entfernt, ebenso Wörter mit mehr als 64 Zeichen.

hatte das auch mal vor Jahren gemacht... gibt noch ein wenig mehr mechanismen, wie du unnötige "wörter" oder solche die keine sind aussieben kannst...

mfg, albert
 

Who has viewed this thread (Total: 1) Details anzeigen

Wer hat dies thread angesehen? (Gesamt: 1) Details anzeigen

Neueste Themen

Beliebte Inhalte

Besonderer Dank

Zurzeit aktive Besucher

Keine Mitglieder online.

Statistik des Forums

Themen
68.348
Beiträge
377.591
Mitglieder
6.777
Neuestes Mitglied
tedcars
Zurück
Oben