Aktuelles
  • Hallo Neuanmeldung und User mit 0 Beiträgen bisher (Frischling)
    Denk daran: Bevor du das PSW-Forum in vollen Umfang nutzen kannst, stell dich kurz im gleichnamigen Unterforum vor: »Stell dich kurz vor«. Zum Beispiel kannst du dort schreiben, wie dein Politikinteresse geweckt wurde, ob du dich anderweitig engagierst, oder ob du Pläne dafür hast. Poste bitte keine sensiblen Daten wie Namen, Adressen oder Ähnliches. Bis gleich!

Wortwolken fuer umfangreiche Straenge

PSW - Foristen die dieses Thema gelesen haben: » 20 «  

immernochIch

Mehr hinter der Loginwand. Kein Digitalgeheimnis!
Premiumuser +
Registriert
26 Jan 2022
Zuletzt online:
Beiträge
5.900
Punkte Reaktionen
1.697
Punkte
44.520
Geschlecht
--
Ich wuerde es sehr Hlfreich finden, wenn das Forum Wortwolken fuer Straenge mit vielen Kommentaren anbieten wuerde.

Ausserdem waere eine Anzeige von verwandten Straengen schon bei dem Verfassen von neuen Themen sehr hilfreich.
 

HeWhoIsGoingToWin

Deutscher Bundespräsident
Registriert
23 Jan 2019
Zuletzt online:
Beiträge
3.355
Punkte Reaktionen
472
Punkte
84.052
Website
www.wallstreet-online.de
Geschlecht
Vielleicht taugt word_cloud von Andreas Mueller was

Ich habe diese Software weder ausprobiert noch analysiert aber so auf den ersten Blick schaut mir das gar nicht so schlecht aus:
amueller / word_cloud
word_cloud

Beeindruckende Beispiele:
alice.png
parrot_new.png

"... The wordcloud library is MIT licenced, but contains DroidSansMono.ttf, a true type font by Google, that is apache licensed. The font is by no means integral, and any other font can be used by setting the font_path variable when creating a WordCloud object. ..." Licensing

Wäre cool, wenn Psw das bei sich integrieren könnte - man beachte natürlich das Rechtliche, Lizensierung und so und vor allem auch die Sicherheit, d.h. word_cloud sollte nix kaputt machen können, selbst wenn eine Version mal einen Fehler oder Sicherheitslücken hat: man überlege sich, wie word_cloud auf dem Server zu betreiben ist, so dass die Impementierung sicher abgeschottet ist. Aspekte sind eine Begrenzung von Input und Output; die Analyse eventueller Nutzung von Linux Shared Libraries und ob da etwas schief gehen könnte, usw. Eine Möglichkeit kann sein, so etwas (ggf. noch anderes) auf eine extra Instanz auszulagern, die einfach (interne Kommunikation) eine HTML- oder Textdatei als Input nimmt und dann ein Bild zurück gibt. Vielleicht einfach mal einen Experten fragen, ob der ein paar Tipps hat. (alles imho)
 

Psw - Redaktion

Admin
Moderator
Registriert
2 Sep 2008
Zuletzt online:
Beiträge
1.769
Punkte Reaktionen
1.578
Punkte
54.520
Ich wuerde es sehr Hlfreich finden, wenn das Forum Wortwolken fuer Straenge mit vielen Kommentaren anbieten wuerde.
Das liesse sich mit einem Tagcloud-widget realisieren, wie ich das auf die Schnelle überblicke. Allerdings müssten dafür ThemenTags angelegt werden. Wer das möchte, dem kann ich die nötigen Rechte dafür einräumen und der/die kann immer mal neue Tags hinzufügen und so mit der Zeit die Wolke vergrößern. Diese Wolke wäre dann aber wohl themenübergreifend, forenweit und nicht nur auf einen Strang bezogen.
 
OP
immernochIch

immernochIch

Mehr hinter der Loginwand. Kein Digitalgeheimnis!
Premiumuser +
Registriert
26 Jan 2022
Zuletzt online:
Beiträge
5.900
Punkte Reaktionen
1.697
Punkte
44.520
Geschlecht
--
Das liesse sich mit einem Tagcloud-widget realisieren, wie ich das auf die Schnelle überblicke. Allerdings müssten dafür ThemenTags angelegt werden. Wer das möchte, dem kann ich die nötigen Rechte dafür einräumen und der/die kann immer mal neue Tags hinzufügen und so mit der Zeit die Wolke vergrößern. Diese Wolke wäre dann aber wohl themenübergreifend, forenweit und nicht nur auf einen Strang bezogen.
Vielen Dank fuer die Antwort. Aber an sich sollte nicht das ganze Forum in diese Wolke, sondern nur Straenge, um sich ein Bild von Einzelnen machen zu koennen, um was es da HAUPTSAECHLICH geht, wenn es viel Seiten sind, weil die Ueberschriften nicht unbedingt viel aussagen, ueber was hinterher wirklich diskutiert wird.
Und Thementags helfen da wenig, weil man die, genau wie die Ueberschriften sehr verfehlen kann.

Die Software waere gar nicht aufwendig.
Einfach alle Worte in einem Strang dynamisch zaehlen, Fuellwoerter rauswerfen und dann die Prozentwerte der restlichen Woerter irgendwie in Strangtitel mitteilen. Am besten grafisch und/oder mit einem Link fuer mehr Details.
 

HeWhoIsGoingToWin

Deutscher Bundespräsident
Registriert
23 Jan 2019
Zuletzt online:
Beiträge
3.355
Punkte Reaktionen
472
Punkte
84.052
Website
www.wallstreet-online.de
Geschlecht
Gedanken zu Wortwolken

Das liesse sich mit einem Tagcloud-widget realisieren, wie ich das auf die Schnelle überblicke. Allerdings müssten dafür ThemenTags angelegt werden. Wer das möchte, dem kann ich die nötigen Rechte dafür einräumen und der/die kann immer mal neue Tags hinzufügen und so mit der Zeit die Wolke vergrößern. Diese Wolke wäre dann aber wohl themenübergreifend, forenweit und nicht nur auf einen Strang bezogen.

"Eine Schlagwortwolke (auch Wortwolke, Schlagwortmatrix oder Stichwortwolke, selten Etikettenwolke; engl.: tag cloud, word cloud) ist eine Methode zur Informationsvisualisierung, bei der eine Liste aus Schlagwörtern, oft alphabetisch sortiert, flächig angezeigt wird, wobei einzelne unterschiedlich gewichtete Wörter größer oder auf andere Weise hervorgehoben dargestellt werden. Sie kann so zwei Ordnungsdimensionen (die alphabetische Sortierung und die Gewichtung) gleichzeitig darstellen und auf einen Blick erfassbar machen. ...

... Für die Erstellung von Schlagwortwolken verwendet man üblicherweise speziell dafür geeignete Software. So gibt es beispielsweise Software, welche aus Texten oder Webseiten die Schlagworte und deren Häufigkeit automatisch eruieren und die Schlagwortwolke generieren. Andere Programme wiederum benötigen eine Liste an Schlagworten und deren Gewicht, um die Schlagwortwolke generieren zu können. ..." Schlagwortwolke

Wenn ich das richtig verstanden habe, dann gibt es Software, welche eine Wortwolken zu einem Text (z.B. Thread) automatisch generiert. Man kann zweit Aufgabenbereiche unterscheiden: a) die Häufigkeit gleicher Wörter bestimmen und diese nach Häufigkeit sortieren b) diese Wörter in einer Wortwolke graphisch darstellen (eine Grafik erzeugen), wobei häufig benutzte Wörter größer dargestellt werden.

Das muss Psw (wenn gewünscht) nur einmal einrichten und dann sollte das automatisch gehen. Zwar schätzte ich den Nutzen von Wortwolken-Grafiken für Menschen nicht so hoch ein aber es kann auch mal interessant sein, z.B. auch für Journalisten oder so, die einen Artikel über User schreiben wollen.

Denkbare Vorgehensweise:

- Eine geeignete Software für Wortwolken suchen, siehe auch Vielleicht taugt word_cloud von Andreas Mueller was.

- Die Software nutzen, um für jeden Thread eine Wortwolken-Grafik zu generieren, diese abspeichern und bei der Thread-Darstellung einen Button einrichten, der die Wortwolken-Grafik anzeigt, wenn man draufklickt. Bei der Darstellung der Wortwolke solle das Datum ihrer Erzeugung angegeben und dazu abgespeichert werden.

- Vor der Wortwolken-Generierung muss der Input für den Wortwolken-Generator (die Software) ggf. aufbereitet werden, z.B. indem alle Beiträge eines Threads in eine (temporäre) Input-Textdatei geschrieben werden und dann noch unerwünschte Elemente (URLs, problematische Sonderzeichen, usw.) gelöscht werden.

- Eventuell sollte es zwei Wortwolken pro Thread geben: pur (alle Wörter) und bearbeitet (ohne häufige aber nichtssagende Wörter wie z.B. "und", "oder", usw). Für die bearbeite Wortwolke muss eine Liste mit Wörtern erstellt werden, welche aus der Input-Textdatei vor der Generierung der Wortwolke gelöscht werden. Eine pauschale Löschung aller kurzen Wörter ist ungünstig, weil es auch bedeutendere kurze Wörter gibt, wie z.B. gut, USA, ich, du, usw. (ja, auch usw. sollte in der Wortwolke auftauchen können, weil es ein Hinweis auf weitere Aspekte, einen größeren Themenbereich ist).

- Nun müssen die Wortwolken nur noch gelegentlich aktualisiert werden. Dazu braucht es nicht bei jedem neuen Beitrag eine Neuberechnung, weil die Wortwolke eines schon etwas längeren Threads sich durch ein paar neue Worte nicht so stark ändert. Denkbarer Aktualisierungsalgorithmus:

a) Eine schon länger nicht mehr aktualisierte Wortwolke wird beim Aufruf durch einen User vorher neu berechnet.

b) Automatische Aktualisierung der Wortwolken, indem z.B. täglich geprüft wird, welche Threads so viele neue Beiträge haben, dass ihre Wortwolke aktualisiert werden sollte. Denkbare Aktualisierungskriterien dazu:

- mindestens ein neuer Beitrag und Wortwolke älter als X Tage, wobei X auch von der Größe des Threads abhängen kann, also z.B. Ganzzahl X = "Anzahl der Beiträge" / 100 + 1.

- oder der Thread hat seit der letzten Wortwolken-Generierung Y Prozent neue Beiträge, mit z.B. Y = 2, 3, 5 oder so.

Man beachte irgendwelche Probleme durch Sonderzeichen, URLs, usw. und vermeide Sicherheitslücken durch Code Injection. Neue Softwareversionen können ggf. Fehler/Sicherheitslücken enthalten. (alles imho)
 
OP
immernochIch

immernochIch

Mehr hinter der Loginwand. Kein Digitalgeheimnis!
Premiumuser +
Registriert
26 Jan 2022
Zuletzt online:
Beiträge
5.900
Punkte Reaktionen
1.697
Punkte
44.520
Geschlecht
--
Wird darueber nachgedacht?
Koennte auch automatisiert fuer alle Straenge werden.
Geht nicht schwer auf Datenbankbasis.
Wuerde mich sogar dafuer anbieten. Natuerlich ehrenamtlich.
 
OP
immernochIch

immernochIch

Mehr hinter der Loginwand. Kein Digitalgeheimnis!
Premiumuser +
Registriert
26 Jan 2022
Zuletzt online:
Beiträge
5.900
Punkte Reaktionen
1.697
Punkte
44.520
Geschlecht
--

Wer ist gerade im Thread? PSW - Foristen » 0 «, Gäste » 1 « (insges. 1)

Ähnliche Themen

Neueste Beiträge

Alle gegen AfD
Mich interessiert dein Verhalten, wenn diese inszenierte Geschichte zum Rohrkrepierer...
Die totgesagte Welt
Der herrschende Materialismus betrachtet den Menschen und die Welt als sinn- und leblose Apparaturen.
Oben