Web-Weaver

Des Schockwellenreiters Webworker-Seiten

Suchen in:
Suche:
In Partnerschaft mit Amazon.de
Werbung
Test und Preisvergleich
Preisvergleich und Testberichte zu Notebooks, Handys Digitalkameras
sowie MP3 Player.






Ja, wozu eigentlich RSS?

Um die Aufgeregtheit hier und die absolut dämliche Anpöbelei hier zu versachlichen, möchte ich einfach mal darstellen, was überhaupt RSS ist und wozu es eingesetzt wird, resp. eingesetzt werden kann. Vielleicht ist es gut, erst einmal damit anzufangen, was RSS nicht ist: RSS ist kein Format, um Weblogs in einem eigenen Design zu lesen und RSS ist erst Recht kein Format, um neckische Audio-Spielereien automatisch auf einen iPod zu übertragen. RSS ist vielmehr Teil der Bemühungen, dem mit dem Wachsen des Webs ebenfalls wachsendem »Information Overflow« Herr zu werden, und ein Format zu schaffen, Webinhalte verständlich für Maschinen und Menschen aufzubereiten. Und damit kann ich gleich mit einem ersten Vorurteil aufräumen: Kaum ein Mensch »liest« RSS, RSS wird von Maschinen, Spidern oder Bots (die ich nachfolgend nur noch »Agenten« oder »User-Agenten« nennen werde), gelesen und von ihnen in irgendeiner Form aufbereitet. RSS ist ein XML-Format, davon kann sich jeder überzeugen, der sich z.B. den RSS-Feed des Schockwellenreiters im Mozilla einmal anschaut:

Screenshot RSS-Feed

Erst diese Agenten bereiten den Feed entweder in eine für Menschen lesbare Form auf oder stellen sonst etwas damit an (z.B. Annotieren und in eine Datenbank »versenken« um Grundlagen für eine Data-Mining-Anwendung zu schaffen). Dabei kann der User-Agent durchaus ein Browser sein, wie z.B. der Safari, der in seiner jüngsten Inkarnation auch als Feedreader fungiert. (Ich bin mir allerdings nicht so sicher, ob ich diese Entwicklung für sinnvoll halten soll — ich habe allerdings auch noch nicht so viel mit den RSS-Fähigkeiten des Apple-Browsers herumgespielt.)

RSS ist also Teil der Bemühungen um ein semantisches Web und das wird auch durch die wechselvolle Geschichte des Formates deutlich. Ursprünglich als reine Headline-Syndizierung (also nur Überschriften) gedacht, wurde es mit RSS 1.0 Teil der Bewegungen um ein Resource Description Framework (RDF), versuchte also, neben den eigentlichen Inhalten auch noch Metadaten zu transportieren. Demzufolge halte ich den Winerschen Alleingang mit RSS 2.0 für einen Rückschritt und den Versuch, mit Atom eine proprietäre, eierlegende Wollmilchsau zu schaffen, in Bezug auf das semantische Web für eine Katastrophe.


[Exkurs]: Der Schockwellenreiter verwendet demzufolge RSS 0.92 und nicht RSS 2.0, obwohl ich das durchaus könnte. In Zukunft werde ich — da ich Teil der Bemühungen um ein semantisches Web sein möchte Grins — auch wieder ein RSS 1.0 anbieten, dies ist jedoch mit den Mitteln des Outline-Renderers von Frontier nicht so einfach zu bewerkstelligen, da ich die dann benötigten Informationen nicht in einem »Pass« zusammenbekomme, sondern ich noch einen zweiten Rendering-Lauf über die Outlines fahren müßte. Dies ist aber prinzipiell möglich (z.B. mit einem Final-Filter)

RSS ermöglicht daher im einfachsten Falle, mit Hilfe eines User-Agenten wie z.B. NetNewsWire (lite), genau das, wozu die meisten Blogger es anwenden: Er prüft nach, ob eine Website (nicht notwendigerweise ein Blog) ein Update erfahren hat, oder nicht, ohne daß der Nutzer selber mehrmals täglich und meist erfolglos die Seite ansurfen müßte. Für diese (wichtige) Information ist es erst einmal unerheblich, ob der Feed nur als Überschrift, als Überschrift mit Abtract oder als Vollquote vorliegt. Der Agent zeigt einfach nur an, daß es neue, ungelesene Meldungen gibt. Erst jetzt erfolgt der zweite Schritt, indem beurteilt wird — entweder maschinell oder durch den User —, ob der Inhalt der Neuigkeiten für den Nutzer relevant ist, das heißt, ob er dieses Update ansurfen oder sonst irgend etwas damit anstellen will. Hier spielt es dann doch eine Rolle, in welcher Form die Feeds vorliegen. So funktioniert z.B. der reine Überschriften-Feed von Heise Online gerade noch, da die Überschriften dort in der Regel eine Zusammenfassung der Meldung vornehmen, der Feed der Telepolis hingegen (Headline und Sub-Headline) ist eine reine Katastrophe, da aus der oftmals gewollt irreführenden Überschrift und der ebenfalls mitgelieferten Sub-Headline überhaupt nicht auf den Inhalt des Artikels zu schließen ist. Vorbildlich hingegen sind z.B. die Feeds von Golem.de und O'Reilly Network (Headline und Abstract), die immer gut, kurz und knapp den Inhalt der syndizierten Artikel wiedergeben.

Practical RDF Book Cover Und Vollquote? Vollquote ist meiner Meinung nach gerade bei langen Artikeln, wie sie z.B. das O'Reilly Network liefert, auch nicht immer gut, das geht in vielen Fällen über das Ziel von RSS und RDF hinaus. Bei den meist kurzen Artikeln des Schockwellenreiters funktioniert Vollquote natürlich (und außerdem wollten viele meiner Leser Vollquote-Artikel haben und da meine Software das ohne größere Verrenkungen hergibt...) Allerdings habe ich mir ein Hintertürchen offengehalten. Vor dem Hochladen auf den Server kann ich meinen Feed noch einmal manuell ändern, falls ich also in Zukunft mehr solcher langer Artikel wie diesen schreibe, könnnte ich dann an dieser Stelle einen Abstract einsetzen. (Ursprünglich hatte ich dieses Feature entworften, um RSS-unverträgliche Elemente (wie z.B. JavaScript oder eingebettete QuickTime-Filme) aus meinem Feed zu entfernen.)

Damit sind aber die Möglichkeiten von RSS noch lange nicht ausgeschöpft. Es kann z.B. dazu dienen, daß ein Verlag oder ein Softwareproduzent immer über Neuerscheinungen oder Updates informiert. (Auch hier gibt es schon Beispiele, wie z.B. SubEthaEdit, die das vorbildlich erledigen.) Wie oft habe ich schon vergeblich die Seiten einer Software-Firma angesurft, um nichts zu erfahren und dann ist das dringend erwartete Update doch unbemerkt an mir vorbeigerauscht.

Aber auch Preisinformationen könnten per RSS publiziert und auf dem Laufenden gehalten werden. Darauf spezialisierte User-Agenten könnten das Netz nach diesen Informationen durchsuchen und für den Nutzer das günstigste Angebot im Netz finden.

Content Syndication with RSS Book Cover Aber vor allem kann RSS der »personalisierten« Informationsbeschaffung im Web dienen. So könnte ein Agent beispielsweise mit Hilfe eines Baysschen Netzes die eingehenden Informationen nach ihrer Relevanz bewerten und filtern. Das würde im Prinzip ähnlich wie bei vielen Spamfiltern funktionieren: Nach einer ersten Trainingsphase entscheidet der Agent selbständig, was relevant und was irrelevant für »seinen« Nutzer ist und stellt die Nachrichten entsprechend zusammen. Natürlich müßte er— ähnlich wie ein Spamfilter — ständig »nachjustiert« werden, aber im Prinzip wäre das möglich. Ich plane auf dieser Basis schon seit längerer Zeit einen Agenten-gesteuerten Zwilling des Schockwellenreiters, der seinen Feed mit Hilfe solch eines (trainierten) Filters auswertet und dann via XML-RPC z.B. dieses Blog füttert. Grins

Eine frühe Vision von Alan Kay und Apple wäre damit verwirklicht: Die persönliche Tageszeitung, die nach den Präferenzen des Nutzers die Informationen im Netz zusammensucht und sie für ihn aufbereitet.

Ich hoffe, daß dieser Beitrag aufzeigt, warum auch Weblogs einen RSS-Feed anbieten sollten und wieviel Wahrheit in dem Spruch »No Feed, No Read« steckt. Insbesondere aber, daß mit der zunehmenden Durchdringung des Netzes mit RSS und RDF die Vision John Brunners und das Motto des Schockwellenreiters Wirklichkeit werden könnte:

Wir sind eine zivilisierte Spezies. Deshalb soll künftig niemand einen unrechtmäßigen Vorteil aufgrund der Tatsache erlangen, daß wir gemeinsam mehr wissen als einer von uns wissen kann.

In diesem Sinne: Schön, daß wir darüber geredet haben...

[Literatur]:

Und der RSS-Blogger Siegfried Hirsch informiert immer kompetent und aktuell über alle neuen Entwicklungen im Umfeld von RSS.

Und natürlich ist RSS auch der »Google des Tages«.

Posted by Jörg Kantel | Permalink | | | Webworking

Letzte Änderung: 13.02.2008; 7:15:18 Uhr | © Copyright: 2000 - 2008 by Kantel-Chaos-Team | Kontakt: der@schockwellenreiter.de

frontierLogo picture Made with a Mac Weblog Commenting and Trackback by HaloScan.com CC-Logo