RSSに関心があるならAtomに注目するべき

RSSと同様に、ブログやニュースサイトの記事の一覧を示すデータ形式として、Atomという形式が使われている。普及度はRSSのほうが高く、Atom 1.0とRSS 2.0では記述能力にそれほど差がないことから、新たにRSS的データを生成するのであればRSS 2.0だけを考えればいいのではないかと思っていた。

しかし、IT ConversationsでAtom As A Case Studyという講演を聞き、私の認識は間違っていたことが分かった。この講演は2006年3月に開催されたETech 2006でおこなわれたものである。以下は同講演の概要である。

  • RSSは仕様の凍結が宣言されている。仕様の明確化はおこなってもよいが、拡張をほどこすのであれば、「RSS」という名前とは別の名前を使わなければならない。
  • RSSには幾つも改善すべき点があるので、RSSではない、新たな標準を策定しようとIETF標準化作業が始まった。Atomによる記事一覧配信(syndication)の標準化作業は完了し、RFC 4287となっている。
  • RSSには明確に定義されていない点が幾つかある。たとえば、RSS 2.0でポッドキャストを配信する場合、1つのエントリに複数のenclosure要素を入れた場合の挙動は未定義である。
  • RSSではできないことも幾つかある。
    • 国際化URL(IRI)を含めること。
    • 相対URLを含めること。ブログ記事中の画像は、RSS中では絶対URLになっていなければならない。ブログサイト上は相対URLでも構わないのだから、このために余計な処理が必要になる。HTML中で相対URLが許されているのにRSS中で許されないの困ったことである。
  • RSSでは不便な点もある。
    • 各エントリにグローバルに一意のIDを付けることは必須となっていないので、複数のRSSフィードを重複を避けて1つにまとめる処理に少し手間がかかる。
  • 標準化の議論の中で上記の問題はすべてクリアされた。多くの人が様々な観点で検討・議論することにより標準がまとまった。IETFでの標準化作業のメーリングリストでは1万7944通のメールがやりとりされ、それは60メガバイト以上になった。
  • Atom形式にはバージョン番号を示すところがない。なぜなら、バージョン番号を不要とするように標準を定めてあるからである。具体的には、Atomデータを解釈するプログラムは、自分が知らないタグは無視するように定めている。これはHTMLについておこなわれていることと同じである。ウェブブラウザーは未知のタグは無視する。このしくみがあるので、HTMLは下位互換性を実現できている。同様のことがAtomについても言える。
  • RSSに加えてAtomでも記事配信をおこなうウェブサイトが増えている。BloggerはまだAtom 0.3という非常に古いバージョンを使っている。*2
  • ブログの記事を編集・投稿するためのアプリケーションがあり、それは、ブログサービスの投稿APIを使って記事を投稿・更新する。現在はそのAPIは標準化されていないので、ブログ編集アプリケーションを使う際はブログサービスの種類を選ばなければならない。
  • 多くの人は現在のブログ編集のインターフェースに満足していない。投稿APIが標準化されれば、ブログ編集ソフトが編集機能で競争できるようになり、使い勝手が大きく向上することが期待できる。

講演の概要は以上で、以下は私の考えである。標準化団体のお墨付き自体には本質的価値はないが、標準化作業で多くの人により加えられる考察・議論・入力には大いに価値がある。RSSは標準化団体による標準化作業を経ていないので、曖昧な点があっても不思議はない。RSSの仕様が固定されている一方で、IETFで活動中のAtomコミュニティがあるという状況では、Atomに注目し続ける必要があると思う。そして、長期的にはAtomにより比重が移っていっても不思議ではない。

*1:2006年6月にサポートされるようになった。

*2:2006年8月現在もそのままである。