Google ReaderがRSSを反映する時期は?

Google ReaderTwitterのログを全てインデックスしていないと思う。

理由1

追記:遡れない人もいるらしい。http://twitter.com/bsakatu/statuses/3145404022

既にこの時点で「全員ではない」と分かると思う。

理由2

id:edvakfがいう"一番最初の発言"は、最初ではないと思われる。
Twitterアカウントそのものは2008年4月14日に作成しているし、少なくても同年6月4日に一回以上は発言をしていることになっている。

twitterでぼそっと言ったのをsuzusakiさんに反応してもらった。

2009年8月23日午前7時現在で、id:edvakfの投稿数は4203ある。だから、

  • http://www.google.com/reader/atom/feed/http://twitter.com/statuses/user_timeline/14377354.rss?n=5000

で取得すると、上限が5000なのだから、もし"全ての発言がインデックスされていたら、id:edvakfの発言はもれなくGoogleが取得していた"こととなっているはず。
だが、最古のログは2008年7月3日である。*1


ということは、Googleは全てのログを取得していないのではないか、と考えられる。
ただし、

  1. id:edvakfが2008年4月14日から7月2日までの発言を全て削除していた
  2. そもそも、n=5000は無効

なんて場合であれば、真相は分からない。ちなみに、1番は本人に確認を取ればいいこと。2番目はたぶんないと思う。

あまた説改

ArtSaltさんが「あまた説」と呼んでいることに笑ってしまったけど、このあまた説っていうのは、以前の記事に書いたとおりで、「Google Readerに反映されるRSSは、そのRSSが購読された時点からのものである」っていう内容。


とすると、今回の件は、「誰かがid:edvakfTwitter RSSを購読していたが、それを途中でやめた」ということになる。でも、この条件が成立するには結構な条件が必要になる。
何故かというと、通常TwitterユーザーのRSSがその時点で配信する投稿数は20であり、もしid:edvakfがログを削除しないでいたのなら、7月3日の投稿を最古とするようなRSSを購読しないといけなくなる。そんなことあるのだろうか?


ってことで、あまた説はより無難な方向に進めようと思い、次のように改めます。

  • Google Readerに反映されるRSSは、原則"誰かがそのRSSが購読された時点から"のものである
    • ただし、人力で購読される前に、Googlebotがそのページで配信されているRSSを補足した場合、以下の2通りの結果が生じると思われる。
      • 補足した日のRSSのみが反映される
      • 補足した日からRSSが常に反映される

*1:なお、この投稿をする前に自分でも確認している。Firefoxが死ぬかと思った、、、