私がこの話を目にしたのは先週頃で、「あー、その手でやられたらウチが作ろうとしてるランキングサイトもシャレにならんなぁ」とか思ってエンジニアにメールを投げていた。結局、そのときはコメントスパム問題に注力しててあまり真剣に考えてなかったんですが、今週に入って色々動きが出てきました。
その中でもショックだったのはこのブログの存在。
livedoorブログランキングの欠陥を明らかにする公開実験ブログ
で、このブログがなんでショックかというとこれです。わからないかなぁ、右側のランキングを見てくださいな。トップでしょ、こんなブログが。既にこの【探し物/消息】カテゴリって(たぶん)ライブドアブログ運営者が意図していないサイトが多かったのですが、明らかにおかしなブログの登場に【なんでも評点】さんが実験してるのかなぁと思っていたら、やはり同じことを考えている人がいて、その指摘を受ける形で【なんでも評点】さんが公開実験に言及したといった流れになってきています。
そして、この一連の流れに関係しているかどうかは不明ですが、明朝4月13日(水)AM5:00~AM6:00にメンテナンス実施とのことです。うーん、これはやはりこれらの対策なんだろうか...。
どちらにしても、今回の【なんでも評点】さんの指摘は到底無視できるものじゃないと思う。ライブドアのランキングは単なるランキングではなく、ランキングに応じてライブドアデパートポイントが発行されたり、そもそもランキング上位に位置していることによるアフィリエイトなどの宣伝効果は大きいといえる。つまり、金が絡んでいるということもあり、ライブドアとしても何らかの対策は執らねばらねばならないはずだ。
ただ、この対策は正直かなり困難を極めると思う。私が考える限り、このライブドアブログのポイントはApacheの生成しているアクセスログを元に、書くブログの前日のユニークユーザ数をルールの下に割り出し、1週間の平均値によりその日のポイントを算出しランキングに反映していると思われる。私が知る限り、iframeによって外部サイトに掲示されてしまったアクセスであるかどうかを割り出すのは容易にできないはず。combinedのアクセスログのREFERERをチェックし、そのREFERER先のHTMLを解析し、iframeなどによるアクセスに関してはユニークユーザとしてカウントしないといった流れが必要だ。そう、技術的には可能である。可能ではあるが、タダでさえもアクセス解析やポイント反映が遅れることがあった上に、明らかにマシン負荷及び回線負荷がかかるこれらの仕組みを導入するのは不可能に近いと考えられます。
そうなると何か新たなポイント算出の仕組みを新たに付け加えるのだろうか? それにしてもそう簡単に開発できるものじゃないと思います。そう、だっていまうちの会社はそういったのを作ってるんですから、簡単に作っちゃうとエライ目にあることはしってますし、ライブドアとしても想定の範囲内でしょ、そりゃ。ちなみに、私が心配していた自分達のランキングシステムには影響が及ばないと考えられます。そもそも、埋め込み式によるランキングシステムですがJavaScript対応していないとダメですから。iframeで外部ドメインの奴をはじくこともできますし、ブラウザのセキュリティ対策で外部のJavaScriptは実行できないことがほとんどなので。
うーん、実はスパムコメントの問題より明らかに社会的影響(?)が大きなこの問題。ライブドアがどのように対応をするのか注視したいと思います。あと、ひょっとしたら他のランキングを実装しているブログポータルにも影響を及ぼしちゃうのかも...大丈夫ですか、お宅のランキングシステムは?
トラバ対象:
livedoorBlogのランキングポイントは簡単に操作できてしまう@なんでも評点
livedoorBlogランキングの欠陥を明らかにする公開実験開始 ― 記事ゼロのブログが1日でいとも簡単に8000ポイント突破@なんでも評点
livedoorブログランキングの欠陥@Return of the まにあな日記
メンテナンス実施のお知らせ@livedoor Blog 開発日誌
くろだ
↑こちらの方、リンクは切らせてもらいました、ごめんなさい
xx_blast_xx
こんにちわ。ブラストといいます。
僕も実はWEB関係の仕事をしていて、
現在アクセスランキングを含めたサイトの構築中です。
実際問題としてあそこまで操作されていると、
ランキングのシステムを修正したり、
くろださんが書かれているようにリソースの問題も含め、
ライブドア的にはこの問題を無視して、
ランキングに伴う付加サービスは行わないというのが
現実的なのかなと思いました。
しかしながら、アダルトカテゴリでも突如上位にきていたブログなどがあったので、
以前からこんな事が行われていたのかなと思うと、
結構悲しいですね。
しかし、第○企画っていう会社名がユニークですよね☆
DBはぽすぐれなんですね。
僕の開発スタイルは Apache + mod_perl + MySQL で、
最近PHPに挑戦中です。
くろだ
やー、どうもです。
> iframeなどによるアクセスをユニークユーザ数からフィルターアウトするのって、やはり技術的に難しいんですか。
あくまで私の推測している形でのユニークユーザ数算出をおこなってい
るのなら、iframeの検出は簡単にはできないですね。本文にも書いてい
る形で、後から調べることはできますが、マシン的なリソースが相当い
ると思われます。また、新たなiframe対策をおこなったユニークユーザ
数算出システムの構築・テストにはさすがにこの短期間では作れないで
しょうね。
そう考えると、今回のメンテがこの対策に関するメンテだとは思えない
んですよね。どちらにしても、なんらかのアナウンスはして欲しいと思
いますが...。
miccckey
こんばんは。
私はこの手のことのテクニカル面に決して詳しいわけじゃないんですが、ユニークアクセスだけを基準とするランキングには、どうしてもこの問題が付随するということのようですね。
iframeなどによるアクセスをユニークユーザ数からフィルターアウトするのって、やはり技術的に難しいんですか。そこまでライブドアが本気で取り組んでくれるかなあ・・・。
早朝メンテは、実はまったく別の目的のメンテだったなんて落ちもあったりしそうですが(笑)
くろだ
ご、ごめんなさい、ちょっと無神経な発言でした。
ちょっと修正します...。ホントスンマセン!
buu*
まにあな日記もやっている僕ですが、三菱東京UFJ銀行の名称変更をお願いするブログもやっている僕なので、
>【探し物/消息】カテゴリってまともなサイトがランキング
>に入っていなかったんですけど
と書かれちゃうとちょっと悲しい(;_;)
いや、まともなブログではないんですけどね(^^;