じじぃの「私をグーグルで検索してください!数学で読み解くあなたの一日」

Google Search Options 動画 YouTube
http://www.youtube.com/watch?v=MtirDMfcOKE
Google 検索ストーリー:おとなになったら 動画 YouTube
http://www.youtube.com/watch?v=msWY2Lt3dFE
ホームページの価値の評価とは:GooglePageRankページランク)の合理性とその意味するもの
http://tokyo.atso-net.jp/index.php?UID=1126521053
『数学で読み解くあなたの一日』 ジェイソン・I・ブラウン/著、田淵健太/翻訳 早川書房 2010年発行
私をグーグルで検索してください! (一部抜粋しています)
グーグルの検索能力には感銘している。少数のキーワードを打ち込むだけで、サイバースペースを探索できる。数秒以内に関連するウェブページのリストが得られ、おおよそ関連性が低くなっていく順番になっている。クーグルの検索エンジンが扱っているページは何十億とあり、その反応はとても速く、とても正確だ。
もちろん、グーグルの検索能力について少し調べてみた。そして、それが完全に数学に依存していることがわかった。グーグルの創設者が持っていた考えは、自分たちの検索エンジンが、要求されるどんなキーワードにも対応して、ウェブページの順位付けを即座に行わなければならないということだった。各ページの順位は、多かれ少なかれ静的な、一般的なページの順位付けで決められ、さらに選ばれた特定のキーワードに対して順位が僅かに修正される。ページ順位の静的な部分では、あるページの順位が、そのページにリンクしている全てのページのページ順位の平均を反映すべきだと考えた(もっともなことだと思うが、その鉄好きでは、あるページに順位を割り当てるとき、そのページからのリンクは無視される。自分のウェブページからのリンクは誰にでも作れるからだ)。
すべてのウェブページのページ順位を知るのは、今日のコンピューターの能力をはるかに上回る莫大な量の計算を必要とするだろう。しかし、少し数学を用いれば、各ページに適当なページ順位を割り当てて始め、そのページ順位を機械に入れて更新することができる。このページ順位の最終的な集合がページの順位の静的な部分になるだろう。これらはすべて行列の個有値と呼ばれるものによって決まる。好きな数を選んで、半分にし、5を足すという規則があると想像してほしい(つまり、この規則は関数f(x)=x/2+5)。数学者が興味を持つことは、この規則で固定される。つまり動かなくなる数はいくつか、だ。1つのやりかたは、式を解いてみることだ(それほど難しくない)。別のやり方は、適当な数に対して規則を当てはめ続けるとどうなるか見ていくことだ。たとえば、32を選んだとすると32/2+5=21。次に、21に対して、21/2+5=15.5となり、その次は15.5/2+5=12.75となり、以下同様に続く。10回後に10.02となり、さらに続けていけば、10にどんどん近づいていくだろう。どの数から始めるのかは重要ではない。
      ・
したがって、求めている数が10なら、この手順を好きな数で初めて、それが落ち着くのを待っているだけでいい。落ち着く先は吸引的不動点と呼ばれる。
ページ順位はこれと非常によく似ている。ただし、求めているのは、ただ1つの数ではなく、ページ順位として必要な数の全体集合だ。その答えは不動点で、簡単な計算だが、世界中のコンピューターの処理能力のすべてを用いても解くことはできない。答えを目指して手続きを繰り返すだけならコンピューターの処理能力(かなりの、と付け加えた方がいいかもしれない)で扱える。特に真の答にお金がかかりすぎるとき、概算は真の答より優れていることがある。

                                      • -

Google PageRank Checker」に適当に「URL」を入れて検索ボタンを押してみた。
     ↓
http://www.google.co.jp/        →  ページランク 8  (グーグルのURL)
http://www.yahoo.co.jp/        →  ページランク 8  (ヤフーのURL)
http://www.asahi.com/         →  ページランク 8  (朝日新聞のURL)
http://d.hatena.ne.jp/         →  ページランク 7  (はてなのURL)
http://mixi.jp/              →  ページランク 7  (ミクシィのURL)
http://toyota.jp/            →  ページランク 7  (トヨタのURL)
http://www.sony.co.jp/         →  ページランク 6  (ソニーのURL)
http://www.marubeni.co.jp/      →  ページランク 6  (丸紅のURL)
http://www.city.togane.chiba.jp/   →  ページランク 5  (東金市のURL)
http://ameblo.jp/takapon-jp/     →  ページランク 5  (堀江貴文のブログ)
http://yoshiko-sakurai.jp/       →  ページランク 5  (櫻井よしこのブログ)
http://ameblo.jp/koizumi-shinjiro/  →  ページランク 4  (小泉進次郎のブログ)
http://www.u3music.com/       →  ページランク 4  (宇多田ヒカルのブログ)
http://d.hatena.ne.jp/cool-hira/   →  ページランク 4  (どっかのじじぃのブログ)
http://gigazine.net/           →  ページランク 3  (ギガジンのURL)
どうでもいい、じじぃの日記。
先日、図書館から『数学で読み解くあなたの一日』という本を借りてきた。
日常生活ではほとんど数学を意識しないで生活している。
しかし、車の中でラジオを聞いていて「ただいま正午をお知らせします」というと同時に車に表示されている時刻が「12:00」に変わるときは感心してしまう。よくわからぬが、この時計にGPS機能が付いているかららしい。
本をぱらぱら、めくったら「私をグーグルで検索してください!」があった。
「グーグル検索」して表示される「PageRank」のことが書かれている。
PageRank」はホームページの価値の指標であり、そのページの価値が高いと判断されると上位に表示される。
「このページ順位の最終的な集合がページの順位の静的な部分になるだろう。これらはすべて行列の『個有値』と呼ばれるものによって決まる」
ネットで検索する検索エンジンはほとんどグーグルでやっている。ネットで検索することを「ググる」ともいう。
検索した結果はほとんど瞬時に表示される。驚異的なレスポンスだ。
ふう〜ん。「行列」を使っているのか。
PageRank」を調べていて今回、初めて「Google PageRank Checker」なるものを知った。
http://pagerank.bookstudio.com/
自分のURL(ブログのアドレス)を入れてみた。ランクが4に表示された。
グーグルとかヤフーのURLはランクが8だ。櫻井よしこさんのURLはランクが5になっている。
ネットで「人気ブログ」をキーに検索すると「ギガジンのURL」がトップ表示される。このURLを「Google PageRank Checker」に入れたらランク3が表示された。
ギガジンのランクがどっかのじじぃのブログよりランクが下なの?
ふう〜ん。よくわからぬ。