じじぃの「マリリン・モンロー」検索

ITホワイトボックス・選「WEB検索はなぜ速いのか?」 6月21日 NHK教育
【ゲスト】国立情報学研究所 高野明彦教授 【司会】森下千里高市佳明アナウンサー
ホワイトボックス 1 : クローラ
検索サービスを行う会社では、世界中のWEBページを自社のデータセンターに保存しており、それを調べることで検索結果を出しています。このため検索結果は高速で表示されるのです。WEBページを集めているのが『クローラ』と呼ばれる自動化プログラム。クローラはリンクをたどりながら世界中のWEBページを閲覧し、自社のデータセンターのサーバーにその情報を保存しています。
ホワイトボックス 2 : ページランク
WEB検索をすると時には数千万という大量な数の結果が表示されます。膨大な検索結果からユーザーが求めるものをうまく選び出し表示の上位に並べることは出来ないか、その基本となるアイデアが、ローレンス・ページとサーゲイ・ブリンが生み出した『ページランク』です。リンクされる数が多いページは、より多くの人々が求めていると判断し、検索結果の上位に表示させようという考え方で、ほとんどの検索サイトで使われています。
ホワイトボックス 3 : パーソナルサーチ
いつ誰が検索しても同じ結果しか得られなかった従来の検索に対し、検索した人の趣味やし好を反映した結果を返すのが『パーソナルサーチ』。
例えば、同じ「かぐや」という言葉でも「昔話かぐや姫」「月周回衛星かぐや」「家具屋さん」など、欲しい情報は人によって異なります。そういったユーザーひとりひとりで異なる要求に応じた検索結果を返すのがパーソナルサーチです。 パーソナルサーチは今研究途上で実用化されていません。
http://www.nhk.or.jp/itwb/workshop/5.html
どうでもいい、じじぃの日記。
ITホワイトボックス・選「WEB検索はなぜ速いのか?」を観た。
じじぃなりに理解した。
マリリン・モンロー パンチラ」をキーに検索してみた。(google検索)
へへへッ。(^^;
検索結果。
マリリン・モンロー パンチラ の検索結果 約 6,580 件中 1 - 10 件目 (0.19 秒)
    ・
0.19 秒!! すごなぁ。
「クローラ」
検索エンジンはグーグルのデータサーバで「マリリン・モンロー」で検索し、「マリリン・モンロー」リストを作る(インデックスを作る)。その中から「パンチラ」を探す。
ページランク
検索した結果をよく閲覧されている順序に並べる方法。
ウェブページの中にあるリンク数にもとづく検索が多いところからのものを上位にもっていく。
「パーソナルサーチ」
マリリン・モンロー」の場合は、大体スケベ親父、じじぃが検索してしているのだろうが、これだけだと分からない。
マリリン・モンロー 七年目の浮気」の場合は検索したユーザーが、マリリン・モンローの映画ファンだということが類推される。が「マリリン・モンロー パンチラ」はH(エッチ)検索ということが類推できる。だもんで、マリリン・モンローのパンチラを見たい時は、「マリリン・モンロー 七年目の浮気」で検索して、その結果に出てくるパンチラを見るのが賢いやりかたである。(女房にばれない)
この「パーソナルサーチ」は中国共産党で開発済みなのかもしれない。
天安門 パンチラ」では見て見ぬふりをして、「天安門 アムネスティ」では連行されたりして。