読者です 読者をやめる 読者になる 読者になる

辻正浩のはてなブログ

せっかくだから俺はこのはてなブログを選ぶぜ

株式会社はてなに入社しました

株式会社はてなに入社しました

株式会社はてなに入社しました - hitode909の日記

画像検索のブレンドが1件にカウントされるように(2014/10)

検索エンジン

検索結果で画像検索結果がブレンドされる場合、1件としてカウントされるように昨年秋に変更されていたことにいまさら気づきました。

 

検索結果1ページの10件は、表示される内容によって1件としてカウントされるかが変わりますが、画像検索結果は昨年9月まではカウントされなかったはずです。それが10月からカウントされるようになっています。

おそらくは2014年10月5日~10月9日の間の変更と思われます。

 

これが2014年10月5日のGoogle[春雨 レシピ]の検索結果。

f:id:t-w-o:20150221182550p:plain

そしてこちらが10月9日の検索結果。

f:id:t-w-o:20150221182818p:plain

いくつかの検索語句の記録を見ましたが、どれもこの間で変わっているようです。

私も今頃気づきましたように、トラフィック影響はほとんど無いはずですが一応の記録です。

 

グイン・サーガの続編

読んだ

12月に本屋に寄った時に、目に入ってきた本のタイトル

グイン・サーガ131巻 パロの暗黒」

あー新刊でてたかー、と一度普通に思ったあとギョっとして2度見、3度見。やっぱりある。

 

130巻の中途で栗本薫さんが亡くなって未完で終わっていたはずのグイン・サーガの最新刊。

おそるおそる手にとって見ると、同じ装丁ですが知らない筆者。

130巻までと全く同じ装丁で、131巻、132巻ともう発売されていたんです。「グイン・サーガ続編プロジェクト」として別の作者が書き継いでいく事になっていました。

 

パロの暗黒 (ハヤカワ文庫JA)

パロの暗黒 (ハヤカワ文庫JA)

 

 

なんというか、凍りました。

 

中2の頃から20年間も毎年数冊づつ読み続けて、2009年に未完で終わった時には非常にショックを受けました。途中で終わっているという最終巻がなぜか怖くて読めないまま4年経っちゃった位。(ショックを当時にブログに書いてました )

 

本の前でこれを手に取るべきか、このままスルーするべきか迷いました。

色々と思い入れがある物語が、作者が変わって続きが書かれているのですから絶対に不満はあるでしょうし、自分の中でも終わったと整理していたものなのでこのまま終わりでいいのかな、とも思いつつやはり気になる所。

 

 

結局購入。

 

 

最新刊を読むためには、まずは読めなかった最終巻を全部読む必要があるのも気合が必要でしたが、20年間親しんだ懐かしい文体にさっと読了。

 

そして、年末年始で131巻を読み始めたのですが、もう予想を超える予想外っぷりにショックを受けるわけで。

しかも「象徴的なストーリー」から話は再開していまして。それがかなり許せない展開で。

キャラクターもセリフ回しもなにか違和感しか感じません……

 

なんというかよく出来た同人誌を読んでいる感じです。これが同人誌なら楽しく読めるんだろうなあと思える面白い小説です。これは公式の「131巻」でなければ、本当に楽しい本でした。

 

このまま読むのをやめて封印すれば心乱される事もなくて一番と思いつつも、二十数年付き合った物語に最後まで付きあおうと読み続けることにしました。

 

このまま数冊読んでいけば納得できるようになるのかなあ。まだわかりません。

 

(ネタ)Googleが扱うページ数が急増?

検索エンジン

Googleが検索の仕組みを説明するために2013年3月に公開した英語版インフォグラフィックがあります。この一部分が8月下旬に更新されていました。

 

海外SEO情報ブログインフォグラフィックの解説を書かれた記事をお借りして見ますと、最初の画面はこうなっていました。Googleが30Trillion、30兆ものページを扱っているという話ですね。

f:id:t-w-o:20130831010343p:plain

これが、今はこう変わっています

f:id:t-w-o:20130831010412j:plain

 

倍増!?

30 trillion から60 trillionになっています。

実際にも相当増えているのでしょうし、計算方法の変化とかもあるでしょうけど、流石に半年経たずに倍増は速すぎるような……

 

ちなみにHTMLソースを見ると、idは「thrty_trillion」のままになっているなど、変更前の名残が残っています。

 

f:id:t-w-o:20130831010557j:plain

 

 

まぁ、30兆でも60兆でも、数え切れない途方も無い数のページを扱っていることは確かです。

このGoogleインフォグラフィックはなかなか面白い内容です。もし見ていない方がいましたら、ぜひご覧ください。

 

 

島風が画像検索結果を進撃していく模様

検索エンジン

 

 

今話題の艦隊これくしょん、艦これの一番人気キャラ、島風(ぜかまし)の画像検索結果の変化です。

 

6月下旬に艦これが大きく話題になり始めた数日後の6/29。

1-7位は駆逐艦島風のまま。8位、11位に艦これが現れました。

f:id:t-w-o:20130801074429p:plain

 

 

10日経って7/10。新規会員登録が停止していたのですが、再開した頃。ネットの話題も再加熱したころです。7位から5に浮上。でも1画面目にはまだ3枚しか艦これ島風はいませんが、3-4画面目を見ると肌色率が急増。

f:id:t-w-o:20130801074610p:plain

 

7月23日。艦これの島風が1位を奪取。3位にも配置されていて、後ろの画面の方はさらに肌色率が急増です。

f:id:t-w-o:20130801074812p:plain

 

そして7/30段階。1-3、5、6、8、9位は艦これに。全体の占有率も50%を突破。

f:id:t-w-o:20130801074117p:plain

 

 

仕事でいろいろな画面を定期的にキャプチャしているので、ついでに軍艦名も入れていましたが、各軍艦名で進撃が続いていますねー。

ただ「長門」はまだまだ出て来ません。元の宇宙人があまりに強すぎます。

それでも、艦これ人気がこのまま続けば、きっとほぼ宇宙人も蹴散らして暁の水平線に勝利が刻まれるのではないでしょうか。

 

Google Quick ScrollというChrome拡張が便利

検索エンジン

 

 

Google公式のChrome拡張、「Google Quick Scroll」というプラグインがありますが、とても便利でした。

f:id:t-w-o:20130513165225j:plain

複雑な検索キーワードで検索してたどり着いたページで、どこに検索したワードがあるかを示してくれます。実際の流れはこんな感じ。

このChrome拡張をインストールしてから、Googleで複雑な検索をしてみましょう。たとえばこんな感じ。

f:id:t-w-o:20130513170039j:plain

 

 

そして検索結果からクリックすると、右下に見慣れないポップアップが。f:id:t-w-o:20130513170043j:plain

 

拡大するとこんな感じです。

f:id:t-w-o:20130513170046j:plain

 

これをクリックすると、スクロールして、検索したキーワードに一致する部分がどこなのかがハイライトされた状態で判ります。f:id:t-w-o:20130513170049j:plain

 

 

とても便利なのでGoogle Chromeユーザの方はぜひ!

 

 

 

Twitterのrobots.txt変更の記録(2013年2月)

ソーシャルメディア

Twitterrobots.txt変更

変更を確認したので、旧新の比較用に保存しときます。

現段階ではまだリロードで変わる場合もありますし、変更途中かもしれません。前回の変更、2012年11月の変更でも、一週間後にもう一度変更しましたので。

大きいのは、「Allow: /search」から「Allow: /search?q=%23」への変更(%23は「#」)。以前は/search以下を全て許可した上でいくつかをブロックしていたものの、Twitter検索ページは/search/# 以下のみの許可+いくつかブロック。

11月からwitterの発リンクからnofollowが消えた事で、一部ハッシュ検索結果などは上位表示が見られていたんですが、それのさらなる改善&無駄クロール節約意図ですかね?

「Disallow: /*/followers」「Disallow: /*/following」といった追加は、確か以前からログイン必須なので無駄クロールにしかなっていなかったので、ブロックは価値があるかと。本来リンク自体が認識できなくなっていればいいのでしょうが。

一方「Disallow: /*/with_friends」ははずれているので今後クロールがかかるものの、canonicalでユーザのページ(私だと twitter.com/tsuj/)へ正規化しているページなので、意図はわからず。もともと内部リンクは無いもののこの規模のサイトだと相当クロールされるでしょうし、また次の更新でブロックが掛かる気もしますが。

あと、半分ネタの「# Crawl-delay: 10 -- Googlebot ignores crawl-delay ftl」も消えましたね。Googleは公式にCrawl-delayは無視すると言ってます。

普通はGoogleに任せるべきですが、多くてどうしようもないならGoogleウェブマスターツールの設定~クロール速度で制御するべき。

 http://support.google.com/webmasters/bin/answer.py?hl=ja&answer=48620

#ちなみに、この変化はTwitterの順位には影響するかもしれませんが、通常のサイトのSEOにはほとんど影響無しのはずですー。

変更内容

新(2013/2版)

#Google Search Engine Robot
User-agent: Googlebot
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

#Yahoo! Search Engine Robot
User-Agent: Slurp
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

#Yandex Search Engine Robot
User-agent: Yandex
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

#Microsoft Search Engine Robot
User-Agent: msnbot
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

# Every bot that might possibly read and respect this file.
User-agent: *
Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following
Disallow: /oauth
Disallow: /1/oauth

# Wait 1 second between successive requests. See ONBOARD-2698 for details.
Crawl-delay: 1

# Independent of user agent. Links in the sitemap are full URLs using https:// and need to match
# the protocol of the sitemap.
Sitemap: https://twitter.com/sitemap.xml

 

 

旧(2012/11版)

#Google Search Engine Robot
User-agent: Googlebot
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

#Yahoo! Search Engine Robot
User-Agent: Slurp
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

#Yandex Search Engine Robot
User-agent: Yandex
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

#Microsoft Search Engine Robot
User-Agent: msnbot
Allow: /?_escaped_fragment_

Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following

# Every bot that might possibly read and respect this file.
User-agent: *
Allow: /search?q=%23
Disallow: /search/realtime
Disallow: /search/users
Disallow: /search/*/grid

Disallow: /*?
Disallow: /*/followers
Disallow: /*/following
Disallow: /oauth
Disallow: /1/oauth

# Wait 1 second between successive requests. See ONBOARD-2698 for details.
Crawl-delay: 1

# Independent of user agent. Links in the sitemap are full URLs using https:// and need to match
# the protocol of the sitemap.
Sitemap: https://twitter.com/sitemap.xml