2022-04-07

「吹雪」Google画像検索結果 9年間の変化

検索エンジン

Google画像検索[吹雪]。いつの間にかに大半が自然の吹雪になってた。いつからだろ。 pic.twitter.com/YpiyC9K2Xf
— 辻正浩 | Masahiro Tsuji (@tsuj) 2022年4月6日

ということで調べてみました。

f:id:t-w-o:20220407024038p:plain — 2013/6/29艦これリリース直後

f:id:t-w-o:20220407024232p:plain — 2013/10/29 この日、初めて下位に艦これ吹雪が登場

f:id:t-w-o:20220407024339p:plain — 2014/2/1 徐々に順位を伸ばしてやっと一画面目に表示

f:id:t-w-o:20220407024456p:plain — 2014/5/2 順位は不安定で落ち込んだりもしましたが

f:id:t-w-o:20220407024633p:plain — 2014/9/3 まだ10位前後をさまよっている、と思うと何故か2位に羽黒が

f:id:t-w-o:20220407024836p:plain — 2014/11/5 その変化は突然に

f:id:t-w-o:20220407024914p:plain — 2014/11/9 訪れた！ゲームリリースから一年半強で一位に表示

f:id:t-w-o:20220407025015p:plain — 2014/11/9 この段階では、下位では艦これが占拠を始めようとしています。

f:id:t-w-o:20220407025317p:plain — 2015/1/8 この日は吹雪を主人公とするテレビアニメ版艦これの放送開始日。画像検索結果はそれほど変わりません。

f:id:t-w-o:20220407025500p:plain — 2015/1/19 と思ったら急に増え始めます

f:id:t-w-o:20220407025621p:plain — 2015/1/23 急増。テレビアニメ影響がネット上に様々な形で出始めたからでしょう。

f:id:t-w-o:20220407025711p:plain — 2015/1/30 上位はほぼ占拠。テレビアニメ放送開始後3週間強でこの変化です。

f:id:t-w-o:20220407025808p:plain — 2015/2/7 まだ検索結果は不安定ですが

f:id:t-w-o:20220407025911p:plain — 2015/3/8 この頃にはもうほぼ上位占拠。

f:id:t-w-o:20220407030008p:plain — 2015/3/24 テレビアニメ最終回放送直前には初めて1画面目占拠が確認。

f:id:t-w-o:20220407030104p:plain — 2015/4/28 ときどき自然現象が交じるものの、1ページめはほぼ艦これ、という状態がこれからしばらく続きます

f:id:t-w-o:20220407030238p:plain — 2015/8/13 変わりません。

f:id:t-w-o:20220407030340p:plain — 2016/1/4 ほぼ変わらないままです

f:id:t-w-o:20220407030435p:plain — 2016/6/1 ほぼ変わらないまま安定しています。

f:id:t-w-o:20220407030523p:plain — 2016/12/31 変わりません。

f:id:t-w-o:20220407030637p:plain — 2017/6/5 変わりませんね。

f:id:t-w-o:20220407030711p:plain — 2018/6/3 1ページめに2項目だけ、艦これではなくアズレンが出ていますが、基本は変わりません。

f:id:t-w-o:20220407030928p:plain — 2018/9/26 ここまであまり変化ありませんがつぎで変わります

f:id:t-w-o:20220407031022p:plain — 2018/9/29 ここで検索結果のUIが大きく変化します。タイトルリンクが出ましたね。

f:id:t-w-o:20220407031403p:plain — 2018/10/19 全体傾向は変わりませんが、ここで2位に改二が登場。最初からずっと上位にいた初期型を抜かします。

f:id:t-w-o:20220407031155p:plain — 2019/1/8 構成要素はあまり変わりません。

f:id:t-w-o:20220407031622p:plain — 2019/6/3 あまり変わらないように見えつつ、Amazonや大手サイトが中心になっていることが確認できます。

f:id:t-w-o:20220407031859p:plain — 2019/12/3 あまり変化ありません。

f:id:t-w-o:20220407031935p:plain — 2020/6/2 変化ありませんね。

f:id:t-w-o:20220407032009p:plain — 2020/12/1 変化無しです

f:id:t-w-o:20220407032126p:plain — 2021/2/25 このあたりで自然現象が下の方に見え始めます

f:id:t-w-o:20220407032219p:plain — 2021/4/2 徐々に艦これ以外が増え始めています。

f:id:t-w-o:20220407032302p:plain — 2021/4/17 3割くらいが自然現象に

f:id:t-w-o:20220407032338p:plain — 2021/5/17 自然現象率が高まってきています。

f:id:t-w-o:20220407032417p:plain — 2021/6/7 半分が自然現象に

f:id:t-w-o:20220407032506p:plain — 2021/6/17 自然現象率が8/12

f:id:t-w-o:20220407032612p:plain — 2021/7/8 このあたりから、ほぼ安定を始めます。

f:id:t-w-o:20220407032656p:plain — 2021/8/1 ほぼ変わりません。

f:id:t-w-o:20220407032817p:plain — 2021/9/5 このあたりで私の記録方法を変えてスマホUIに変更しています。上位表示されている画像傾向はあまり変わりません。

f:id:t-w-o:20220407032926p:plain — 2021/11/3 変わりませんね。

f:id:t-w-o:20220407033019p:plain — 2021/12/18 全体的に自然現象率が高まりました

f:id:t-w-o:20220407033100p:plain — 2022/2/4 上位表示の殆どが自然現象になってきました。

f:id:t-w-o:20220407033134p:plain — 2022/3/6 大きくは変化していません。

f:id:t-w-o:20220407033209p:plain — 2022/4/6 最新です。

ということで、徐々に変化した感じでした。

2017-12-04

「対馬」検索結果から見るGoogleの意味認識の激しい進化

検索エンジン

検索エンジンは進化を続けています。その中で、特にここ数年で進化が著しいのは「意味」の認識だと私は考えます。

文字列一致を中心にした検索エンジンでは今のインターネットに対応出来ませんので、今日の検索エンジンは、検索された検索語句やWebページの意味を識別した上で検索結果を作っています。

その意味認識の進化の例としておもしろい検索結果が確認できましたのでご共有です。

これは[対馬]の検索結果の3週間での変化です。

f:id:t-w-o:20171204075350p:plain

これはGoogleの意味認識の異様な精度を表すものとして興味深いのですが、複雑ですので少し解説を書いてみます。

前提：[対馬]検索のニーズの変化

「艦隊これくしょん」というゲームがあります。旧日本軍の軍艦を擬人化したキャラクターによるシミュレーションゲームです。

このゲームで11月17日から始まったイベント「捷号決戦！邀撃、レイテ沖海戦(前篇)」で、新キャラクター「対馬」が登場しました。

f:id:t-w-o:20171204080109p:plain

多くの人にとって「対馬」というと長崎県の対馬でしょう。[対馬]という検索で求められる主な情報も地名としての対馬の情報ばかりだったはずです。

しかし11/14に艦これの対馬実装が発表されてからは、このキャラクターや元ネタとなる船の対馬の情報を求める検索が増えました。シンプルだった情報のニーズが、複雑になったのです。

さらにその複雑さに輪をかける事として「対馬」という船は3隻ありました。

今回の艦隊これくしょん登場キャラ「対馬」は1942年に起工した海防艦対馬のキャラクターですが、他に1901年に起工した「防護巡洋艦対馬」と1990年に起工された海上自衛隊の「掃海艦つしま」があったのです。

そしてこの3隻で「海防艦対馬」だけはWikipediaにページが存在していません。これは対馬_(曖昧さ回避)ページですが

f:id:t-w-o:20171204081414p:plain

このように、多くの人が情報を求めるようになった「海防艦対馬」はページが存在していなかったのです。(12/5 4:30追記:海防艦対馬のページは11/24に新規作成されていたようです。作成されたばかりでGoogleが評価していなかったようですね)

Googleの意味／エンティティ判断には、Wikipediaが大きな影響を与えていると推測されます。そのWikipediaには正解が無い状態で情報のニーズだけが増えた、という特殊な状況が今回発生したのです。

この同じ名前の2隻は70-100年前の船で、情報の多くは失われてあまり伝わっていませんし、インターネット上にもあまり記載されていません。その同じ名前で検索がされたときに、どちらの船の情報が求められているかを判断する、というのは、極めて難しいはずですが、Googleはどのように処理したのでしょうか。

検索結果の変化

この状況での検索結果の変化が冒頭で出したものです。

実際の検索結果には、艦隊これくしょんのキャラクター紹介ページが入ってきましたが、問題は右カラムのパネルを見てください。

f:id:t-w-o:20171204082054p:plain

11/17にキャラクターが実装されて検索ニーズが増えた結果、一度はWikipediaページを元に「対馬(防護巡洋艦)」を表示しますが、その後数日で、海防艦対馬の英訳「Japanese Escort Ship Tsushima」を表示しました。

ここが英語になっているのは、日本語の「海防艦対馬」のページは12/4現在存在しませんが、英語版やフィンランド語、インドネシア語、ペルシャ語のページは存在していて、英語版を情報元として使ったからだと考えられます。

対馬という検索が増えたもののその意味を明確に言語化するページが存在しないため、英語版ページを表示したということになります。

対馬(海防艦)と対馬(防護巡洋艦)は全く違う船ですが、多くの人にはその違いはわからないでしょう。にも関わらず、[対馬]という検索の意味がどちらを示しているのか、Googleはアルゴリズムで判断できていると言えます。

通常、日本語検索のこの部分には英単語は出づらいものです。曖昧な意味認識でしたら何も出さないか、Wikipediaにページがある防護巡洋艦を出し続けていたはずですが、Googleは明らかに防護巡洋艦ではない、と判別できたのでしょう。

Wikipediaを参考にしていることは確かですが、Wikipediaだけを重視するわけではなく色々なデータを元に判断が出来ていると言えます。

このように判断できた理由は、シンプルなものではないはずです。掛け合わせて検索されるキーワードの変化や、世界中のWebページに発生する文言などを元に総合的に検索キーワードとWebページの意味を判断をしていると思われます。

この意味認識は右のパネルだけではなく実際の検索結果にも大きく影響をしています。そのように高度な意味の認識を元に検索意図に合う情報を検索者に届けているのが現在の検索エンジンです。

進化する検索エンジン

普通に検索していると、知りたい情報が表示されるのが当たり前のように思えてきます。ただ今回のように裏では非常に高度な処理が行われていることも多いです。

このような高度な意味の認識はGoogle以外の検索エンジンは出来ていませんし、3～4年前のGoogleでも出来ていなかったはずです。

最近、検索結果に色々な問題があることが良く言及されるようになりましたし、それはその通りと思います。ただますます複雑になるインターネットの中で、着実に検索エンジンも進化を続けていることも確かと思います。

価値と問題の両方を把握していきたい、と私は思います。

2016-01-14

EC購買商品をGmail経由で検索結果に反映されるように

検索エンジン

Googleの検索結果でECで購入した商品がGoogleの検索結果に表示するテストをしているのを確認しました。

(2016/1/14追記：Gmailを使っていて直近でEC利用した人の多くに出ているようです。これはテストではなく全体に反映された仕様のようですね。)

f:id:t-w-o:20160114014631p:plain

ECで購入した後にGmailで受信した購入データをGoogleが解釈して、そのGmailのGoogleアカウントでログインしているときだけ表示されているようです。

f:id:t-w-o:20160114014616p:plain

最初にこのように、

「Gmailに最近購入した商品に関する情報があります。」

「この結果は自分だけが閲覧できます。」

という表示とOKボタンが現れます。

OKボタンを押すと、商品が表示されます。

f:id:t-w-o:20160114014633p:plain

スマホでも同様に表示されます。

f:id:t-w-o:20160114014842j:plain

直近で購入したECはヨドバシカメラとAmazonだけですが、この2つでは表示されました。

Amazonでもこのように表示されます。

f:id:t-w-o:20160114014613p:plain

なお、ECショップ名だけではなく、購入した商品名や型番で検索しても表示されます。

f:id:t-w-o:20160114014625p:plain

f:id:t-w-o:20160114014627p:plain

商品名部分はリンクになっていて、そこをクリックするとなぜか[注文(2016/1/14)]というキーワードの検索結果に飛ばされます。

f:id:t-w-o:20160114014629p:plain

これはどう考えても有益な検索結果ではありませんし、おそらくはGoogleのミスなのでしょう。本当は、Gmailにリンクする仕様なのでしょうか？

この仕様は、ユーザとしてで非常に便利なものではないと思いますし、SEOとしても特になにか考える事もないとは思います。

しかし、二重買い防止にもなるでしょうし、「お店のサイトに行って注文した商品の状況を知りたい」と店名で検索することは多いのでそういう時にはとても便利ですね。

こういう仕様はPC共有時にさまざまな悲喜劇が考えられますが、今のGoogleの仕様を考えますと自分のIDでログインしたPCを人に貸すべきではないですし、それを防ぐためのChromeのユーザ切り替え等も便利になりました。

もっと検索結果が便利になりつつ、変なトラブルをおこなさないように注意して使っていきたいものですね。

(以下2016/1/14 11時追記)

この仕様はECだけではなくいろいろと拡大しているようですね！

エアラインでも出てきた。cc: +辻正浩 https://t.co/vJKddhfUZ6 pic.twitter.com/ZtbffLw63t
— Kenichi Suzuki; 鈴木謙一 (@suzukik) 2016, 1月 14

@tsuj こんにちは。参加イベント情報も出るんですよー。ご参考までに。 pic.twitter.com/1UWpDzC81k
— Tsuyoshi Yonemoto (@yoneapp) 2016, 1月 13

2015-07-19

body要素内のnoindex実験結果

検索エンジン

<a href="http://tsuji.hatenablog.jp/entry/search-engine/noindex-test" data-mce-href="http://tsuji.hatenablog.jp/entry/search-engine/noindex-test">body要素内でもnoindexは有効？ - 辻正浩のはてなブログ</a>tsuji.hatenablog.jp

このブログで、body要素内にnoindexを入れる実験をしていたのですが、3週間たったので終了。

body要素内にnoindexを入れてから3週間、上記記事はインデックスされなかったので、やはり確実に効いていたのかと。

やはり以前と変わらず、既存インデックスはnoindexの付与だけで早々に既存インデックスが消えることは無いですね。3週間待って、75から56に減っただけでした。

f:id:t-w-o:20150719191430p:plain

早々に消したければ、noindexの付与のみではなく、Search Consoleからの「URLの削除」が必要です。

こんな実験をやるようなブログですので急いでインデックス回復させる必要もないのですが、一応トップページのFetch as GoogleとXMLsitemapの再送信を完了。

はてなブログのXML サイトマップは、Googleが推奨する方法のrobots.txtでの自動送信されているので通常はsitemapを意識する必要はありませんが、このようなイレギュラーなときは再送信するとほんの少しは早くなるかと思います。まぁfetchのほうが確実ですが。

2015-06-28

body要素内でもnoindexは有効？

検索エンジン

<a href="http://web-tan.forum.impressrd.jp/e/2015/06/26/20266/page/1" data-mce-href="http://web-tan.forum.impressrd.jp/e/2015/06/26/20266/page/1">ホントに！？ noindexタグはbodyセクションのなかでも有効 | 海外&国内SEO情報ウォッチ | Web担当者Forum</a>web-tan.forum.impressrd.jp

noindexはbody要素内でも有効という事、知らなかった。

どうしてなんだろう？canonicalなど、head要素でしか通用しない部分はあるのに、どうしてnoindexは全体で反映されているんだろう？

しかし、これが本当に反映されるのかは試さないとわからないので、ひとまずこのブログの全ページのbody内にnoindexを加えてみました。

どうなるのか確認。