辻正浩のはてなブログ

せっかくだから俺はこのはてなブログを選ぶぜ

「対馬」検索結果から見るGoogleの意味認識の激しい進化

検索エンジンは進化を続けています。その中で、特にここ数年で進化が著しいのは「意味」の認識だと私は考えます。

文字列一致を中心にした検索エンジンでは今のインターネットに対応出来ませんので、今日の検索エンジンは、検索された検索語句やWebページの意味を識別した上で検索結果を作っています。

その意味認識の進化の例としておもしろい検索結果が確認できましたのでご共有です。

これは[対馬]の検索結果の3週間での変化です。

f:id:t-w-o:20171204075350p:plain

これはGoogleの意味認識の異様な精度を表すものとして興味深いのですが、複雑ですので少し解説を書いてみます。

 

前提:[対馬]検索のニーズの変化

艦隊これくしょん」というゲームがあります。旧日本軍の軍艦を擬人化したキャラクターによるシミュレーションゲームです。

このゲームで11月17日から始まったイベント「捷号決戦!邀撃、レイテ沖海戦(前篇)」で、新キャラクター「対馬」が登場しました。

f:id:t-w-o:20171204080109p:plain

多くの人にとって「対馬」というと長崎県対馬でしょう。[対馬]という検索で求められる主な情報も地名としての対馬の情報ばかりだったはずです。

しかし11/14に艦これの対馬実装が発表されてからは、このキャラクターや元ネタとなる船の対馬の情報を求める検索が増えました。シンプルだった情報のニーズが、複雑になったのです。

さらにその複雑さに輪をかける事として「対馬」という船は3隻ありました。

今回の艦隊これくしょん登場キャラ「対馬」は1942年に起工した海防艦対馬のキャラクターですが、他に1901年に起工した「防護巡洋艦対馬」と1990年に起工された海上自衛隊の「掃海艦つしま」があったのです。

そしてこの3隻で「海防艦対馬」だけはWikipediaにページが存在していません。これは対馬_(曖昧さ回避)ページですが

f:id:t-w-o:20171204081414p:plain

このように、多くの人が情報を求めるようになった「海防艦対馬」はページが存在していなかったのです。(12/5 4:30追記:海防艦対馬のページは11/24に新規作成されていたようです。作成されたばかりでGoogleが評価していなかったようですね)

 Googleの意味/エンティティ判断には、Wikipediaが大きな影響を与えていると推測されます。そのWikipediaには正解が無い状態で情報のニーズだけが増えた、という特殊な状況が今回発生したのです。

 この同じ名前の2隻は70-100年前の船で、情報の多くは失われてあまり伝わっていませんし、インターネット上にもあまり記載されていません。その同じ名前で検索がされたときに、どちらの船の情報が求められているかを判断する、というのは、極めて難しいはずですが、Googleはどのように処理したのでしょうか。

 

検索結果の変化

 この状況での検索結果の変化が冒頭で出したものです。

実際の検索結果には、艦隊これくしょんのキャラクター紹介ページが入ってきましたが、問題は右カラムのパネルを見てください。

f:id:t-w-o:20171204082054p:plain

11/17にキャラクターが実装されて検索ニーズが増えた結果、一度はWikipediaページを元に「対馬(防護巡洋艦)」を表示しますが、その後数日で、海防艦対馬の英訳「Japanese Escort Ship Tsushima」を表示しました。

ここが英語になっているのは、日本語の「海防艦対馬」のページは12/4現在存在しませんが、英語版フィンランド語インドネシア語ペルシャ語のページは存在していて、英語版を情報元として使ったからだと考えられます。

対馬という検索が増えたもののその意味を明確に言語化するページが存在しないため、英語版ページを表示したということになります。

対馬(海防艦)と対馬(防護巡洋艦)は全く違う船ですが、多くの人にはその違いはわからないでしょう。にも関わらず、[対馬]という検索の意味がどちらを示しているのか、Googleアルゴリズムで判断できていると言えます。

通常、日本語検索のこの部分には英単語は出づらいものです。曖昧な意味認識でしたら何も出さないか、Wikipediaにページがある防護巡洋艦を出し続けていたはずですが、Googleは明らかに防護巡洋艦ではない、と判別できたのでしょう。

Wikipediaを参考にしていることは確かですが、Wikipediaだけを重視するわけではなく色々なデータを元に判断が出来ていると言えます。

このように判断できた理由は、シンプルなものではないはずです。掛け合わせて検索されるキーワードの変化や、世界中のWebページに発生する文言などを元に総合的に検索キーワードとWebページの意味を判断をしていると思われます。

この意味認識は右のパネルだけではなく実際の検索結果にも大きく影響をしています。そのように高度な意味の認識を元に検索意図に合う情報を検索者に届けているのが現在の検索エンジンです。

進化する検索エンジン

普通に検索していると、知りたい情報が表示されるのが当たり前のように思えてきます。ただ今回のように裏では非常に高度な処理が行われていることも多いです。

このような高度な意味の認識はGoogle以外の検索エンジンは出来ていませんし、3~4年前のGoogleでも出来ていなかったはずです。

最近、検索結果に色々な問題があることが良く言及されるようになりましたし、それはその通りと思います。ただますます複雑になるインターネットの中で、着実に検索エンジンも進化を続けていることも確かと思います。

価値と問題の両方を把握していきたい、とわたしは思います。

EC購買商品をGmail経由で検索結果に反映されるように

Googleの検索結果でECで購入した商品がGoogleの検索結果に表示するテストをしているのを確認しました。 

(2016/1/14追記:Gmailを使っていて直近でEC利用した人の多くに出ているようです。これはテストではなく全体に反映された仕様のようですね。)

f:id:t-w-o:20160114014631p:plain

ECで購入した後にGmailで受信した購入データをGoogleが解釈して、そのGmailGoogleアカウントでログインしているときだけ表示されているようです。

 

f:id:t-w-o:20160114014616p:plain

最初にこのように、

Gmailに最近購入した商品に関する情報があります。」

「この結果は自分だけが閲覧できます。」

という表示とOKボタンが現れます。

OKボタンを押すと、商品が表示されます。 

f:id:t-w-o:20160114014633p:plain

 

スマホでも同様に表示されます。

 f:id:t-w-o:20160114014842j:plain

 

直近で購入したECはヨドバシカメラAmazonだけですが、この2つでは表示されました。

Amazonでもこのように表示されます。

f:id:t-w-o:20160114014613p:plain

 

 なお、ECショップ名だけではなく、購入した商品名や型番で検索しても表示されます。

f:id:t-w-o:20160114014625p:plain

f:id:t-w-o:20160114014627p:plain

商品名部分はリンクになっていて、そこをクリックするとなぜか[注文(2016/1/14)]というキーワードの検索結果に飛ばされます。

f:id:t-w-o:20160114014629p:plain

これはどう考えても有益な検索結果ではありませんし、おそらくはGoogleのミスなのでしょう。本当は、Gmailにリンクする仕様なのでしょうか?

 

この仕様は、ユーザとしてで非常に便利なものではないと思いますし、SEOとしても特になにか考える事もないとは思います。

しかし、二重買い防止にもなるでしょうし、「お店のサイトに行って注文した商品の状況を知りたい」と店名で検索することは多いのでそういう時にはとても便利ですね。

こういう仕様はPC共有時にさまざまな悲喜劇が考えられますが、今のGoogleの仕様を考えますと自分のIDでログインしたPCを人に貸すべきではないですし、それを防ぐためのChromeのユーザ切り替え等も便利になりました。

もっと検索結果が便利になりつつ、変なトラブルをおこなさないように注意して使っていきたいものですね。

 

(以下2016/1/14 11時追記)

この仕様はECだけではなくいろいろと拡大しているようですね!

 

 

定期的に読み返す記事

私がもう数年やっていることで、おすすめの事があったのでひとつご紹介。

ブックマークに、「1月1日」「1月1日と7月1日」「1月4月7月10月」というフォルダを作っておいて、読み返すべきと思った記事やツイートを保存しておいて、これを「1月1日」フォルダのものは元日に、「1月1日と7月1日」は1月1日と7月1日に読み返すようにしています。

どんなブックマークでもいいと思いますが、私はこれはChromeブックマークでやっています。同期できますし「全てのブックマークを開く」で一気に開けて楽ですので。

続けるコツは「1月4月7月10月」は三ヶ月に一度なので案外頻繁にやってきます。この辺りはツイートや画像など短時間で読めるURLしか保存しないで、長いものは年1度、年2度のフォルダに入れます。その記事の重要さではなく、読める時間で決めちゃうのが良いかと思います。

私はそんなに沢山保存するわけでもありません。私は合わせて30URL程度。

読み返しをtodoリストに入れてあって、区切り区切りで読むのですが、思いを新たにしましたり、注意しないといけないことを思い出せるのでとてもおすすめです。

今回も1月ですので全URLを読み返しました。 その記事を書いてくださった方、ツイートをしてくださった方に感謝しつつ、いくつかを紹介してみます。

makitani.com 

www.milkstand.net

www.nikkei.com 

detail.chiebukuro.yahoo.co.jp 

necomesi-ceo.hatenablog.com

 

 


ただ困るのは、時々読めない記事があるんですよね。インターネットアーカイブに残っていれば良いのですがそこでも見つからない記事も。

タイトルで思い出しては「あれは良い文章だったなあ」「勇気づけられたなあ」「また勇気づけられたかったなあ」と思ってしまいます。

公開したページを消すときはどうか一度思い直していただければ嬉しいです。あなたの文章を必要としている人がいますので。

外部記憶装置としての私のはてブ使用法

このエントリを読みまして。

jusei.hatenablog.com

私はすっかりはてなブックマークを記憶装置、特に仕事の外部記憶装置として頼っています。

 

SEOの仕事をしていると過去の発表やブログ記事を確認のために見たい事は多いです。「404エラーの影響についてGoogleのJohn Muellerさんが話したことあったと思うけどいつだったっけ?」とかいうときにすぐこうやって情報を見つけられます。こういう時に検索エンジンで[John Mueller 404]とか検索するよりも速くて正確なのです。

ただ、最初のうちはなかなかこの用途で活用できなかったんですが、何度かブクマの仕方を変えてやっと有効な外部記憶装置になってきました。

私は下記あたりに注意して使っています。

  1. あとで見返す可能性がある記事だけをブクマ。
  2. 基本的にタグ名は英単語でブクマ。
  3. 見返すとき、自分のブクマのタグからでは見つからなくて他の方法で見つけたものの既にブクマした記事だったら、自分が探したタグを追加でつけておく(ようにすると、次第に自分が付けるタグも良い感じにしがちになる)。
  4. お気に入りに入れてくれていましたりRSSで読まれている方もいらっしゃるようなので、自分の専門分野の記事は100%同意できる記事以外は非公開ブクマ。
  5. 配信記事などの場合、可能な限り元記事を探してそこをブクマ。
  6. 全く同意出来ないけども見返すかもしれない記事や、拡散すべきではないと思える記事は非公開メタブ。

個人的にポイントと思うのは2番の英単語ブクマ。わざわざ英単語をタグにするのは少数派のようなので「ソーシャル」ブックマークとしては良い使い方じゃないと思うのですが、「炎上」などのように適切な英単語が無い場合以外は英単語をタグにしています。日本語と混ぜてタグ付けすると「公式」タグで探したものの「official」タグをつけていたり、「Status Code」タグで探したものの「ステータスコード」でブクマしてた、などで困ることが多いですので。

あと5、6番は重複コンテンツの苦しみとかを知っているSEO屋なら当然の行為。

 

こんな感じで使っていますと、仕事には欠かせないものになって来ました。いまでは全ブックマークで11,670記事、非公開ブクマで2,468記事が良い外部記憶装置になっています。

ほとんどが仕事関係ですが、誰かと食事に行く時に行ってみたいと思った店を思い出すためとかでも使っています。場所もタグにしておくと、特定の場所で探すとかも便利。問題は「後で読む」よりも増加速度が早すぎて消化速度が遅すぎる事ですが。

こういう外でスマホで探すとき、自分が特定タグでブクマした記事が探しづらいなあと思っていましたので今後進化するのがとても楽しみです!

MSのユニバーサルフォルダブルキーボードはいいぞ

マイクロソフトの携帯折りたたみキーボード、Universal Foldable Keyboard(ユニバーサルフォールダブルキーボード)がかなり素敵なので「今年買った良かったもの」として口コミをご紹介します。
f:id:t-w-o:20151228114005j:image

主にスマホにつなぐためのbluetooth折りたたみ式キーボードです。今年発売したばかり。
 
定価9,980円とそこそこ値段は張るのですけど、携帯性、打鍵感ともにかなりいい感じです。
特に浅めの打鍵感が好きな人でしたらきっと気にいるはず。わたしにとっては主に使っているノートパソコンと同じくらい好きな打鍵感ですね。
 

f:id:t-w-o:20151228114255j:image
折りたたむと12cmの正方形、5mm位の厚さで取り回しはいい感じです。
 
f:id:t-w-o:20151228114205j:image
唯一の難所は、左右のキーボードがこのように分割されていることです。右手でB、左手でNなどを押せません。
タッチタイピングで正しいキーを正しい指で押している人にとっては問題ないのですが、我流の人には厳しいかもしれないですね。
 
打鍵感だけではなくて、複数スマホの切り替えのしやすさや、短時間で良い充電、カバンに適当に放り込める感じの頑丈さ、細かいところもいい感じです。
もともと、マイクロソフトの出すハードウェアってほとんど当たりなんですよね。特にキーボードやマウスで高いものは良いものばかりですので、これも良いキーボードなのは当然かもしれません。
 
今は、外出先で2−30分時間が空いた時とかに出しては軽い仕事メールに活用しています。このエントリも、病院での待ち時間の手持ち無沙汰に書いています。このキーボードとはてなブログアプリでとても快適です。
 
 
昔買ったガジェットを整理していて、モバイルギアポメラが出てきました。
こういうテキストタイプ用ガジェットで、20年前には卒論を書くのに使ってましたし5年ほど前にはセミナーのメモに使っていたのですが、その画面サイズは今使っているiPhone6plusやNexus6とほぼ同じサイズなんですよね。
画面サイズ6インチなどのファブレットを使っている人には良い持ち運びキーボードさえあれば、テキスト打ちはかなり捗るのでぜひ一度見てみてください。

ゲームと癒やし

今週のお題「ゲーム大好き」

最近は忙しくてほぼゲームも出来ていないのですが、以前は廃人一歩手前位にハマっていた時期がありました。特にネットゲームは、Diabloから始まってPSO、Diablo2、UOと渡り歩き、最後に辿り着いたのは「信長の野望Online」。この世界で、2003年から時々休止しつつ2007年までやっていました。

www.gamecity.ne.jp

このゲームでのプレイヤーは、国に所属して他国プレイヤーと時には同盟、時には戦争して所属国で天下統一をめざすという軸がありまして、大規模な集団戦が日常に組み込まれていて中毒性は特に高いゲームです。
私が所属していた国「北条」も別の国「上杉」と戦争をしていたのですが終始劣勢。戦場ではピークでは200人と300人などの人数差で、プレイヤー数が重要な戦争では負け続けです。それでも滅亡を避けるために同じ国の人と知恵を絞っていました。

普通の陽動作戦などは当然の事、人数で大差が付いた時は攻めたい先に事前に囮を送り込んで戦果を求める敵PCを集めることでその付近での処理落ちを発生させて防衛しづらくしてから本隊で攻めて陣地を落とす「ラグ戦法」で太刀打ちしたり。某巨大掲示板でバグ利用と叩かれましたが。

裏の連絡網で深夜4時などの相手が少ないタイミングで大量に集結して一気に巻き返してみたり。そして相手の国がすぐにそういうのにも対応できる連絡網を整備した後は、嘘の集合時間を噂で流したりして対抗してましたり。

サーバ内で撃破例がなかったNPCが守っていた敵陣地を落とす方法を友人が発案して、私も加わってサーバで初めて落としてやっと対抗できるようになったり。その方法はあっというまに広がって同じ方法で自分の国も攻められてまた大変になりましたが。

育成も運用もコストが掛かりまくる当時の最強職業「鉄砲鍛冶」を複数揃えた敵パーティが攻めてくると普通には撃退できず敗北が続いて滅亡か?となったときに、私の使っていた職業のネタスキルと見られていたとスキル「猪突猛進」を特定装備でうまく使うとソロプレイで撃退できることを発見してどうにか滅亡を回避できましたり。戦場でマークされる有名人になったり、やはり2chで叩かれましたりもしましたが。

一時は国のプレイヤー代表みたいな立場になって、戦争指揮(笑)とか外交(笑)とかやるはめになってリアルの人間関係以上に複雑な調整に胃が痛くなってみたり。もう何度目かの2chで叩かれたりもしましたり。

 

負けが続くゲームはやはり殺伐とした事も多かったですし厳しい思いもしました。しかしやはり楽しい時間でした。10時から24時まで会社、25時から6時まで戦争のあと2-3時間眠って出社とかのひどい生活が続いていましたが、それは本当に楽しい時間でした。

MMOから離れた今思いますが、あの世界は楽しいだけではなくて、あの世界に救われていたんだなあ思います。


そのゲームをやっていた頃は仕事が大変な時期でした。立ち上げメンバーだった会社がいろいろとあって倒産か?解散か?という瀬戸際のタイミングだったのです。その過程で書けないような色々な事に巻き込まれまして、人生の中でも2~3番目には辛かった時期でした。
そういう時期をどうにか乗り越えられたのは、私には別の世界があったからだと思います。リアルでは会社が滅亡するか否か、バーチャルでは国が滅亡するか否かというひどい二重生活でしたが、わたしにはあの世界は救いでした。両方がつらい状況でも、両方がその癒やしになっていたように思います。

別の世界で匿名の存在としてコミュニティに所属する事は、つらい現実を持つ人には貴重な癒やしになるという話を聞いたことがあります。多くの人にそのような逃避先があれば、片方の世界であまりにつらいこと、いじめや病気などどうしようもないような厳しいことでも耐えやすくなるのかもしれないと思います。きっとそれはMMOは最適な事の一つでしょうし、ネットコミュニティでも同じ役割を果たすのでしょうね。

 


そんなふうにどうにか生き延びていたものの、結局私の所属していた国は滅亡。その後数ヶ月で再興もしましたが、その頃には私が所属していた会社が滅亡。後処理で仕事が多忙を極めるようになりゲームからも疎遠になってしまいました。

 

MMOに最後にログインしてから8年経ちました。久しぶりに公式サイトを見てみると、PS版はサービス終了してPC版のみになっていました。所属していた国は、国どころかサーバごとなくなっていました。

でも統合された新しいサーバでまだゲームは続いているようです。私がいた頃の最大レベルはLV50でしたが今はlv70まで上限も拡大しています。私のキャラクターの職業にはいっぱい新しいスキルも追加されていました。昔と違って不遇職ではなくなっているようです。

いまもその世界で生きていて、救われている人がいるんでしょうね。必死で自分の居場所を守っている人の事を思うと、あの世界がこのまま続いて欲しいなあ、と思います。

body要素内のnoindex実験結果

tsuji.hatenablog.jp

 

このブログで、body要素内にnoindexを入れる実験をしていたのですが、3週間たったので終了。

body要素内にnoindexを入れてから3週間、上記記事はインデックスされなかったので、やはり確実に効いていたのかと。

やはり以前と変わらず、既存インデックスはnoindexの付与だけで早々に既存インデックスが消えることは無いですね。3週間待って、75から56に減っただけでした。

f:id:t-w-o:20150719191430p:plain

早々に消したければ、noindexの付与のみではなく、Search Consoleからの「URLの削除」が必要です。

 

こんな実験をやるようなブログですので急いでインデックス回復させる必要もないのですが、一応トップページのFetch as GoogleとXMLsitemapの再送信を完了。

はてなブログXMLサイトマップは、Googleが推奨する方法robots.txtでの自動送信されているので通常はsitemapを意識する必要はありませんが、このようなイレギュラーなときは再送信するとほんの少しは早くなるかと思います。まぁfetchのほうが確実ですが。