ついにイーロンマスク氏がツイッターを買収しましたね。マスク氏は「スパムボットを駆逐する」と発言しており、いかがわしいスパムDMや迷惑リプが減ってくれることを祈りばかりです。

また、グーグルに関しては、先月と同じく変動があるものの公式としてアップデートのアナウンスはしていません…。
ゴールデンウィーク前後に何か動きがあるのでしょうか?注目ですね。

言語理解の処理「MUM」の利用が広がる

去年の5月に、新しい言語処理の技術として「MUM(マム)」の存在を発表しました。

▼過去記事でも紹介しています。
【2021年7月最新版】6月のSEOトレンドやニュースまとめ

当時は、新型コロナウイルスのワクチンに関する情報の精度を向上させる目的で検索結果にも適用されるようになりました。

今回は、「生命に関わるクエリの検出精度を上げる」とのことです。

鈴木謙一さんのブログでも紹介されており、
たとえば「自殺 簡単」などと検索をかけると、

a03c45e7d140186f907cc7daf3e74be3

のように表示がされています。

DVや自殺など、気持ちが詰まってしまっている状態では、クエリにその状況が反映されないことも多いです。

そのような検索クエリからは、読み取りにくい検索意図を明確に検出するために、MUMが活用されるようです。

スパムの排除にもMUMが活用される

言語処理の技術であるゆえに、MUMは現在75種類の言語をサポートしています。

MUMの優れているポイントは、どれか1つの言語で学習すれば他の言語に応用できる点です。
言語ごとに同じ概念を学習させる必要がありません。

言語による依存が低い点も優秀で、今後世界中のGoogle検索におけるスパム抑制に活躍してくれることでしょう。

新しいサイトの発見には外部リンクが最も確実!!

「新しくサイトを立ち上げた際に新規コンテンツをグーグルにインデックスしてもらうには何がベストなのだろうか?」と考えることはありませんか?

サーチコンソールから、サイトマップを送信しますか?インデックスのリクエストを送りますか?

どれも間違ってはいませんし、正解であるとは思いますが、そんな悩みに朗報が。

3月下旬に行われたSEO Office Hours にて、ジョンミューラーが答えました。

SEO Office Hours

インデックス登録をリクエストすることに不利な点はないが、何のシグナルも情報もない新しいサイトだとしたら、少なくとも URL を伝える取っ掛かりにはなるとしても、その URL を Google が取得する保証はない。

知り合いに頼んで、その人のサイトからリンクを張ってもらうのがいい。

質問者のことをジョンは知っていたため、少しジョーク要素も入っているようです。ただ、グーグルに新しいサイトを発見してもらうには外部リンクの方が、リクエストよりも役に立つようです。

ちなみに、サーチコンソールにて外部リンクがサポートされるには、1週間〜1週間半程度が妥当なタイミングだそうです。

グーグルビジネスプロフィールを活用してSDGsへの意識を

Googleは、グーグルビジネスプロフィールの欄へリサイクルへの対応を追加しました。

背景として、地域社会によるリサイクル活動が世界中のSDGs活動へとつながること。その上で、従来はリサイクルをしたくても、「どこで何をリサイクルできるのか?」ということが明記されている店舗や企業は少なく、不透明でした。

あくまでも特定の企業に限りますが、今回のアップデートによって、リサイクルへの対応状況を登録できるようになりました。

設定ができるのは、下記になります。

  • バッテリー
  • ビニール袋
  • ペットボトル
  • 衣料品
  • 缶類
  • 電球
  • 電子機器
  • 瓶類

設定を行うとことで、検索やグーグルマップに表示されるようです。

203fd33c3cab2d2b6b454eb7d08e7087

ユーザーにこのマークの意味や認知は今後必要になると思いますが、仮にお店を利用するケースがなくても

企業としての意思表示にもなるため、印象が良くなるかもしれません。

AIが作ったコンテンツとSEOの未来

近年のAI技術は目まぐるしいものがあり、時に人よりも優れた要約能力を発揮することがあります。

「実用的」と線を引くラインは難しいですが、筆者もそういったテキスト生成ツールをつかったことがあります。「え、普通に良い感じかも」という感想でした。

特に、記事数が多くなるメディアサイトなどの運営者によっては既にAIコンテンツを導入して、うまくいっている。という話もきいたことがあります。

ただ、Googleは自動生成コンテンツをランキング操作の目的に使用する場合、ガイドライン違反としています。

AIの自動生成テキストなどはどう扱われるのでしょう?

ジョンミューラーはこう言います。

私たちにとっては、AI が書いた記事は、本質的には自動生成コンテンツの範疇にやはり分類される。人々はいろいろな手段でコンテンツを自動生成しようとするが、AI ツールを使ってコンテンツを作っていたとしても、昔からやられていたような、単語の順番を入れ替えたり同義語に置き換えたり翻訳したりといったようなことをしているなら、本質的には変わらず、ガイドライン違反だ。

昔のツールよりもコンテンツの品質は AI の方が良くなっているかもしれないが、依然として自動生成コンテンツであり、ウェブマスター向けガイドラインに違反する。スパムとみなすだろう。

とのことです。

では、どうやってAIコンテンツと判断するのだろう?

そもそも、我々も人間が書いたものとAIが書いたものを判別することが難しいと感じます。

Googleのアルゴリズムはそのような判断ができるのでしょうか?

識別できると断言はできない。しかし、自動生成らしき痕跡があればウェブスパムチームは間違いなく対策できる。

とジョンミューラーはいいます。とは言っても。現実的にはなかなか難しいようです。

自動生成コンテンツが必ずしも悪い用途に使われることではないと思います。状況によっては人員不足であったり、コンテンツの生成に追われてしまうケースがあるとは思います。

優れているコンテンツであれば問題ないのでは?

ダニー・サリヴァン氏は、Public Liaison(パブリック リエゾン)として、Google 検索とユーザーの橋渡し役として活動しています。

サリバン氏はこう発言しました。

純粋にウェブ閲覧者の役に立つために使われているなら、文章の大部分を提案できるさらに高機能なライティングツールはランキングを損ねるべきではない。

コンテンツの主要な目的がユーザーのためであるなら、私たちのガイドラインには抵触しないだろう。AI が生成した記事であっても、最も優れていて最も役立つコンテンツなら検索結果に掲載するのが理想だ。

おっしゃる通りで、いかにも自動生成といったテキストや違和感のあるコンテンツであればユーザーにとっては最悪です。ただ、今までになく分かりやすく、かつ簡潔にまとまっているのであれば、人が作ったコンテンツよりも有益であることは間違いありません。

本当にユーザーにためになるコンテンツであれば、制作フローは問う必要がないですね。

【4月25日】AIコンテンツによる悪質なメールが発生!

先ほどまで、AIコンテンツ絵を擁護するような話をしましたが、直近のSEOニュースとして、悪い例が取り上げられました。※以下迷惑メールを受け取って調査をした方を「被害者」と称しています。

SEOメディア界隈では有名なバリーシュワルツ氏の記事によるものですが、その内容とは、

「弁護士からDMCA申請にまつわる法的要求」という詐欺メールが送られてきたケースだそうです。

メールの内容は、

「私たちのクライアントは、自分の画像がインターネット上で使用および共有されることに満足しています。ただし、適切な画像クレジットは、過去または現在の使用に起因します。」適切な画像クレジットは、「7日以内」にサイトへの「リンク」を行う必要があります。「それ以外の場合は、法的措置を取る必要があります」とメールは続きます。

https://searchengineland.com/beware-of-fake-dmca-link-requests-by-ai-generated-lawyers-383811

とのことです。ざっくりいうと、「あなたが勝手に使っている画像、うちのだよ。画像を勝手に使ってもらうのは嬉しいんだけれど、勝手に使う条件として特定のページにリンクをしてね。さもないと法的措置をとりますよ。」

といった内容です。

Webにおける画像のライセンスに関してはシビアな話ですので、一般的な企業であればソースが明確なフリー素祭や有償素材を使うことが多いでしょう。

また内容自体も一瞬慌てますが、ありがちな内容に不自然な脅迫メールです。(DMCA申請においていきなり弁護士からメールはこない・基本的に侵害を犯している側にはGoogleから連絡がいくはず。侵害を犯した経験がないため掲載されている情報のみで恐縮です。)

恐ろしいのはここからで、内容を掘り下げたところ、アーサーダビットソン法律事務所からメールが送られてきたことが判明。また、ドメイン名は今年登録されたものの、サイトは何年も前からあるという主張をしているようです。

さらに被害者はメールを送ったとされるニコール・パーマーという人物のプロフィールを掘り下げていきます。

彼女(ニコール・パーマー)は存在しない人物でした。サイトに掲載されている人物画像は全てAIがディープラーニングにより生成されたものだったのです。下記画像参照。

AI

よくみると、

  • 左右の耳の位置が異なっている
  • イヤリングが左右非対称
  • 眉毛の形も左右非対称
  • 細かく言えば、髪型も若干左右非対称

など言われてこそ感じる違和感が生まれます。

正直、人によっては耳の形や位置も異なりますし、アクセサリーはバラバラ、メイクの癖、アシンメトリーなヘアスタイルなど、どのケースもあり得なくはないです。

怖いのは、あり得なくもないレベルでの誤差で済んでしまっている点です。

悪質なプレイヤーたちは非常にワイルドで高度な戦略を駆使しているのですね。恐ろしい。被害者の方が非常に根気強く掘り下げた結果としてこれがAIの生成した架空の弁護士だと理解できました。

また、フリー素材であれば、画像検索によって人物の特定を判断できる可能性もあります。今回は、有逸無二のAI生成オリジナルの画像です。よほど解析しないと分かりません…。

記事内で、バリー氏も締めくくりに伝えていますが、「怪しい・不自然なメールには注意すること。オンラインスパムはAIの発達により、クオリティ・質が高くなっています。目にするすべての電子コンテンツに疑問を持ち、疑問の持ち方も洗練していく必要があります」と。

デジタルリテラシーに近いですが、日頃より常に疑問を持つことが大切です。また目の付け所も時代に合わせてアップデートをしていかなければなりません。

YMYLアルゴリズムという概念が存在する

検索品質評価者向けのガイドラインにあるように、たとえばYMYLジャンルのサイトでは、より厳格なアルゴリズムを用いてクロール・インデックス・ランク付けしていることもある。

https://www.youtube.com/watch?v=lMc456P2fLs&feature=emb_logo

恒例のGoogle Office Hoursにてジョンミューラーが話していました。

話題のE-A-Tについても、「E-A-Tアルゴリズム」や「E-A-Tスコア」というものは存在しない。だが、「E-A-Tが高いと感じる度合い」というものを複数のアルゴリズムを用いて評価しているとのことです。

つまり、

・YMYL系以外では使われないアルゴリズムが存在

・YMYL系以外のクエリよりも評価基準が厳しい

と解釈できるでしょう。

ドメインパワーなどに左右されやすいジャンルでもあり、コンテンツだけではどうにもならない気もしますが…。足りないコンテンツや構造化データなど傾向を考えていれば、何かみえてくるかもしれません。

直近のWeb担でも取り上げられています。

まとめ

AI時代の波が来つつも、考えている以上に悪い方面でも活用されているケースが多々あるようです。

「疑う」という能力すら向上させていく必要がありますね。

この記事が多少なりとも、お役に立てばと思います。
記事を読んで不明な点等がありましたらお気軽にTwitter(@kaznak_com)などでご質問ください。

ではまた。