2020.6.22特集

つぶやきがご近所を救う?ウィズ・コロナ時代の羅針盤

新型コロナウイルス関連の情報が巷(ちまた)にあふれている。有用な情報や、真に助けを必要とする声もある一方、デマやフェイクニュースも相当数あり、社会問題化している。
日本では緊急事態宣言が解除されてもなお「第二波」への警戒もあり、当面辛抱の時期は続いているが、都道府県ごとに緊急事態宣言が出されたように新型コロナウイルスへの対策は地域特性によって細やかな対策が必要だ。自分が、家族が住む地域の今、そして他の地域と比べて何にどんな手を打たなければならないか、その「気づき」につぶやきが大きな力になる可能性を秘めているのではないか。

1日100万件のツイートから地域特性を導く

2020年5月、NTTデータはスペインのSocial Coin(通称 Citibeats)と連携し、Twitterデータを分析して都道府県別に生活者の声を見える化したサイト「COVID-19 Observatory 」を公開した。

「日本ではこれまで新型コロナウイルスに関して、4億件以上ツイートされています。個人の意見や、リツイートを除いても毎日100万件は何らかの情報が発信されていて、まさに『いま』を把握する重要な手がかりになります」今回のサイトを手掛けたNTTデータITサービス・ペイメント事業本部SDDX事業部デジタルマーケティング担当の高野恭一はいう。

このサイトでは、日本で発信された新型コロナウイルス関連のツイートが分析され、都道府県別に16のカテゴリーで話題量の割合を表示。地図上に濃淡を加えることでどの地域で話題となっているか、なっていないか、ひとめで分かるようになっている。

図1:COVID-19 Observatoryのトップ画面

図1:COVID-19 Observatoryのトップ画面

一例としては、「リモートワーク」。6月12日時点では東京、神奈川、埼玉、千葉の順で多く話題になっている。これは、緊急事態宣言の対象として最後まで残り、宣言解除後も企業にリモートワークが呼び掛けられているからと推測される。逆に同様に人口の多いであろう広島は少ない。実は「リモートワーク」は思ったほど全国区になっていないことがうかがえる。

また「文化的影響」では、山陰、四国、東北地方が比較的話題が多い。この地域では祭事の中止や神社仏閣など参拝禁止などを行っていたことが影響した可能性がある。一方で「ビジネス経済」では東北、四国地方でも話題量が比較的多いが山陰では少ない。例えば観光業の側面で見れば、同様に打撃を受けているはずだが、その違いとなる背景をひもとくことで、新たな知見を得るきっかけになるかもしれない。

日本の中でも文化や慣習、生活スタイルはさまざま。新型コロナウイルスに対しても地域特性に応じて、きめ細かい対策が必要になる。そのヒントになるのは地域ごとの違いだ。ツイートという住民の生の声を使いながら、自らの地域の打ち手や、他地域の取り組みを探るきっかけになることが期待されている。

中南米発。オープンイノベーションがもたらす展開

感染の広がりは若干遅かったものの、非常に多くの感染が確認され、いまも拡大している中南米。Twitterの利用者が多い地域でも知られ、ツイートを活用し生活者ニーズを可視化したサイト「¿De qué está hablando la ciudadanía durante la pandemia COVID-19?」が2020年3月から運営されている。

図2:中南米サイトのトップ画面

図2:中南米サイトのトップ画面

作ったのはAIテキスト解析に強みを持つ「Citibeats」。CitibeatsはNTTデータが主催する「豊洲の港からpresentsグローバルオープンイノベーションコンテスト」で2017年、グランドチャンピオンに選ばれた。以来、新しいビジネスをともに模索している。

「生活者の声を見える化すれば、政府や自治体の政策検討に活用できると考えていました。Citibeatsとは以前から議論をしてきましたが、今回、彼らがIDB Lab(米州開発銀行グループのイノベーション・ラボ。世界40ヵ国が加盟しており、日本政府は主要貢献国)と開設した中南米のサイトの話を聞き、日本でも活用できると確信しました」
高野は2020年4月中旬からCitibeatsと日本版サイトの検討を開始し、1カ月強でサイトオープンにこぎつけた。

NTTデータ独自の技術でツイート発信地を特定

中南米サイトでは26カ国を国ごとに分析・表示している。インターネットの世界ではIPアドレスが国ごとに割り当てられており、どの国でつぶやかれたかを特定することは容易だ。しかし、日本の都道府県となるとそうはいかない。投稿者が入力した居住地情報もそこまで詳細ではない。そこで、NTTデータでは独自に言語解析技術を用いて、どの都道府県で発信されたのかを90%以上の確率で特定している。

NTTデータ独自技術の適用はほかにもある。その一つはノイズデータの除去だ。TwitterにはBotと呼ばれる機械投稿が相当数ある。Botはアカウントごとに類似投稿を繰り返す傾向にあるため、単語の圧縮率(アカウントの総投稿に占める単語のユニークさ)に着目し、機械投稿を判定する技術開発本部所有の特許技術により除去し、品質を高めている。
さらに高野はいう。
「新型コロナウイルスで難しいのは、デマやフェイクニュースです。本人は真実と信じて、善意からデマやフェイクニュースを投稿・拡散します。これを特定するのはとても難しいのです。ただ、他の情報感度の高いユーザーや有識者からの返信・コメントによってTwitter上で自浄作用が働く傾向にあるため、検出に向けてAI&IoT事業部、DataRobotと技術検証をしています。どのような内容がフェイクニュースであるかも今後サイトに追加していきたい」

図3:データ分析のカテゴリーは中南米では食糧、貧困など13分野。日本は特有課題の就職活動や保育など含め16分野
図3:データ分析のカテゴリーは中南米では食糧、貧困など13分野。日本は特有課題の就職活動や保育など含め16分野

図3:データ分析のカテゴリーは中南米では食糧、貧困など13分野。日本は特有課題の就職活動や保育など含め16分野

ツイートは最大のマーケティングデータ?

5月27日のサイトオープンから2週間程度で、自治体をはじめ企業などからもTwitterデータの活用に関する問い合わせが届いている。

例えば地域住民の声をローカルビジネスへの展開に使いたいといった内容。用途はさまざまで、地域住民と共創するために都市活動に影響を与える住民を把握できないか、市区町村レベルでの課題・住民の関心事を把握できないか、また既存のスマートシティー関連のデータソースである移動などの住民の行動データに対して住民心理を組み合わせるためのセンサーデータとして活用できないかなど。

早速それぞれサービス化できるか検討に入っている。また、IDB Labからの連携相談やASEANエリアへの展開検討などグローバルでも動きが出てきつつあるようだ。

従前よりTwitterデータから災害や事件情報を検知するという試みは行われていた。しかし今回は、日本全国が新型コロナウイルスに直面したことをきっかけに、ツイートされているテーマと地域を結び付けて見える化し、他地域と比較することで新たな知見を得るという新たな活用の可能性が提示された。

つぶやきがご近所を救う。今後は災害発生時に限らず、地域特性を踏まえた課題の発見にむけて、新たなTwitterデータの活用が期待される。

参考

お問い合わせ