Google Cloud Platform(GCP)で簡単ポジネガ分析

ポジネガ分析の業務の汎用性

Yahoo!リアルタイムやSNSアナリティクスサービスで一般的なポジネガ分析。広告やマーケ担当はよく見る指標だと思うが「これほんまかい!」って思ったことはあると思うが、SNSの投稿内容の報告用には重宝する指標だ。

大量のテキストデータから様々な情報を省き【ポジ/ネガ】という1次元に情報をそげ落としているわけなので(全世界の人間を身長という情報だけで語るようなイメージ)、そりゃあ肌感とは一部ずれるよねとは思いつつ、その中身やロジックをある程度知った上で使うとより説得力が増すんじゃないかと思う。

ポジネガ分析の仕組み ざっくり解説

ポジネガ分析はツールを使って行えばいいわけだが、簡単な処理の流れはこんな感じ。

①文章を単語に分ける

②ポジ度、ネガ度が単語に割り振られた辞書を用意する

③単語ごとにポジネガ度辞書に当てはめられ点数が出る

もちろんこれはものすごい簡単なしくみで、単語の処理や単語間の関係性を考慮したり辞書の中身や点数の重みなどで全く異なる。

②は研究機関やテキスト情報が大量に集まるサービス企業が出していたり、自分で作ったりすることもできる。そして①〜③まで全てやってくれるのがAPIだったり使いやすいツールだったりするわけだ。(すごい雑)

Google Cloud Platform(GCP)で簡単ポジネガ分析

Natural Language APIを使ってみる。

やり方はこのまんま

https://cloud.google.com/natural-language/docs/quickstart-client-libraries?hl=ja

コードはそのまま使えるので、サービスアカウントキーと環境変数の設定だけ補足する。

サービスアカウントキーの発行

まず作成したプロジェクトに言って、認証情報からサービスアカウントキーを発行。

作成を押すと、JSONファイルがダウンロードされる。

環境変数の設定

↑でダウンロードしたJSONファイルを右クリックしファイルのパスをコピーしておく。

(ローカルなら)ターミナルを開いて以下のコマンドで環境変数に追加。

これでコード実行時にサービスアカウントキーが読み込まれAPIが実行できる。

実行

ターミナルから

次に.pyファイルに以下を書いて、実行。(python ファイル名)
このtextの部分を判定している。ありそうな求人タイトルをやってみる。

コードはクイックスタートのものとほぼ変えていない。

結果

こんな感じでsentiment.scoreとsentiment.magnitudeを出力される。

まあまあポジティブだということが言えそう。

※その他の指標はこの記事が分かりやすかったです。

http://tech.wonderpla.net/entry/2017/11/28/110000

トライアル

ここから簡単にトライアルもできるので非エンジニアはちょっと遊んでみてもいいかも

https://cloud.google.com/natural-language/

例えばこんな使い方ができる

・テキスト広告の報告用

・日報のポジネガをしてポジになるよう自分を振り返る

・メールを人別にポジネガ分析して、ポジ度と返信率の相関性を見る

個別の文章のポジ度を見てもあまり参考にならなさそうだが、同じような繰り返し行動をとる活動ベースで比較すると色々使えそう。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする