先日よりGoogle Colaboratoryを使い始めたところ、その威力について感動しっぱなしでおりまして。
さらに進んでTwitterAPIと連携してのテキスト分析を試してみました。
今の私の感想を言いましょう。Twitterとの相性についても、Googleコラボラトリの使い勝手は素晴らしいと思いました!
※なんだか先日からGoogleコラボラトリを絶賛しすぎてますね。たぶん、暫くしたらこの熱が冷めて、「こういう弱点がある」「こういうことには使えねー」とブーブー言い始めるかもしれませんが💦。まあ、今は熱いうちに、熱い文体のままで、Googleコラボラトリ紹介続けます。
さて。
お試しとしては、日本の妖怪観光地を取り上げて、そこに関する最近のTwitterでのつぶやきをワードクラウド化しようと思います。
私にとって、その動向が常に気になる観光スポット小豆島の「妖怪美術館」を取り上げましょう!
Googleコラボラトリに新規のノートブックを立ち上げて、Twitterから発行してもらったアクセストークンを登録し、Oauthで認証を開きます。
あとはTwitterAPIで検索キーワードからの結果を取得し、テキストマイニングにかけます(※このあたりの手順はもっと整理したら詳しく公開したいと思います)。
で、小豆島の妖怪美術館の場合。
いちおう、出ました!微妙なアルファベット(WとかRTとか!)をうまく除外しないといけないですが、それは今後の課題。
続いて三次もののけミュージアムでやった場合。
さらに、鳥取県境港市でやった場合。
「河童の三平」らしいものが微妙に全体を引っ張っているのは何なのでしょうね、フムム?
今回は、お試しでテキストマイニングを回してみただけの段階なので、まずはこの辺りで。
今後、もっと、深めていきます!
▼参考文献▼最終章にGoogle Colaboratoryでのpythonデータ分析の準備手順が載っています
実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門 (KS情報科学専門書) [ 榊 剛史 ] 価格:2,860円 |