前回は、面倒なセットアップを説明しましたので、今回は「Twitter で検索をする」ということをやろうと思います。
今回も、様々なサイトから情報を切り貼りして、うまく結果が出たコードを書いてます。
勉強不足のため、細かい仕様などはわかりかねますので、あらかじめご了承ください~。
セットアップ
twitterR セットアップについては、拙筆ですが「twitteRのセットアップまとめ(2015年10月)」を参考にすれば問題ないと思います。
コード
====================以下コード====================
#twitter_set_up.R を実行しといてね。
#検索ワードを記入
cw1 <- "カレーライス"
#もっと増やしたければ、同じように増やしてね。
#クローリングしたものをデータフレームにぶちこんじゃうよ。
TwGetDF1 <- twListToDF(searchTwitter(iconv(cw1,"CP932","UTF-8"), n=1500, lang="ja", since=NULL, until=NULL))
# リツイートを除外するぜ。途中でfunction入れて、リツイートされたものをFALSEで表示するようにしたよ。
df1 <- TwGetDF1[unlist(lapply(TwGetDF1[, 'isRetweet'], function(i){if (isTRUE(i)) return (FALSE)
else return (TRUE)}
)), ]
head(df1,10)
#CSVファイルにエクスポートするよ
write.table(df1, file = "なんか適当な名前.csv", sep= ",")
====================以上コード====================
iconv で文字コードを UTF-8 に変更するのが肝ですかね。
それ以外は、下記の参考サイトを参考にすれば、問題なく分かると思います。
CSV ファイルが色々とおかしかったので、それを修正するのはまた今度。
◆参考サイト◆
- 「Package ‘twitteR’」
https://cran.r-project.org/web/packages/twitteR/twitteR.pdf - 「本当は怖くないCP932」
http://qiita.com/kasei-san/items/cfb993786153231e5413 - 「Rでtwitter解析 1、twitteRの設定編」
http://shain.blog.conextivo.com/2014/10/rtwittertwitter.html - 「iconv {base}」
http://www.inside-r.org/r-doc/base/iconv - 「ifelse()とif-else構文の違い」
http://notchained.hatenablog.com/entry/2014/06/19/214502 - 「Rでウェブ解析:Twitterデータの取得もおまかせ「twitteR」パッケージの紹介」
http://www.karada-good.net/analyticsr/r-57/