自分の欲しい情報を探しているとき、どうしても不要なツイートが入ってきてしまうことがありますよね。一回限りのことであれば、問題ないのですが毎回行う作業に含まれるのはいかがなものか。
今回はそのようなツイートをどうやって除外するかというところを考えていきたいと思います。
そもそもボットってなんだろう
Twitter「ボット(bot)とは」とは?|ツイッター用語 - ツイナビ
最近は簡単に誰でもボットを作ることができるようになって、ぼくもMAKEBOTさんなどを利用してボットを作ってます。
MAKEBOT - ツイッターボット作成サービス
ざっくりいうとTwitter側でアプリを作って、その情報をMAKEBOTなどにぽちぽち打ち込んで、コンテンツをインプットするだけ!
そんなこんなで、世にいろんなボットがTwitterに解き放たれてるんですね。
ボットがよく使っているTwitterクライアント
ツイートにはすべて「どのクライアントから投稿されたか」という情報が付いているのですが、ボットのツイートの投稿元のクライアント情報を見ると、だいたい2パターンに分けることができます。ひとつは、投稿代行や自動投稿などのサービスを提供しているクライアントから投稿されているパターン、もうひとつは独自のクライアントを作って投稿を行っているパターンです。
前者のパターンでよく見かけるのはIFTTT、dlvr.it、twittbot.net、autotweety、Googleなど。サービス自体のことを調べると分かりますが、このクライアントから投稿されているツイートは100%ボットによるツイートです。なので、できればちょっと横に避けときたい、じゃあどうやろうか?という話に繋がっていきます。
Twitterクライアントでフィルターできる「source:」
使い方は簡単で、「source:」の直後にクライアント名を入れるだけ。除外したいときは頭に半角のマイナスを入れて「-source:」とすれば良いですし、逆に特定のクライアントから投稿されたツイートだけを検索したいときは「source:」でOK。ORで繋ぐこともできますよ!
ただし注意事項が2点あります。ひとつ目は「Twitterクライアントに半角スペースがあるときは、それを半角のアンダーバーで補完しなくてはいけない」、もうひとつは「ひらがな・カタカナ・漢字が含まれているTwitterクライアントには適用できない」です。
ひとつ目の注意点については知ったらそれまでですが、ふたつ目についてはTwitterの仕様上どうしても解決できないようです。なので、日本語で記述されたTwitterクライアントが出てきたときは潔く別の除外する方法を考えましょう。
おわりに
ソーシャルリスニングでは可能な限りノイズを減らす、でもユーザーの声は可能な限り排除しないというのが重要です。なので、今回紹介したような「source:」などもうまく活用してみてください。
ちなみに、このページだとボタンひとつでよく使われるボットクライアントを除外して検索することができます。よかったら使ってみてください。