2010年12月11日土曜日

Twitter分析:2010年ワールドカップ(パラグアイ戦)での日本語Tweet状況

2010年6月29日、日本-パラグアイ戦、日本時間23:30キックオフ、0-0でPK3-5で敗退

[1)2010年ワールドカップ(日本-パラグアイ戦)での日本語Tweet数

[2)個人名でのTweet数(時間幅に注意)
岡田
川口、楢崎、川島、中澤、闘莉王、駒野、岩政、今野、長友、内田、中村、俊輔、稲本、遠藤、憲剛、松井、阿部、長谷部、本田、玉田、大久保、矢野、岡崎、森本

※Tweet総数が、これまでの報告に比べて多いのは、2010年7月中旬までは、Twitter Streaming API で全Tweetの5%を取得できていたため。(現在は全Tweetの約1%)
※試合時間の関係で、グラフ表示は、時間をずらしてあるので注意
※その他の収集条件は、「Twitterにおける日本語投稿の一傾向分析」と同じ。

この試合は、ベスト8進出がかかっていただけに、途中での盛り上がりもこれまで以上。
最大Tweet数は、本サイトでの記録上は、4試合の中で最大。

今回注目すべきは、個人名のグラフでの、突出した川島のTweet数ではなく、駒野(PKが、バーに嫌われゴール上に外れる)のTweet数の推移。瞬間最大ではないが、駒野へのねぎらいのTweetがしばらく続いていた。

しかし、過去のグラフとスケールが違うので、見づらいが、最後に登場する岡田監督、「岡田」の出現パターンの安定っぷりは見事です。

■関連記事
日本、PK戦の末敗退 初のベスト8ならず

2010年12月10日金曜日

Twitter分析:2010年ワールドカップ(デンマーク戦)での日本語Tweet状況

2010年6月24日、日本-デンマーク戦、日本時間03:30(27:00)キックオフ、3-1で勝利

[1)2010年ワールドカップ(日本-デンマーク戦)での日本語Tweet数

[2)個人名でのTweet数(時間幅に注意)
岡田
川口、楢崎、川島、中澤、闘莉王、駒野、岩政、今野、長友、内田、中村、俊輔、稲本、遠藤、憲剛、松井、阿部、長谷部、本田、玉田、大久保、矢野、岡崎、森本

※Tweet総数が、これまでの報告に比べて多いのは、2010年7月中旬までは、Twitter Streaming API で全Tweetの5%を取得できていたため。(現在は全Tweetの約1%)
※試合時間の関係で、グラフ表示は、時間をずらしてあるので注意
※その他の収集条件は、「Twitterにおける日本語投稿の一傾向分析」と同じ。

この試合については、分析とか必要ない状態。

個人名のグラフが、カメルーン戦が本田のゴール時に800件強、オランダ戦では500件弱だったのが、今回は1200件を超えていて、際だって多くなっていることがわかる。全体グラフの中でも、個人名のTweetが見極められるほどである。

3得点と個人ごとのTweetの盛り上がりが一致している。
  • 1点目、前半17分、本田の劇的なフリーキック
  • 2点目、前半30分、遠藤のフリーキック
  • 3点目、後半42分、岡崎が押し込んだ

最初の本田のぶれ玉フリーキックが印象が強かった。2点目の遠藤はそれなりにTweetされているが、3点目の岡崎のゴールは、その直前までボールを持っていた本田に期待が高まっていた様子が見て取れる。

川島は、ゴールされそうなとき、というか、今回はゴールされてしまったとき(後半36分)Tweet数が最大になった。これは、キーパーのつらいところ。

全体のTweet数は、もう、この時間帯としては異常としかいいようがない。試合終了後のTweet数は、同じ時間帯の平均値の7倍程度となっている。

例によって、最後に登場する岡田監督、「岡田」の出現パターンだけは安定している。

これほど突出した異常値になると(つまり興奮的盛り上がりがあると)、分析によって何かを導きだすという立場からは難しくなることがわかってくる。ゴールした岡崎と本田のTweet数が逆転していることからも、単純に名前の頻度が事実を反映しているわけではない。本田の最初のフリーキックの影響もあるだろう。そこまでは、単純頻度からは導出できない。

※パラグアイ戦は、明日公開予定。

2010年12月8日水曜日

Twitter分析:2010年ワールドカップ(オランダ戦)での日本語Tweet状況

2010年6月19日、日本-オランダ戦、日本時間20:30キックオフ、0-1で敗北

[1)2010年ワールドカップ(日本-オランダ戦)での日本語Tweet数

[2)個人名でのTweet数(時間幅に注意)
岡田
川口、楢崎、川島、中澤、闘莉王、駒野、岩政、今野、長友、内田、中村、俊輔、稲本、遠藤、憲剛、松井、阿部、長谷部、本田、玉田、大久保、矢野、岡崎、森本

※Tweet総数が、これまでの報告に比べて多いのは、2010年7月中旬までは、Twitter Streaming API で全Tweetの5%を取得できていたため。(現在は全Tweetの約1%)
※試合時間の関係で、グラフ表示は、時間をずらしてあるので注意
※その他の収集条件は、「Twitterにおける日本語投稿の一傾向分析」と同じ。

グラフ1からみれる盛り上がりは、前回カメルーン戦と同じであり、時間帯をずらすと、ほぼ同じような形になっている。
今回は、敗戦だったので、最後の盛り上がり方が、さほどでもなかった。
前回も今回もそうなのだが、試合後のつぶやきというか雄叫びというか嘆息というか、それが一番多い傾向にあるのが見えてくる。

今回は、日本のゴールがなかったので、人名での頻度はさほど突出してない。人気選手や(いろんな意味で)注目選手へのTweetが多かったのではないかと思う。

前回と今回で、全く同じなのが、人名「岡田」の出現パターンである。試合終了後の岡田監督に対するインタビュー関連のTweetだろうと思うが、当然ながら試合中につぶやかれることの少ない人物であるのは間違いなさそうである。

※残りの、デンマーク戦、パラグアイ戦も同様の分析を行います。明日以降、更新予定。

2010年12月6日月曜日

Twitter分析:2010年ワールドカップ(カメルーン戦)での日本語Tweet状況

2010年6月14日、日本-カメルーン戦、日本時間23:00キックオフ、1-0で勝利

[1)2010年ワールドカップ(日本-カメルーン戦)での日本語Tweet数

[2)個人名でのTweet数(時間幅に注意)
岡田
川口、楢崎、川島、中澤、闘莉王、駒野、岩政、今野、長友、内田、中村、俊輔、稲本、遠藤、憲剛、松井、阿部、長谷部、本田、玉田、大久保、矢野、岡崎、森本

※Tweet総数が、これまでの報告に比べて多いのは、2010年7月中旬までは、Twitter Streaming API で全Tweetの5%を取得できていたため。(現在は全Tweetの約1%)
※試合時間の関係で、グラフ表示は、時間をずらしてあるので注意
※その他の収集条件は、「Twitterにおける日本語投稿の一傾向分析」と同じ。

 グラフ1からは、キックオフ前から徐々に盛り上がっていっているのが見て取れる。最大時(試合終了時=勝利確定時)には、通常(2010年6月平均)の同時刻の3倍を超えるTweetが起こっている。これは、Tweet数の通常時との乖離具合から何らかのイベントの発生を推測できる可能性を示唆していると考えられる。これは、前回報告の「Twitter分析:地震発生時(2010年11月30日)におけるTweet状況」からも読み取ることができる。
 一方、人名(日本代表メンバー)を含むTweetの数も出してみたが、地震発生時の関連語彙の出現数に比べると意外なほど少ない。グラフ1では見づらいので、グラフ2として拡大してみた。時間幅も試合時間を中心とした6時間分だけにしてある。
 人名の頻度差から、そのときの試合状態を想像することができる。しかし、それが全体のTweet数と必ずしも同期していない、それどころか、全体数への影響も少なく、ほとんど無関係なのに驚いた。たとえば、本田のゴールの際に「本田」を含むのは、その時点の一割未満にすぎない。(「本田」で収集したので「本田△」なども含まれる)

 では、ほとんどのTweetは何かというと、ほとんど雑談的な内容。「意外と前半いい感じ。」「この時間にそれは辛い…」など。試合終了後は「勝ったー」「すげぃ〜!!勝利〜!!!!」などのシャウト系のTweetが多くみられた。

 統計処理的な立場でTweet数からイベントの発生をとらえて、さらに自然言語処理的解析で何が起こったのかを絞り込むことを考えたい。そのために、今回は固有名詞として、人名を利用してみた。しかし、実際には、Tweet内容は意味的にはほとんどカオス状態である。この混沌から、何かを導き出すためには、もっと工夫が必要である。

※オランダ戦、デンマーク戦、パラグアイ戦にも同様の分析を行います。明日以降、更新予定。

2010年12月2日木曜日

Twitter分析:地震発生時(2010年11月30日)におけるTweet状況

地震発生時(2010年11月30日)における日本語Tweet数における関連Tweet

もっと、龍馬関連のTweetでは、さほどでもなかった(通常のTweetに埋没している)のにくらべ、明らかに、追加分のTweetが特徴として全体に反映している。
リアルタイム性の強いイベントに対しての反応の大きいということの様である。
ワールドカップなどの時にも、同じ状況が確認が想像できるが、現在、データが手元にない。入手でき次第、後日公開予定。

なお、今回は次の文字列が入っているつぶやきをカウントしている。

  • 地震
  • 揺れ
  • 震源
  • 震度

追記:
収集条件は、「Twitterにおける日本語投稿の一傾向分析」と同じです。

Twitter分析:「龍馬伝」最終回(2010年11月28日)でのTweet状況

龍馬伝最終回(2010年11月28日)での日本語Tweet数における関連Tweet

もっと、龍馬関連のTweetが多いかと思ったのに、全体から見ると、さほどでもなかった。
それでも、本放送時間帯のTweetが増えていることは見て取れる。

なお、今回は次の文字列が入っているつぶやきをカウントしている。

  • 見廻り組
  • 今井信郎
  • 龍馬
  • 竜馬
  • お龍
  • 新撰組
  • 勝海舟
  • 近江屋
  • 中岡慎太郎
  • #ryomaden

追記:
収集条件は、「Twitterにおける日本語投稿の一傾向分析」と同じです。

Twitter分析:2010年11月の日本語投稿の傾向

2010年11月における休日(土曜日、日曜日、祝日)平日の日本語Tweet数の比較

先月と傾向の大きな違いは見あたりません。
平日と休日の投稿傾向の違いが明らかです。
12月分までを含めて、平日/休日だけでなく、曜日ごとの傾向分析も考えています。

追記:
収集条件は、「Twitterにおける日本語投稿の一傾向分析」と同じです。