March 14, 2010
セミッターの機能を向上させて、今はやりのハッシュタグに対応したりAjax化するなどのアップデートを行いました。
セミッターとは、セミナー会場のつぶやきを壇上のプロジェクターに移したり、ネット越しにもtwitterやUstreamと絡めて、聴衆の感想を共有することでイベントをより楽しむためのサービスです。
ハッシュタグに対応したことにより、事実上、どんなつぶやきでも集められる(ハッシュタグの実装はつぶやき検索なので)、丁度、セットアップも終わってUsreamと組み合わせて遊んでいたら、今日、デジタルステージの平野社長が、モーションダイブのUst対応版の開発に関するUstreamを中継するというので、勝手セミッターをやらせていただきました。
ツイッターアカウントで、「gaitou_tv」(街頭TV)というアカウントを作りました。このアカウントのありようは、セミッターのデモアカウントであり、「僕が見ているUstreamをみんなで共有する画面」ということになります。
ここにUstのURLをembedして、ハッシュタグ「#dscast」も設定し、かつ、セミッターの携帯から見られるように設定しました。
PCからの画面は、こんな感じ。外出中は携帯から、ハッシュタグのつぶやきを見ていました。

1920x1080のHDMI解像度で最大化して見ていたので、思いっきり横長ですいません。
今回からログの取得をサーバサイドのbotにお任せしてするようにしたので、外出中にも、ひたすらログを収集していた状態だったので、ハッシュタグ「#dscast」のつぶやき数を勝手ながら数えさえてもらいました。
これはつまり、同時視聴 1500人規模の盛り上がったUstreamイベントで、どれぐらいのtweetが送られるかという指針になります。
今回のイベントは、21時から開始だったのですが、20時30分ぐらいにセミッターのイベントを仕掛けました。その結果としては、
3/13
20時台 10 tweets
21時台 133 tweets
22時台 1393 tweets
23時台 1463 tweets
3/14
0時台 927 tweets
合計では、4000つぶやきoverです。
つぶやきのログはこちらから見ることができます。
「ハッシュタグ#dscast 3/14 20:30~のつぶやき」
当初、セミッター上で、「次のつぶやきの表示」までのディレイを3秒毎にしていたのですが、っそれと1時間では1200tweetsしか表示できませんので、このつぶやき数を、ずっと頭から見ているとディレイしていきます。
さらにUStreamと、今回は家入さんが作ったnicotterの字幕も流し、JavaScriptのタイマーの組み合わせですから、CPU性能的にも3秒のタイマーも怪しいもので、ディレイはより大きくなっていく一方でした。外出から戻ってきたら1.5hぐらい遅れてたかな。
更に、つぶやきにはピークタイムがあります。
1分単位で見てみたら、1分間の最大のtweetsは、22:45に60tweets 、 22:43に52 tweets 、 0:17に50tweetsがピークでした。
ということは、1秒に1個tweetを表示しておけば、仮に同時刻につぶやかれたとしても、最大1分以内には表示されるということになります。
つぶやきが沢山送られてきた場合は、1秒ディレイでtweetを表示するのがよさそうです。
つぶやきバッファが溜まってきたらディレイ短くするとか、2つのつぶやきを一緒に表示するとか、工夫の余地はあります。
ちなみに余談ながら、セミッターの今回のアップデート内容ですが、
1.ハッシュタグ対応追加(元々は、「@アカウント」へのmentionsを拾うモードでした。こっちの方が精度高いが、伝達距離がややクローズド前提」)
2.イベント中画面のAjax更新化
3.ログ取得処理をバックエンドのbotに移動したことで、クライアント側の表示軽量化。
あたりが大きい変更かな。
あとは、ニコニコ動画みたいな字幕は、イベント設定側で表示非表示が変えられるとか(プレーヤー側にもon/offをつけるべきですね)、細かい設定は追加されています。
他にも、これを実装すべきと思ってたものが、今日のUstreamで話されていたので、やっぱり実装しようと思った機能も何点か。あと、ビジュアルデザインのフルリニューアルしないとね、と思っています。
■セミッター
http://www.semitter.com
March 13, 2010
100万件以上の規模をデータを扱うWebサービスで、低コストで全文検索エンジンをサイトに組み込みたいと思った時に多く使われているのが、
1.MySQL + Senna
2.Apache Solr
3.Hyper Estraier
他にもあるかもしれませんが、この辺の選択肢なのかと思います。
どれも様々なところでの採用実績があるかと思いますが、今回は、日本でも大規模なデータ量を活用する情報サイトでも活用されている(ことを僕が知っている)、Apache Solrの本をいただいたので紹介してみたいと思います。
Apache SolorはオープンソースでPureJavaで作られている全文検索エンジンです。
サーブレットコンテナ上で動作し、Webサーバなどのクライアントからは、HTTPでリクエスト、レスポンスを処理します。
上記3種類の検索エンジンの違いとしては、Hyper Estraierは使ったことないので書けないのですが(TokyoTyrant/tokyo Cabinetにはお世話になっております)いわゆる基本的な全文検索のありようについては、そんなに変わるものではないのかなと思っています。
MySQL + Sennaは、何より、お手軽なのが最大の魅力で、既にレプリケーションされているMySQL 5.0x環境があれば、バイナリパッケージで提供されているTritonnを使うことで、さくっと高度な全文検索を追加できます。
モバツイでも昔からログ周りでは利用させていただいておりましたが、今は、フレンド検索で利用しています。主に日本人で構成された140万人のツイッターユーザーをプロフィールや名前、locationで検索するのに利用しています。(今、Sennaな人達は、groongaという全く新しい検索エンジンに取り組んでいて、こちらも注目です)
Apaceh Solrに関しては、もうちょっとリッチな検索機能として、ハイライトと呼ばれる検索に該当したキーワードを自動強調表示をする、とか、結果をランダムソートするなどの機能がありますが、一番、お金につながりそうなのが、ファセット機能だと思っていてます。
これは、検索結果が所属するカテゴリ毎のヒット数を自動的に抽出できる機能です。
よくECサイトで、「カテゴリ毎の商品数」というのが表示されていますが、あれを検索キーワードに対して動的に抽出することができます。

↑こういうのです。
その結果、ドリルダウンと呼ばれるUIで、カテゴリをどんどん深堀していっても、下位カテゴリで絞り込まれた検索ヒット数を再帰的に表示することができる、というわけです。
これは高いユーザーエクスペリエンスの実現に、重要な機能と言えます。
何もシステム的なサポートがないのにやろうとすると、カテゴリの数だけ違ったクエリの全文検索ループを回す必要が出てきて、非現実的です。
決まったカテゴリであれば、定期的にバッチで更新すれば良いのですが、動的な検索キーワードには対応できません
本書を見ていると、Solrのファセット機能もやってる処理は、そんなに違いないようですが、Solr内部で処理してくれることで、余計な処理を繰り返すことなく、最適化された状態で、実用的に利用できる、と考えるのが良いでしょう。
本書はSolrのインストールの仕方から、各種言語からの呼び出し方法(て言ってもhttp通信でXMLやらjsonが返ってくる、twitter apiみたいな仕組みなんですけどね)という基礎から、技術的な仕組みの説明は欠かさず、さらに、分散検索やレプリケーション、その他、仕組み上起こりうる問題点等、先々まで使えるノウハウが惜しみなく記述されている一冊だと思います。
(地味にありがたかったのが、TomcatじゃなくてJettyでも実運用できますよーという一文だったり)
初心者過ぎずマニア過ぎず、丁寧に書かれており、エンジニアなら読みやすい文章です。
Solrは、ツイッタークライアント界隈でも、「twitter検索」で使われていたりしますが、モバツイでも、今後の機能追加に利用させていただこうと思っています。
で、これはTipsなのですが、Apache Solrの情報は当然、ネットを検索すると出てくるのですが、問題点が一個あって、Apache Solrのバージョン1.2とバージョン1.3以降で、何やら仕組みが変ったようで、昔の情報と1.3以降の情報を混乱するとワケワカになるという事態が起きます。
今はblogベースの記事が多いので、日付では切り分けがつくのですが、いかんせんバージョン番号まで書いてくれてる人は多くありません。書いたタイミングでは最新なので、後から見ると、わからなくなってるケースが多いです。
というあたりが、Apache Solrを使う場合には、切実に本書をお勧めしたい理由です。
そういう情報の蓄積を、本書にまとめていただいたという側面だけでも、十分、お金を払う価値があると思います。
以下、2008年の記事ですが、こちらもどうぞ。
Apache Solrを使ってみた。
March 10, 2010
かつてパソコン通信のネットにいたころ、そこで起きる「荒らし」と呼ばれる「悪質ユーザー」について、「いや、彼らも本当は悪い奴じゃないんだよ」という管理者の言葉があった。
つまり、パソコン通信上では悪ぶってるかもしれないが、普段は普通の人で、ネット上の行動とリアルはかい離しているという見方だ。「人を殺すと言っても、本当は、そんな行動なんてしないんだよ」という性善説的な考え方である。
しかし、2ちゃんねるの利用者から、バスジャックの少年が出た時に、その考え方は過去のものとなった。
ネットとリアルがリンクして、実際に事件が起きるなんて!
そして、twitterが出てきて、秋葉原の殺傷事件をUstream中継する人が出てきて事件の現場がライブで目の前のパソコンに展開されるようになり、モバイルコンピューティング+ツイッター+Ustreamで、今では各々の生活の一部が、ネットを通じてリアルタイムに相互接続できる時代になっている。
変化の中で、かつては「少数派」だったネット上の政治への意識が、もっともっと具体的に政治に影響を及ぼす(選挙への影響)ようになっていってもおかしくはない。
これまで特定の業界団体や、特定の宗教法人が、彼らの利益の元で、選挙の結果を左右していたように、何がしかの意思やパワーバランスの元で、ネットが政治に影響を与えるようになっても、そろそろおかしくない状態になりつつある。
この本は、ものすごい面白かったです.。ヤバイす。(献本ありがとうございます)
ITジャーナリストの佐々木俊尚さんの新刊です。
「マスコミは、もはや政治を語れない」
とりあえず僕が本書の魅力は語るには力不足すぎるが、どうにか力を振り絞って、3点ほど。
⇒まず日本が民主主義の中で、情報の分断方法を熟知している政治家、官僚、マスコミなどがセットになって、仮想的共産主義国家のような状況を作っていたこと。
⇒ところが、彼らが予想だにしないところで、例えば、そらのさんとUstreamの組み合わせによる事業仕訳ダダ漏れ、や、ツイッターと原口総務大臣の組み合わせによる、「信頼できるメディア」を中抜きするような重要情報伝達の実現、右翼集団とYoutubeの組み合わせ、など、自由な情報発信手段の発展で、それまで起こりえないことが起きて、これまでの情報管理体勢に綻びが生まれていること。
⇒結果、権威が信用できないし、新しいメディアは信頼性に欠ける。しかも景気は良くない。そんな混迷の状況の中で、少しでも新しい秩序を作ってくれるのではないか?という期待感で選挙は動く。そこに自民党も民主党もあまり関係はない。それが小選挙区制という得票率の優位が、議席に大きなレバレッジを与える制度による、小泉郵政選挙の圧勝であり、今回の民主党の圧勝劇だった。
インターネットが普及してきて、情報伝達が劇的に効率化され、そこに紐づいて、流通の仕組みや、税制や、お金の流れが変わってきた中で、「これまでの王道」から、少しつずつメリットがなくなっていき、新しい何かが、そのメリットを得て行くことは、なんら不思議ではありません。
もちろん既存の「信頼される会社」に従事している人たちは知恵を絞って、自分達のビジネスがどう最大化するかというのをみんなが考えるので、頭で考えるほど、旧体制がすぐに消滅することはないでしょうが、2000年の頃には、夢、妄想レベルだったものが、2010年には、政治の場やマスコミの場という、ある種」先端の世界に影響が出て来たということが、本書に描かれていると思います。また、同時に、ネットに集まりつつある新しいリスク、起きつつある問題点もまた無視できないところで、まさに「日本の今」を切り取った一冊です。
March 07, 2010
UStreamにチャット窓のようなのがあって、そこに書いたコメントは、自分の発言としてtwitterにも送ることができる。(送らないUstのみのチャットもあるが、多分あまり流行ってない。)
発言には、ハッシュタグとUStreamへのURLが設定してあり、このつぶやきが呼び水となって、ユーザーがバイラル的に増えて行く仕組みになっている。
最近、人が集まる系のイベントのUStreamを見ながらつぶやいてみて思ったのだが、何故か、翌日に送られてくる、つぶやきの反応が、正しく意図を汲み取っていなかったり、曲解されていることが多く、割と残念な気持ちになったりする。
何故かと言うと理由が2点考えられて、
まず1点は、「UStreamを見ながらのつぶやき」は、前提となる映像が目の前に流れているからこそ発せられた発言であって、スタンドアローンのつぶやきとしては成立できていないのかもしれないという点。
なまじっか目の前に映像があるがために、カウンターとしての発言は先鋭化しやすい。
そんな発言が、UStreamのソーシャルストリームで盛り上がってる時にRTされても、みんなが同じ映像を共有している前提条件があるので、映像の意図から外れたレスは帰ってこないのに対して、次の日になると、その映像を見ていない人の反応はつぶやきにしか反応できないので結果的に、意図からずれる可能性が高くなるというのが1点。
そしてもう1点は、僕が既に過去の発言だと思って、興味の範囲外に降りているので、特にズレたレスについては、反応するつもりがないのに、repliesが埋め尽くされたりするがために、複雑な気分になるというケース。
ツイッターは特に文章が短いし、非公式RTは、その人にレスをしている感は薄まってるので(僕に送られるにも関わらず!)、日常的にディスコミュニケーションで外れた意見が返ってくることは多いので、そんな特別な話ではないのだが、Ustreamを見ながらの発言への意図せぬ解釈については、こちらも無防備に書いていたりするので、それは違うよ、と思いつつも、もう反論する気にもならないが、悶々とはしてしまう、と。
理想的にはUStreamでの発言の有効期限は、その番組が流れている間で十分なのかもしれない。
そもそもUStreamへの発言が、グローバルのTLに流れるのは、サービスに集客したいという運営者、システム側の都合であって、適切な公開範囲ではない、とも考えられる。
セミッターは、そもそもそこは考慮されていて、「@○○」というイベント共有用のアカウントにだけ、つぶやきが集中するように作ってあり、そのイベントにだけ興味を持った人との間で、つぶやきが共有されるように作っていたのだが、世の中、バブルが起きる仕組みとしても、ライバルが拡大解釈して、かつ市場から支持されているのであれば、それを真似しないのは、まぁ普通にありえないわけで、
(支持されている、というのは、少数の人で嫌がって使わないような人がいない、という意味ではなくて、全体として特に気にせず使っている人の方が多い、という意味です。)
Ustreamが集客にツイッターを利用している部分での、「ユーザーにとっては必ずしも適切ではないかもしれないが、イベント全体にとっては幸福」という部分は、今は真似してあって、セミッターもグローバルでの発言として送られるようになっている。
なお、セミッターをベースに作った、sportaaaは、コグレさんの意向で、sportaaaアカウントをフォローしている人にしかつぶやきは共有されない。
適切な集客が望めるのであれば、これが理想だと思う。オープンでありながらも、クローズド性を演出することができる。ここで言うクローズドとは、「見たい人だけ、参加したい人だけが参加できる」という意味ね。
セミッターにも、この辺のコントロール性を反映していきたいと思っている。
できれば本当にクローズドな有料イベントとかに使えるようにしたいね。
サービス企画的な駄文でした。いじょう。
#って考えたら、Ustもニコニコ動画のように動画+コメントが忠実に再現されるのが理想なんだよね。例えば、つぶやきにあるパーマリンクから、動画+コメントが頭出しできるとかね。もしUstream対抗サービスを作るなら、誰かその辺実装して!
#どうでも良いけど、2002年ぐらいにニコ動みたいな動画+コメント掲示板に時間軸で同期する特許を出そうかなんて話をしたことがあったんだけど、ビジネスに連動してたわけじゃないので、出さずじまい。ちょっと残念なのである。
March 01, 2010

最近のムーブメント
■Ustream、ニコ生のコンテンツが急速に発展中
「朝ダダ」にて、ついに田原総一郎、河野太郎まで出演。
UStreamは、そらのさんのチャンネルで配信されていました。
約1万人のネットユーザーを日曜夜のTVから引き剥がしたようです。
メリットは、時間の融通が聴く、CM中心の時間軸構成に捕らわれないので、特に政治家の話には向いてますね。
UStreamでは、1チャンネルで5000人ぐらいが限界、、、なのかな?!
(追記:otsuneさんよりコメント欄に、もっと行くはず、という指摘あり。これは想像ですが、きっと、そのうち、そらのさんのチャンネルがUStreamの優良配信ユーザーとして、沢山の帯域をあてがわれる存在になって行くことが予想されます。僕がUStreamの中の人だったら、そうすると思います。
余談ですが、5000人でも、あの配信品質(500kbpsぐらいはある?)を同時配信したら、本来であれば相当コストかかってると思います。UStreamは謎過ぎます。)
それに対して、TV放送は、数百万人以上が同時に閲覧できる設備が整っているわけです。
そう考えると、UstreamでTVの真似しても仕方がない、と思うかもしれません、、、が、しかし、実際に携帯を持ち歩いてみると、ワンセグは携帯で電波はなかなか入らないですね。
実質的にテレビは「家で見るもの」というメディアから脱してないと思います。
それに対して、UStreamはiPhoneで見ることができますね。つまり、携帯電話が繋がれば見ることができます。
ここまで考えてみると、もしかしたら「つながりやすさ」という意味では、放送電波よりも優れていると考えられるのかもしれません。
TVがブロードキャストだとすると、ストリーミングは、ナローキャストと言われたりしますが、ある程度のリテラシーがある人同士が議論をじっくりするのに向いているんだと思います。
まさに、「持つものと持たざるものの差が広がる」メディア、なのかもしれません。
基本は、何かしらの教育系に向いてると思う。
みんな勉強しようよ!という日本も悪くないです。
あと朝生と朝ダダの違いについて「同じじゃないか!」と、疑問を書いている人がいるかもしれませんが、日曜の夜8時から夜中まで5時間も番組を流すことができること自体が既に差別化要因ではないでしょうか?
TVでは、それをやるのは無理だから、真夜中にやってるわけですよね。
ビジネスを最大化、最適化したが故に、巨人になって足元をすくわれるような流れというのは微妙な気持ちですが。
■AM,FMのラジオ番組がインターネット配信するんだそうな。
既に先行してTokyoFMが、iPhoneアプリでラジオを配信しています。
実際にラジオを使ってみるとそもそもAM,FMラジオというのは、都心部では入りません。電車はもちろん、鉄筋コンクリートの集合住宅でも厳しいですね。
iPhoneアプリによるTokyo FMアプリによって、携帯電話が通じるところでは、安定した音質で聴けるわけです。
カバレッジが広がるので、純粋にネット配信は有利だと思います。
そもそもラジオの聴き方を知らない人も最近いるという話もあるので、うまくすればニューメディアとして認識される可能性もありますね。
再ブレーク手前の芋焼酎とかホッピー、ハイボールの匂いがします。
課題としては、配信地域の制約があるのと、TokyoFMアプリについては、CMが流れていないというビジネスモデルの部分が整っていないこと。
ラジオはCMも含めてラジオだと思うので、かなり寂しいです。
TokyoFMのアプリは、GPSで配信地域をコントロールしていて、TokyoFMの配信地域でしか聞けないようですが、この考え方は、そのままで配信地域の制御とCMと、地域ごとに制御できることを示していますね。
広告収入の分配を電通規模の会社がうまくコントロールしてあげることで、この仕組みはラジオのネット配信の問題点を解決するかもしれません。
そういう意味では主役は、iPhoneやAndroidであり携帯電話ということになると思います。au携帯はFMチューナーを搭載してラジオのアピールをしていたわけですから、うまくネット配信にも乗ってほしいですね。
■日経新聞が電子化
電子版というものが月4,000円で、朝刊と夕刊が読める。
紙の新聞を取ると、朝刊で約3,600円、朝刊夕刊セットで約4,400円なので、電子化された情報で完結しようと思ったらお得ですね。
高い、という声を聞くのですが、どの辺が高いのかがよくわかりません。
最近、堀江さん、磯崎さん、佐々木さんの有料メルマガで月3,000円弱払ってるので、ニュースが毎日配信される新聞が4,000円ってのは高くはないと思っています。
それよりは、配達店に他の新聞の営業するチャンスを与えないのと、古新聞が溜まっていかないというあたりで、かなり興味深いです。
iPhone,iPad、ノーパソにダウンロードして電車の中で読めるとかなら、うれしいんだけどなぁ。どうなんでしょうか?!
ただ、売れるかというとよくわかりません。新聞は、「入れ物(紙)」+流通+情報のセットが商品ですが、入れ物と流通がネットになった場合には、明らかに営業力が下がるわけです。だから、紙とセットなら、電子版を1000円で読めるのは、営業力のポイントが販売店などにあると見ているのかもしれないし、そもそも「同じ情報の読者」のアップセルとして考えれば、紙とセットであれば1000円のアップというのは、立派ですが、ここが値段が高いと思いました。紙を取ってる優良ユーザーだったら、無償かシステム利用料として500円でぐらいが妥当じゃないのかなぁ。コンテンツで金取ったら二重取りです。
(もし電子版が紙+0円になれば、販売店への黄金の断り文句である「ネットでニュース見てるから新聞読まないんです」を封じる営業文句として、「紙を取ってもられえばネットもタダなんで、便利でしょ?」という、食玩商法が通用するので、圧倒的に有利になるハズだったのに。)
ネットのみ配信、の方は、自社サイトの自社広告での営業がメインなのかもしれませんが、商品として販売している広告エリアを使うにも限りがあります。すると、なんだかんだとアフィリエイトや純広告などの広告宣伝費をかけて、販売店の訪問営業に負けないだけの努力をしていかないといけないでしょう。
ひょっとしたら数年後には、1/10ぐらいの価格になってるかもしれませんが、読者が10倍、100倍になる仕組みがないと、本当に新聞崩壊の世界になってしまうので、現時点での最初の一歩として適切な価格だと思いました。
しかし、いよいよ面白い時代になってきましたね!







