2008年12月28日

システム テストプログラム 第2回 "P2Pネットワーク レスポンステスト" 結果

P2P地震情報システム テストプログラム

 12月28日(日),P2P地震情報システム テストプログラム 第2回 "P2Pネットワーク レスポンステスト"を実施しました。

結果

  • 従来の「データ到達時間」実装に問題があり,正確に測定出来ていなかったことが分かりました。
  • 本テストにおいて修正・再調査した結果,現行P2Pネットワークにおけるデータ到達時間(平均値)は次のようになりました。
    2500〜3000ピア時 全平均 50%のピアに 80%のピアに 90%のピアに
    データ到達時間 0.366 s 0.362 s 以内 0.527 s 以内 0.634 s 以内
  • 「発信先の選択」を行うと,シミュレーションでは遅延が約20%改善していましたが,現行P2Pネットワーク上では有意な変化はありませんでした。
  • 「ピア同士の接続の制御」を行うと,シミュレーションでは遅延が約15%改善していましたが,現行P2Pネットワーク上では有意な変化はありませんでした。

おまけ

  • 「どれくらいのピアを経由して届くのか?」 8〜9ピア経由すればほとんどのピアに届く。
  • 「どれくらいの時間で届くのか?」 最良の状態では300ミリ秒でほとんどのピアに届く。

 なお,現在のデータ到達時間(レスポンス)については,サービス状況の「P2Pネットワーク構築状況」-「データ到達時間」にてお知らせしています。

 ※30分毎に更新します。サーバの自動処理で行っているため,サーバの負荷・回線状況などによって不正確な値となる場合があります。

2008年12月17日

テストプログラム スケジュール変更のお知らせ

※この記事は、トップページに記載した内容をそのまま掲載しています。

 申し訳ありませんが,テストプログラムのスケジュールを変更いたします。

テストプログラム名 プログラム配布 プレテスト テスト テスト予備日
サーバ
ストレステスト [済]
12/10〜 - 12/14 12/16 サーバの障害耐性、負荷耐性を試験します。
将来見込まれるピア数の増加、地震の発生に伴うアクセスの集中などにどの程度対応可能かを調べます。
P2Pネットワーク
レスポンステスト
* 12/24〜 * 12/27 * 12/28 * 12/30 ネットワーク上のデータ伝播速度について検査します。
新しいネットワーク構築方法、ソフトウェアの設定などにより、データ到達時間がどう変化するかを調べます。
P2Pネットワーク
コミュニケーションテスト
* 12/31〜 * 01/03 * 01/04 * 01/06 ネットワークの構築状況、データ伝播率について検査します。
サーバ障害時において、ネットワークの状況やデータの伝播がどう変化するかを調べます。
P2Pネットワーク
ストレステスト
* 01/07〜 * 01/10 * 01/11 * 01/13 ネットワーク、ソフトウェアの負荷耐性を試験します。
通信量の増加、一時的な集中などにどの程度対応可能かを調べます。
P2Pネットワーク
ディフェンステスト
* Beta4 RC(リリース候補) リリース以降
(ソフトウェアの攻撃耐性試験を含むため)
サーバ、ネットワーク、ソフトウェアの攻撃耐性を試験します。

2008年12月15日

システム テストプログラム 第1回 "サーバ ストレステスト" 結果

P2P地震情報システム テストプログラム

 12月14日(日),P2P地震情報システム テストプログラム 第1回 "サーバ ストレステスト"を実施しました。ご参加いただきありがとうございました。

よい結果

  • 1サーバあたり約23,000ピアまで耐えられることが分かりました。
  • 最高値は,22時42分の23,568ピアでした。
  • 1分あたり約1,000ピア以上の参加要求を安定的に処理しました。

わるい結果

  • 実質的に,ルータ ストレステストになりました。サーバがネックになったのは,ピーク時のごくわずかな時間でした。
  • アクセスが極度に集中すると,ほとんど接続を処理できなくなるほどパフォーマンスが大幅に低下することが分かりました。
  • テスト用プログラムにおいて,最小化するとエラーが出る,閉じるボタンを押してもプロセスが残るなどの不具合がありました。

おまけ

  • ルータ ストレステストになってしまった。
    • ルータ(WHR-G54S)がボトルネックになり,19時頃まで4,000ピアで停滞。
    • 別ルータ(BBR-4HG)に変更して改善したが,最高値の約23,000ピア付近でふたたび停滞。
  • サーバのスペックというより,TCP/IPコネクション操作がボトルネックになった。
    • サーバ側でソケットをcloseするのは良くない。TIME_WAITが大量に発生してしまう。
    • 処理能力を上回る状態でlistenを続けるのは良くない。すぐcloseしても,FIN_WAIT_1, CLOSING, LAST_ACKといった状態でしばらく残って邪魔になる。

2008年12月03日

P2P地震情報 4周年

 2008年12月3日,P2P地震情報は4周年を迎えました。…だけでは面白くないので,過去のデータを引っ張り出してピア数の推移をグラフにしてみた。

 Beta 3システムでよくここまで耐えられたなぁ,というのが本音です。いや,一時期サーバの不具合でしょっちゅう落ちてましたが,それはとりあえず置いといて。

 Beta 4は,「10000ピアでもちゃんと動きます!」ってはっきり言えるような,「設計された安定性」を提供するバージョンにしたいと思っています。