2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【企業】ANAのシステム障害、イーサネットスイッチが故障 篠辺社長ら減給

1 :蝙蝠傘子 ★:2016/03/31(木) 04:32:49.72 ID:CAP_USER*.net
 3月22日に国内線旅客システム「エイブル」で発生した障害について、全日本空輸(ANA/NH)は3月30日、4台あるデータベース(DB)サーバーの同期処理を中継する「ネットワーク中継機」の故障が原因だったと発表した。障害発生により、篠辺修社長ら経営陣3人の報酬を1カ月間減額する処分を下した。

―記事の概要―
・同期処理に障害
・7万人以上に影響

■同期処理に障害

 ANAによると、日本ユニシス(8056)が構築した国内線旅客システムのうち、故障したのはネットワーク中継機として使用していた、米シスコシステムズ製イーサネットスイッチ「Catalyst 4948E」。一般的に、有線LANによるネットワーク上の機器などを接続するために使用するもので、障害が発生したシステムでは、4台あるDBサーバー同士を接続するのに使われていた。ネットワーク用語では、「スイッチ」と略されることが多い。

 スイッチが故障したことで、DBサーバー間のデーターの整合性が保てなくなるため、自動的にサーバーを停止する機能が作動。本来であれば、スイッチが故障すると「故障シグナル」を発信し、自動的に予備機に切り替わる設計になっていたが、今回はシグナルが発信されず、予備機に切り替わらなかった。

 障害発生を受け、スイッチがシグナルを出さない状況でも、DBサーバーからスイッチの故障を検知できるよう、24日にシステムを改修。不具合が発生したスイッチは、製造したシスコが解析して故障箇所が判明したため、シスコが改善策を検討しているという。

 また、国内線旅客システム全体を点検し、社外の知見も活用した信頼性を向上させるプロジェクトチームを4月に設置。6月まで3カ月かけ、対策を検討する。

(※続く)


・シスコのCatalyst 4948E(同社サイトから)
http://www.aviationwire.jp/wp-content/uploads/2016/03/160330_cisco_4948e_01-600-300x194.jpg

・羽田空港第2ターミナルでANAのカウンターに並ぶ乗客=16年3月22日 PHOTO: Tadayuki YOSHIKAWA/Aviation Wire
http://www.aviationwire.jp/wp-content/uploads/2016/03/160322_0025_ana_rjtt-640-300x194.jpg


Asahi Giken 2016年3月30日 22:55 JST
http://www.aviationwire.jp/archives/85999

2 :蝙蝠傘子 ★:2016/03/31(木) 04:33:31.65 ID:CAP_USER*.net
>>1続き

■7万人以上に影響

 今回のシステム障害が発生したのは、22日午前3時44分。4台あるDBサーバーのうち、1台が停止。残り3台で運用していたが、午前8時22分に4台すべてが停止した。

 その後、午前8時59分に1台を再起動出来たが、DBサーバーを複数立ち上げると不安定な状態が続き、午前9時27分に1台のDBサーバーで運用することを決めた。これにより、空港の自動チェックイン機や旅客係員が使う端末の使用再開に向けて準備作業を開始し、午前11時30分に搭乗手続きに関しては業務を再開できた。

 午後0時46分には予約発券機能が復旧。ANAのウェブサイトによる国内線サービスについても、午後8時10分に復旧した。

 障害の原因となったイーサネットスイッチについては、23日午前1時14分に交換。午前3時5分にDBサーバーの構成を通常の4台に戻した。午前4時14分には、最後まで障害が残っていたエイブルと旅行会社など他社のシステムを接続する部分も復旧した。

 システム障害により欠航した便数は、22日はANAの国内線だけで146便、23日が2便の計148便。影響旅客数は22日が約1万8200人、23日が200人の合わせて約1万8400人にのぼった。遅延便も22日にANAの国内線だけで391便発生し、約5万3700人に影響が及んだ。

 また、同じシステムを使用するスターフライヤー(SFJ/7G、9206)とエア・ドゥ(ADO/HD)、ソラシドエア(旧スカイネットアジア航空、SNJ/6J)、アイベックスエアラインズ(IBX/FW)も影響を受け、ANAと同じトラブルが発生。欠航や遅延が生じた。

 今回の障害発生により、7万人以上の利用者に影響が及んだことから、ANAは篠辺社長ら3人の経営陣に対し、1カ月の報酬減額処分を3月30日付で下した。篠辺社長が20%減額、内薗幸一副社長と、業務プロセス改革を担当する取締役の幸重孝典氏が、それぞれ10%減額となる。

 現在の国内線旅客システムは、2013年7月に稼働。今回の障害発生まで、システムが停止するトラブルは起きていなかった。通常期の予約販売は1台のサーバーで対応できるが、繁忙期は2台分の処理能力が必要だとして、その2倍にあたる4台でシステムを構築した。

 現行の一世代前のシステムでは、2007年5月27日にサーバーのメモリ故障、2008年9月14日に人為的なミスによる障害が発生したが、今回のような顧客データベースの同期に関するトラブルではなかった。2007年のトラブルでは130便が欠航、遅延が464便にのぼり、6万9300人に影響が生じた。2008年は53便が欠航、276便が遅延し、5万4300人に影響が及んだ。

■関連リンク

全日本空輸
シスコシステムズ
日本ユニシス

・ANAのシステム障害、完全復旧 7万2000人影響(16年3月23日)
・ANAのシステム障害が復旧 顧客DBの同期トラブル 7万人影響、146便欠航(16年3月22日)

■関連記事

全日空、ラウンジでiPadなどに雑誌を無料配信 日本ユニシスと
ANA、iPadなどへの新聞雑誌コンテンツ配信を全国に拡大 日本ユニシスと空港ラウンジで
[雑誌]月刊エアライン 16年5月号「ANA国際線30周年」
[雑誌]月刊エアライン 15年5月号「世界と日本のエアライン・フリート」
[雑誌]月刊エアライン 15年4月号「新しいANA」

(終わり)

3 :名無しさん@1周年:2016/03/31(木) 04:35:41.05 ID:VK9PVJyr0.net
最近のciscoのスイッチ、OSはなに??

4 :名無しさん@1周年:2016/03/31(木) 04:40:43.01 ID:gdhiksxi0.net
シスコって製造は中国に移行してなかった?

5 :名無しさん@1周年:2016/03/31(木) 04:42:16.54 ID:wxjHYeGU0.net
またCatalystが悪さかよふざけんなAMD

6 :名無しさん@1周年:2016/03/31(木) 04:42:17.57 ID:ZJYXRly80.net
シグナル来ること前提にしてる設計が悪い

7 :名無しさん@1周年:2016/03/31(木) 04:44:14.51 ID:HEMhgbVo0.net
システムトラブルが起きても、二重化して回避しトラブル以前に冗長化できるシステムをプロなら組める。SIerのレベル低い。ANAの監視システムにも関わるので、テロ不安の昨今、SI変えるべき。

8 :名無しさん@1周年:2016/03/31(木) 04:46:14.36 ID:Ax2zXkBW0.net
> 実は旧システム時代の2007年5月に発生した大規模なシステム障害時もシスコのスイッチ不具合が原因だった

シスコだめだめじゃん。

9 :名無しさん@1周年:2016/03/31(木) 04:48:47.29 ID:GHziaBOM0.net
>>1
まさか中国製じゃないよね?

10 :名無しさん@1周年:2016/03/31(木) 04:50:24.51 ID:MW1higw40.net
イーサネットって久々に聞いたw
なんか

11 :名無しさん@1周年:2016/03/31(木) 04:51:36.18 ID:oAorKQ4o0.net
絶対に仕組まれてるだろ。経済が揺らいだんだ
素人でもわかるわ。

12 :名無しさん@1周年:2016/03/31(木) 04:53:09.40 ID:Ut4fXtja0.net
coregaにしよう

13 :名無しさん@1周年:2016/03/31(木) 04:53:12.26 ID:6PeVLz2z0.net
掃除のおばちゃんのセイにして逃げる手があったとは

14 :名無しさん@1周年:2016/03/31(木) 04:55:26.80 ID:J4hVZxkK0.net
単純にネットワークを物理的に二重化して経路をサーバーで制御したらいいのに

15 :名無しさん@1周年:2016/03/31(木) 04:56:36.81 ID:ExmOS4do0.net
10baseTの馬鹿ハブ付けとけよw

16 :名無しさん@1周年:2016/03/31(木) 04:57:07.40 ID:eGGk6k3d0.net
語るに落ちたな

17 :名無しさん@1周年:2016/03/31(木) 05:01:35.29 ID:yDZXdx8R0.net
シスコのスイッチとかルーターってよく落ちるよね

18 :名無しさん@1周年:2016/03/31(木) 05:02:09.65 ID:eTi5cmGo0.net
Ciscoのせいじゃん

19 :名無しさん@1周年:2016/03/31(木) 05:05:03.74 ID:KlytyAo00.net
でも確かにシスコのスイッチはCCNAのテスト以外触ることほとんどないよなw

20 :名無しさん@1周年:2016/03/31(木) 05:05:15.08 ID:hmEhYlijO.net
まぁ、どうでも いーさね!っと

21 :名無しさん@1周年:2016/03/31(木) 05:06:43.61 ID:50QR1N420.net
>>12
コレガとか懐かしいな
奴には随分、泣かされたよ

22 :名無しさん@1周年:2016/03/31(木) 05:09:23.63 ID:u7V2B9LMO.net
(-_-;)y-~
日本政府が日本●●党を監視保護活動するのは結構やけど、
テヨンちゃんは監視撃滅しなくていいんですか?とつくづく思う。

23 :名無しさん@1周年:2016/03/31(木) 05:10:57.04 ID:RaXLXxec0.net
F欄営業マン 「そこでクラウド化ですよ!」

24 :名無しさん@1周年:2016/03/31(木) 05:11:50.43 ID:OI/VgIZ60.net
コールドスワップしてなかったの?
キチガイ並みの馬鹿だね

25 :名無しさん@1周年:2016/03/31(木) 05:13:04.73 ID:T1Jc0qtH0.net
あんな多くの人に損害を与えて減給だけで済ますのか

26 :名無しさん@1周年:2016/03/31(木) 05:14:09.53 ID:B05VLmNl0.net
條辺って社長は社長でもうどん屋だろ?

27 :名無しさん@1周年:2016/03/31(木) 05:16:39.44 ID:OI/VgIZ60.net
リレー機なんてルーターよりもはるかに安いんで、予備を普通に持ってるのが常識

アホというかありえんだろ
常識

なんたって、設定さえいらない機器だぞw

28 :名無しさん@1周年:2016/03/31(木) 05:16:41.50 ID:7ecOJ96EO.net
やっぱり新幹線最強だな

29 :名無しさん@1周年:2016/03/31(木) 05:19:20.32 ID:wgkSeMUX0.net
CCIEな俺がきました

30 :名無しさん@1周年:2016/03/31(木) 05:19:31.94 ID:O96tAnN20.net
シスコは信頼性高いイメージだったけど

31 :名無しさん@1周年:2016/03/31(木) 05:19:44.09 ID:wgkSeMUX0.net
>>27
あほですか?

32 :名無しさん@1周年:2016/03/31(木) 05:19:53.26 ID:u7V2B9LMO.net
(-_-;)y-~
テヨンちゃんに協力する残念な日本人血統がいるのは認めるけど、
そんなのは枝葉末節なんであってね、大元のテヨンちゃんを切ってくれなきゃいかんよ、日本政府。

33 :名無しさん@1周年:2016/03/31(木) 05:21:36.35 ID:jI9dqBJP0.net
>>14
経路制御もハード+ソフトで柔軟にやろうって規格が数年前から提唱されてるな。
対応ハードも、ぼちぼち出てるはず。

個人でやるこっちゃないから、詳しくは知らないけど。

34 :名無しさん@1周年:2016/03/31(木) 05:22:01.35 ID:dqUxjVoe0.net
>>1
Cisco Catalyst 4948E
Price: $10,591.91 & FREE Shipping
You Save: $5,408.09 (34%)
In stock.
Amazon.com

35 :名無しさん@1周年:2016/03/31(木) 05:23:49.20 ID:RSW4OTTt0.net
>>34
https://nttxstore.jp/_II_CI13360397

36 :名無しさん@1周年:2016/03/31(木) 05:26:13.17 ID:ySOsWiuu0.net
何〜んだ。
ユニシスが請け負った「Catalyst 4948E」の障害だったのか!
てっきり富士通サーバーの故障かと思っていた。

SWの故障なんてよくある話。
真の問題は「何故故障したSWを切り離せなかったか」だな。

それと障害への過信が無かったか?
‘そんな故障はあり得ない’では無かったか?
福島原発事故と全く同じだ。
もう一度障害対策を見直せ!

でも障害復旧に当たったエンジニアの皆さん、お疲れさまでした。

37 :名無しさん@1周年:2016/03/31(木) 05:26:22.92 ID:2tywiU8yO.net
インサートスッチー?
なるほどANAかwww

38 :名無しさん@1周年:2016/03/31(木) 05:26:41.15 ID:alziJcHw0.net
えーーーこのレベルなの?
即クビにしていいレベルのseじゃんかw
ありえねーーーわw
障害起きちゃまずい所の2重化なんて基本だわw

39 :名無しさん@1周年:2016/03/31(木) 05:27:18.42 ID:8ma+R2bR0.net
ワシントン桜まつりの仕返しニダ

40 :名無しさん@1周年:2016/03/31(木) 05:27:47.44 ID:dqUxjVoe0.net
>>35
ひどっw

41 :名無しさん@1周年:2016/03/31(木) 05:29:13.39 ID:8/ILVv+p0.net
飛行機屋は自分は優秀と勘違いしてる無能ばかり
さっさと潰れて路頭に迷って全員新小岩に飛び込め

42 :名無しさん@1周年:2016/03/31(木) 05:29:29.34 ID:zxvZbhwUO.net
エイブルて 九州の襲われた不動産屋と同じ名前‥

43 :名無しさん@1周年:2016/03/31(木) 05:29:46.78 ID:zCuJoli20.net
社長、役員が減給処分したって、客にはなんのお詫びにもなっていない。
せめて、ある1日の搭乗者には特割からさらに30%引きぐらいやんなきゃ、
誠意を見せたことにならんだろ。
なんか内輪ですます内容だな。

44 :名無しさん@1周年:2016/03/31(木) 05:30:10.60 ID:Ih9HzRJb0.net
トークン・リングだったらイーサネット・スイッチは故障しなかったのに。

45 :名無しさん@1周年:2016/03/31(木) 05:30:50.46 ID:UFARPuB30.net
社長役員はこの先10年間手取り10万円なら皆納得

46 :名無しさん@1周年:2016/03/31(木) 05:30:54.17 ID:FWq++i+f0.net
スパッと止まったり全く応答が無くなれば良いのだけど
想定してない変な状態に壊れると異常を検知出来なかったりするよね

原因が分かると社内どころかグループ内からも叩かれる分けだ

47 :名無しさん@1周年:2016/03/31(木) 05:34:51.16 ID:LTtd+Pn/0.net
長々と略の説明してくれるなら、スイッチングHUBである。と書いてよ。

48 :名無しさん@1周年:2016/03/31(木) 05:36:23.61 ID:Hf6wFshA0.net
>>12
最近は幾分マシになったとはいえ
ウンコレガの名は相変わらずなんだよな

…まあここ最近はバッキャローなるライバルも出てきたことだしw

49 :名無しさん@1周年:2016/03/31(木) 05:37:46.81 ID:ZjAWKlme0.net
>>12
ヤメレwww

50 :名無しさん@1周年:2016/03/31(木) 05:38:23.81 ID:ItIiyjFz0.net
>>1
シスコンが悪いんだな
ブラコンはセーフ

51 :名無しさん@1周年:2016/03/31(木) 05:39:36.74 ID:pw/s/bwb0.net
人生を語リスト

52 :名無しさん@1周年:2016/03/31(木) 05:46:22.21 ID:2aGV5mRU0.net
壊れない機械は存在しない

53 :名無しさん@1周年:2016/03/31(木) 05:50:17.81 ID:r61ioczK0.net
これがconfig設定がびみょーに間違ってて...
だったら笑う

54 :名無しさん@1周年:2016/03/31(木) 05:51:38.54 ID:JXtqCe2j0.net
故障検知のシグナルってSNMPtrapの事なんだろうか。
あんなの絶対飛んでくるとは限らない前提で設計すると思うんだが。

55 :名無しさん@1周年:2016/03/31(木) 05:53:19.56 ID:v0C4G1TN0.net
まぁ、いいさ(^^;;

56 :名無しさん@1周年:2016/03/31(木) 05:54:03.92 ID:XT3NSvwD0.net
このレベルだと余罪があるだろ

57 :名無しさん@1周年:2016/03/31(木) 05:54:47.90 ID:mfWJiE3m0.net
カタリストがカタラッチョになっちまったなw

58 :名無しさん@1周年:2016/03/31(木) 06:06:55.24 ID:sZvSXicL0.net
>「ネットワーク中継機」
この場合、スイッチングハブのことなんだろうか。
おれんちにもその末裔がある。レンタルだからオレの所持品ではない。
繋がらないとき、ヤツが悪いのではないかと疑ったことは何度もあるが、
ヤツは結局通じて無実だったー。

59 :名無しさん@1周年:2016/03/31(木) 06:10:21.36 ID:R5vks1Yg0.net
たったそんだけ?そんな壊れるところでもないし、たいした金額の装置でもないのにな
つか、それでなんで復旧にあんな時間かかるんだよ、マヌケw

60 :名無しさん@1周年:2016/03/31(木) 06:13:59.45 ID:d8lh7j9t0.net
>>8
10年前の教訓が活かせてないと言えば簡単だが、イーサネットスイッチの多重化なんて当時は無茶苦茶に面倒くさかった。

61 :名無しさん@1周年:2016/03/31(木) 06:15:08.09 ID:kCdiRbsC0.net
『これ嘘臭いぞ』

22日のトラブルが起きる直前の深夜にサーバーのメンテナンスをやってたんでしょ
それで壊したんじゃないの?

62 :名無しさん@1周年:2016/03/31(木) 06:15:23.65 ID:d8lh7j9t0.net
>>59
滅多に壊れないから、疑わない。
中途半端に壊れていると、壊れていると気づかない。
それがイーサネットスイッチ。

63 :名無しさん@1周年:2016/03/31(木) 06:15:42.82 ID:xujePLPK0.net
>>54
シスコの営業が「うちの製品は絶対大丈夫です」って推したんだろうな。そんで設計要件から抜けた、と

64 :名無しさん@1周年:2016/03/31(木) 06:15:55.31 ID:JrJbl7/H0.net
ユニシスはコンサル代だけ
ガッツリ中抜き
実際に構築したのは下請け
さらに作業は孫受けが受け入れた
派遣じゃないのか?w

65 :名無しさん@1周年:2016/03/31(木) 06:16:14.79 ID:5GRvdQ360.net
オラクルのせいじゃないじゃん

66 :名無しさん@1周年:2016/03/31(木) 06:16:48.09 ID:LiX4n37N0.net
>>6
外部系にウォッチドッグみたいな検出を組み込むって知らんのな

67 :名無しさん@1周年:2016/03/31(木) 06:18:22.52 ID:JrJbl7/H0.net
>>62
ばーか
一般的に物理インターフェース、
論理インターフェースを管理サーバーで
監視してるから運用側が見逃した?
有り得ない
>>61
が一番当てはまる。

68 :名無しさん@1周年:2016/03/31(木) 06:20:09.24 ID:m6ySyDCF0.net
>>34
こっちだぞ
cisco ws-c4948e-e catalyst 4948e es 48port 10/100/1000+ 4 sfp+ ac p/s
Price:$13,806.71 + $33.49 shipping

www.amazon.com/cisco-ws-c4948e-e-catalyst-4948e-48port/dp/B00CIQRUWK/ref=sr_1_5?ie=UTF8&qid=1459372409&sr=8-5&keywords=Cisco+Catalyst+4948E

為替のリスクを考えると鼻毛屋の値段は良心的

69 :名無しさん@1周年:2016/03/31(木) 06:27:10.96 ID:m6ySyDCF0.net
要求分析では耐障害性が極めて重視されるはずで、実現方法、価格、リスク、稼働率を提示されているとおもう
ANAの責任もそれなりにある

70 :名無しさん@1周年:2016/03/31(木) 06:36:45.33 ID:ZFVa/8Ld0.net
snmpとか過信は禁物
底辺に24時間張り付かせとけ

71 :名無しさん@1周年:2016/03/31(木) 07:11:02.15 ID:N5W6j58V0.net
不具合あったらすべての機器の電源を入れなおすってのが
俺の唯一の対処方法

72 :名無しさん@1周年:2016/03/31(木) 07:15:09.47 ID:yM9WA6Ix0.net
スイッチが故障して、そのアラームも故障してたんだろ
そりゃ発見無理だわ

73 :名無しさん@1周年:2016/03/31(木) 07:16:53.23 ID:b0RzaSpm0.net
>>8
今回の報道で、それ思い浮かべた。
やっぱ 同じとこか

74 :名無しさん@1周年:2016/03/31(木) 07:22:00.94 ID:5xD5CCXZ0.net
俺が今関わってるPJでもcatalystを使ってるけど、stackがバラける事象が発生したな。
原因は機器の故障って事で交換したけど。

ただ、まともな死活監視してたらスイッチの故障ってすぐに検知出来るぞ。

75 :名無しさん@1周年:2016/03/31(木) 07:24:02.34 ID:/sunec+E0.net
>>30
え⁉︎

76 :名無しさん@1周年:2016/03/31(木) 07:24:43.02 ID:JrJbl7/H0.net
>>30
物による

77 :名無しさん@1周年:2016/03/31(木) 07:25:39.59 ID:cA+2y8+x0.net
なるほど、こういうシナリオで幕を閉じたかw

シスコというが結局中身はシナ製だろう。情報とりたい放題だし

78 :名無しさん@1周年:2016/03/31(木) 07:25:44.02 ID:2Os3lc9P0.net
IT化なんてしないほうがいいよ
運用ノウハウも全部忘れて電気依存のシステムなんて
ITにいる俺が言うんだから間違いない

79 :名無しさん@1周年:2016/03/31(木) 07:26:50.75 ID:cA+2y8+x0.net
>、篠辺修社長ら経営陣3人の報酬を1カ月間減額する処分を下した。

減額とかw たとえば200万のうち10万円とかだろうw 楽な商売だな

80 :名無しさん@1周年:2016/03/31(木) 07:28:32.35 ID:PiDPUXX+0.net
昔のコンデンサ爆発見てからシスコは使わなくなったなー。

日立のAPRESIAはまったくこわれなくていいぞ

81 :名無しさん@1周年:2016/03/31(木) 07:31:20.67 ID:2BzhPjlA0.net
スイッチは冗長化してなかったんだね。
冗長化しててもいざ障害が発生すると、アレってこともあるけど。

82 :名無しさん@1周年:2016/03/31(木) 07:31:27.42 ID:9eOmnCrn0.net
家庭用LANで言えばハブみたいなもん?

83 :名無しさん@1周年:2016/03/31(木) 07:31:43.72 ID:StTHClN00.net
障害起こるとどうしても複雑な方を疑って単純な方を忘れがちになるよね

84 :名無しさん@1周年:2016/03/31(木) 07:31:54.68 ID:/WI0YGd70.net
もしかして未だにサーバ屋さんとネットワーク屋さんが別組織だったりするんじゃないの?

シスコのスイッチはハードの故障はよくあるけど、二重化(多重化は
絶対に駄目)して瞬断で済み、かつ障害の影響が不必要に広がらないように
デザイン推奨されている。もう20年前からかなりきっちりしたデザインガイドとその設計コンフィグも
シスコは公開している。

その結果、全世界で何十万台も使われていて
しかももっと条件が厳しい金融とかシナのハッカー部隊に狙われている米国防省なんかでも
ノントラブルで稼動している。いや正確に言うと、ハード故障があってもこんなに悪影響を
及ぼさないように極所的におさまるように工夫している。シスコはハードは壊れる、という
ことを前提に製品作りをしている、と俺は理解している。

ANAだけでこんな重要な事故につながる原因がシスコのスイッチのハード故障、ってのはどう考えても不自然。
もしシスコスイッチがNG なら他の超一流企業や米連邦政府で稼動している何十万台ものシステムは何故、同じような新聞ネタに
なるような障害を引き起こさない?

詳細事情は全く分からないけど、IT業界20年の俺の見立てでは、設計と運用の知識経験不足による
人為的ミス何じゃないか?

85 :名無しさん@1周年:2016/03/31(木) 07:33:05.51 ID:sdQv/hW80.net
>>12
せめて親会社の方にしろwww

86 :名無しさん@1周年:2016/03/31(木) 07:35:07.95 ID:zE0kXqg90.net
CCIE持っている奴が
調査しても長時間かかるんだな

87 :名無しさん@1周年:2016/03/31(木) 07:35:31.38 ID:2BzhPjlA0.net
>>84 素人おつ

88 :名無しさん@1周年:2016/03/31(木) 07:35:33.11 ID:/34H21pZ0.net
なんかよくわからんなあ。
故障シグナルとやらを送信するルートも通常は2経路持たせると思うんだけどな。
SWが壊れたのは壊れたでいいんだけど、何故全面停止したんだろうか。。

正直SW故障だけじゃない気がする。たとえば冗長化ソフトウェアのバクだとかw

89 :名無しさん@1周年:2016/03/31(木) 07:36:02.95 ID:bYriR+OD0.net
catalystが飛んだんか
そら想定外だな
シスコつっても中国製なのかな?

90 :名無しさん@1周年:2016/03/31(木) 07:38:02.68 ID:2BzhPjlA0.net
>>89
catalystが故障するのはよくあることだろ。
普通は冗長化してるから違う経路にすぐ切り替わる。

91 :名無しさん@1周年:2016/03/31(木) 07:41:59.82 ID:l9nOvTEQ0.net
>>27
こういつひとよくいるよね

92 :名無しさん@1周年:2016/03/31(木) 07:43:00.90 ID:d1Qy3MU+0.net
VRRPやRSTP使って無かったのかよ。
エクストリーム使ってた方がよかったんじゃね?

93 :名無しさん@1周年:2016/03/31(木) 07:43:46.51 ID:2BzhPjlA0.net
>>27
アホすぎてワロタ

94 :名無しさん@1周年:2016/03/31(木) 07:48:19.04 ID:liQoQ+Qy0.net
よく不祥事で減給処分ってあるけど、会社内で人件費が助かるだけで
実際に迷惑かけられた客には何の関係も無いんじゃないの?

95 :名無しさん@1周年:2016/03/31(木) 07:49:07.10 ID:vaFQuu0b0.net
予備機に切り替わらなかったと書いてあるのに冗長してないと書いちゃう記事すら読まない人達

96 :名無しさん@1周年:2016/03/31(木) 07:49:23.70 ID:XSfMPH140.net
>>90
冗長化を最近覚えた学生さんかなんかか?
冗長化なんて基本すぎること、この規模のシステムでやってないわけねーだろ
冗長化してたって障害が完全に防げるわけじゃない。万能じゃないんだよ

97 :名無しさん@1周年:2016/03/31(木) 07:52:45.61 ID:/34H21pZ0.net
Ciscoが全面的に悪いとしたら、故障シグナルとやらがSWの仕様的な不具合でスイッチングできないならわかる。
まあ、それでも構築時のテストで検出できないSIベンダーも悪いんだがw

さっき言ったように冗長化ソフトのバクだとか、そのバクの修正版を適用してなかったとか、
構築時であれば、信頼設計・設定誤りじゃないかと思う。
それが、SW故障で表面化したんじゃないかなあ。
どうも、SW故障を隠れ蓑にして、SIベンダーが隠しまくっているような気がする。

98 :名無しさん@1周年:2016/03/31(木) 07:57:03.54 ID:SkkYpnTj0.net
素人の皆さんが語る場ですか??

99 :名無しさん@1周年:2016/03/31(木) 07:58:05.84 ID:bNN/OUda0.net
これは酷い

100 :名無しさん@1周年:2016/03/31(木) 07:58:37.56 ID:JCNjn3gQ0.net
>>43
誠意って何かね?

101 :名無しさん@1周年:2016/03/31(木) 07:58:47.39 ID:RQHq3Q2H0.net
おまいらのためにソース貼ってやるよ。
冗長化したって故障検知できなきゃ切り替わらんって話だ。

http://itpro.nikkeibp.co.jp/atcl/news/16/033000936/

102 :名無しさん@1周年:2016/03/31(木) 08:04:33.65 ID:5xD5CCXZ0.net
>>101
ソース読んだけどサーバ側でinterfaceのlink up/downを検知してなかったみたいだよ。
死活監視ではあり得ない設計。

103 :名無しさん@1周年:2016/03/31(木) 08:05:45.01 ID:iR8P2qPl0.net
さすがダメルコ

104 :名無しさん@1周年:2016/03/31(木) 08:05:50.26 ID:JrJbl7/H0.net
>>84
だいたい実はサーバー側の問題だったりするが
力関係で決まるからな。

105 :名無しさん@1周年:2016/03/31(木) 08:09:08.87 ID:z4I/njSC0.net
どうでもいい話だけど、コンフィグ設定って同語反復だよな。
configureが設定の意味なので

106 :名無しさん@1周年:2016/03/31(木) 08:09:37.00 ID:oGOvOjRy0.net
うわー、コイツであの騒動か
イヤすぎるな

107 :名無しさん@1周年:2016/03/31(木) 08:11:20.48 ID:vaMI6oGu0.net
障害切り分け早いなぁ
しかしまたシスコかいな

108 :名無しさん@1周年:2016/03/31(木) 08:12:48.57 ID:iR8P2qPl0.net
ストライキに替わる
新手の共産サボタージュ運動だろ

109 :名無しさん@1周年:2016/03/31(木) 08:16:03.99 ID:OrP3Cie+0.net
安心のYAMAHA

110 :名無しさん@1周年:2016/03/31(木) 08:16:09.43 ID:oGOvOjRy0.net
バグかよ、
不安定なまま稼働て最悪じゃん、
別ソースだとメモリ障害で死活監視だけだったぽいし

あっさり死んだほうがよかったな

111 :名無しさん@1周年:2016/03/31(木) 08:17:45.46 ID:RBpORiAO0.net
最近のシスコは中国に外注してるんだろ

112 :名無しさん@1周年:2016/03/31(木) 08:20:14.83 ID:po4sx6WR0.net
あーこれシスコ倒産だわ

113 :名無しさん@1周年:2016/03/31(木) 08:20:25.70 ID:aOLTn00I0.net
金ケチって冗長ちゃんと組んでなかったんだろ。
linuxのインターフェース冗長は癖あるから、慣れていない奴が組むと、スイッチの単体障害で終わることあるけど。

114 :名無しさん@1周年:2016/03/31(木) 08:20:53.98 ID:6SQX+rbR0.net
IOSのバグみたいたけど不具合がたまにしかでないから気づくの遅れたんかな。
構築時や大規模な設定変更の時は切り替わりテストやるだろうし。

115 :名無しさん@1周年:2016/03/31(木) 08:22:36.65 ID:iuWfP+lP0.net
イーサネットスイッチ「私が死んでも代わりはいるもの」

116 :名無しさん@1周年:2016/03/31(木) 08:22:51.33 ID:RaXLXxec0.net
よく分かんねーけど、システムをクラウド化してたら防げたって
無職の兄が言ってた。

117 :名無しさん@1周年:2016/03/31(木) 08:23:49.73 ID:TT9cgSkw0.net
掃除のおばちゃんがケーブルに足引っ掛けたんだろ・・

118 :名無しさん@1周年:2016/03/31(木) 08:26:31.70 ID:CEYfd5sD0.net
イーサネットスイッチって何かと思ったらスイッチングハブか 懐かしいw

119 :名無しさん@1周年:2016/03/31(木) 08:26:46.15 ID:p6P2ADFc0.net
ハード障害はアラートでないとキツい

120 :名無しさん@1周年:2016/03/31(木) 08:27:01.23 ID:bYriR+OD0.net
IOSって今でもDOSみたいな画面なの?

121 :名無しさん@1周年:2016/03/31(木) 08:27:21.91 ID:lR/QJ8Ij0.net
伝送路のサイレント故障一発でシステムダウンするとか
どんだけ脆弱なシステムなんだよ

122 :名無しさん@1周年:2016/03/31(木) 08:27:27.08 ID:PUicH84T0.net
3時に一台止まって8時に三台停止
この辺がよくわからん何だこの五時間は

123 :名無しさん@1周年:2016/03/31(木) 08:27:27.16 ID:W+jx5czW0.net
まあ表向きANAが責任負うけど
構築請け負ったシステム屋は針の筵だな

124 :名無しさん@1周年:2016/03/31(木) 08:28:29.76 ID:fjZIxdVB0.net
シスコ ≒ サンフランシスコ?

125 :名無しさん@1周年:2016/03/31(木) 08:29:00.66 ID:po4sx6WR0.net
ヤマハスイッチのがいいなこれ

126 :名無しさん@1周年:2016/03/31(木) 08:29:30.33 ID:qWIJ1n/50.net
ヽ(・ω・)/ズコー
でもネットワーク機器の故障はほんと面倒くさい
昔、微妙に繫がったり繋がらなかったりするスイッチの故障に悩まされたわ

127 :名無しさん@1周年:2016/03/31(木) 08:29:42.52 ID:NqMghZ0z0.net
GW初日に乗る予定だから今のうちに膿出してくれたみたいなもので良かった

128 :名無しさん@1周年:2016/03/31(木) 08:30:39.55 ID:Fx8Clg6e0.net
ハブに噛まれたのか
御愁傷様

129 :名無しさん@1周年:2016/03/31(木) 08:30:47.44 ID:6SQX+rbR0.net
>>120
そうだよ
Configはコマンドライン

130 :名無しさん@1周年:2016/03/31(木) 08:31:04.73 ID:Eu7OVadq0.net
>>127
こういう考え方するやつって

131 :名無しさん@1周年:2016/03/31(木) 08:31:26.92 ID:iR8P2qPl0.net
害国製をたたき出すべき

132 :名無しさん@1周年:2016/03/31(木) 08:33:10.87 ID:47KBx8RN0.net
>>66
だいたい、死活監視による自動切り替えはいざ起こると過負荷でこける

133 :名無しさん@1周年:2016/03/31(木) 08:33:30.76 ID:m9mt1HyL0.net
故障じゃなく侵入だろ?
プロは端末ではなくルータなんかをまずアタックするから。

134 :名無しさん@1周年:2016/03/31(木) 08:33:35.68 ID:6SQX+rbR0.net
>>125
ヤマハは国内中小企業向け
シスコはワールドワイド

135 :名無しさん@1周年:2016/03/31(木) 08:34:10.39 ID:z4I/njSC0.net
>>130
ANAもSIも全員思ってるだろうよ。GW中だったらさらに甚大な被害だった。

136 :名無しさん@1周年:2016/03/31(木) 08:35:24.06 ID:JCnfVAqI0.net
ここの運用担当ってスゲー無能なんじゃねーの?
スイッチでフォールトトレランスが機能するのを半日以上じっと待ってたってこと?
それともスイッチが原因だってことに気付くまでに半日もかかったってこと?
どちらにしても素人だろw派遣だけで回してたのかな?

137 :名無しさん@1周年:2016/03/31(木) 08:35:26.52 ID:kv4gUZCR0.net
基幹システムにユニシス(笑)
しかもオープン系(笑)

オンラインゲームかよwww

138 :名無しさん@1周年:2016/03/31(木) 08:35:56.85 ID:JCnfVAqI0.net
>>130
社員だろ

139 :名無しさん@1周年:2016/03/31(木) 08:36:08.08 ID:6SQX+rbR0.net
>>133
アホか
ルータにアクセスさせないためファイヤーウォールがあるだろ

140 :名無しさん@1周年:2016/03/31(木) 08:36:31.91 ID:bYriR+OD0.net
>>129
マジかwシスコ成長してないな

141 :名無しさん@1周年:2016/03/31(木) 08:36:50.48 ID:RQHq3Q2H0.net
>>136


お前は世界初のバグを見抜けるほど有能なのか?

142 :名無しさん@1周年:2016/03/31(木) 08:36:57.93 ID:JCnfVAqI0.net
>>137
おじいちゃんCOBOLのお仕事はもう終わったでしょ

143 :名無しさん@1周年:2016/03/31(木) 08:37:51.71 ID:JCnfVAqI0.net
>>141
恥ずかしいからしばらくROMってろよ

144 :名無しさん@1周年:2016/03/31(木) 08:38:55.97 ID:8VcsvVuf0.net
保守点検しないのか
シスコは永久保証?

145 :名無しさん@1周年:2016/03/31(木) 08:39:27.54 ID:CmXJF2LS0.net
シスコは何億円請求されんだろうか

146 :名無しさん@1周年:2016/03/31(木) 08:39:33.30 ID:z4I/njSC0.net
>>141
2chには世界がひれ伏すトップエンジニア様が腐るほど集まってますからwww

147 :名無しさん@1周年:2016/03/31(木) 08:40:29.64 ID:Xse3Sq6V0.net
ヤフオクでシスコの業務用ルータが安かったから落札したけど
音がうるさい上にレンジ使うとブレーカーが落ちるから結局バッファローに戻したわ

148 :名無しさん@1周年:2016/03/31(木) 08:40:42.43 ID:2PGSyxbr0.net
>>8
日本製のapresia使うべし。

149 :名無しさん@1周年:2016/03/31(木) 08:40:54.65 ID:yQ6BWFDu0.net
>>141
外部から見るとそんな印象なんだな

150 :名無しさん@1周年:2016/03/31(木) 08:41:12.22 ID:YB9FBFI60.net
ググるの面倒だから聞くけどこれってL2スイッチ?

151 :名無しさん@1周年:2016/03/31(木) 08:41:18.14 ID:oGOvOjRy0.net
>>136
恥ずかしいから暫くromってろよ

152 :名無しさん@1周年:2016/03/31(木) 08:42:27.95 ID:mHUKIZ0/0.net
原因は、Realtek(蟹)ですた

153 :名無しさん@1周年:2016/03/31(木) 08:42:35.56 ID:SCX/TVQ30.net
スイッチ故障が自動検知できなくても、手動で交換すれば良いだけだから、あんな長時間のトラブルには
ならないはず。本当の理由を発表すると困る人間が大勢いるので、落とし所としてスイッチの所為にして
いるだけでは。

154 :名無しさん@1周年:2016/03/31(木) 08:43:47.69 ID:6SQX+rbR0.net
>>144
保守はNierの仕事
普通は年間契約。今回は運用の仕事。
障害切り分けをした結果保守にまわす。

155 :名無しさん@1周年:2016/03/31(木) 08:43:53.08 ID:JCnfVAqI0.net
>>151
俺を煽ってもシスコが責任を負うことは一切ないぞ?

156 :名無しさん@1周年:2016/03/31(木) 08:44:40.38 ID:toPtaePy0.net
手動で切り替えてればよかっただけか
原因がわからずパニックになった保守が無能だったね

157 :名無しさん@1周年:2016/03/31(木) 08:44:48.36 ID:aH2NC2fl0.net
冗長化不足
元々メインフレームのPCサーバ化なんだから
別データセンタで別クローンくらいつくればいいのに
予算がなくても、同センタで負荷分散機から下くらいのクローン
ならいけるっしょ

光波長多重なんて、機器なんかより
ケーブルメンテでさえ震えるのに

158 :名無しさん@1周年:2016/03/31(木) 08:44:54.94 ID:xtJ17UIdO.net
>>136
>>141

(´・ω・`) 冗長かはしたが
切り替わるかのテストしてなかったんだろ
いやまじに箱だけかって満足な客っているよ

159 :名無しさん@1周年:2016/03/31(木) 08:45:40.71 ID:vHzKcpP70.net
dellのスイッチはうんこだった覚えがある 

160 :名無しさん@1周年:2016/03/31(木) 08:46:09.50 ID:Kqmd6v+n0.net
>>27
L2
L3
L4
とあってだな。
これだけでかいシステムだとL2といえども普通に設定入ってるから。

161 :名無しさん@1周年:2016/03/31(木) 08:46:26.16 ID:FvOQcoqn0.net
経営陣の減給じゃなく運賃を安くしろ

162 :名無しさん@1周年:2016/03/31(木) 08:46:27.75 ID:WGPMMmFX0.net
社長「サイバーテロなら他人のせいにできるのに、減給なんてギギギ……」

163 :名無しさん@1周年:2016/03/31(木) 08:46:34.32 ID:p6P2ADFc0.net
映画とかでネットワークの状況が画面にでるよね。ああいうのはないのか

164 :名無しさん@1周年:2016/03/31(木) 08:46:45.09 ID:xtJ17UIdO.net
>>157
それ提案しても無駄なお金がかかるって嫌がる客おおい

165 :名無しさん@1周年:2016/03/31(木) 08:46:49.63 ID:+H5iksG70.net
技術屋と素人の意見が真反対になっとるなwwww
まさかただのスイッチが連鎖不具合を起こすなんて予想できんよ
この障害は仕方がないわ

あ、スイッチの意味がわかってる人とわかっていない人もいるかな?

166 :名無しさん@1周年:2016/03/31(木) 08:47:13.69 ID:CwhtBYFi0.net
Layer2 スイッチング・ハブか。
宇宙ステーションに搭載したのはHP製だったな。

167 :名無しさん@1周年:2016/03/31(木) 08:48:28.38 ID:FlcJIX7X0.net
ここまで予測したテストはしないよね…

168 :名無しさん@1周年:2016/03/31(木) 08:48:53.49 ID:xtJ17UIdO.net
>>165
(´・ω・`) ストリームなんて一発で起きるぞ?
まともなSEいないんだろな

169 :名無しさん@1周年:2016/03/31(木) 08:50:05.55 ID:cMQB95i20.net
これはしすこたん悪くないんじゃね?

スイッチ自体に確かに切替機能もついてるけど
サーバー間でハローコール異常検出機能しっかりつけとけばサーバが自動で切り替えるだろ
システム作ったやつが馬鹿

170 :名無しさん@1周年:2016/03/31(木) 08:50:06.91 ID:drCZKjvP0.net
>>2
>  また、同じシステムを使用するスターフライヤー(SFJ/7G、9206)とエア・ドゥ(ADO/HD)、ソラシドエア(旧スカイネットアジア航空、SNJ/6J)、アイベックスエアラインズ(IBX/FW)も影響を受け、ANAと同じトラブルが発生。欠航や遅延が生じた。

ANAとのシステム統合を拒否ってるスカイマークには朗報

171 :名無しさん@1周年:2016/03/31(木) 08:50:25.18 ID:HkvICdzT0.net
スイッチと書いてはあるけどこのランクの機器を普通L2のバカスイッチとしては使わない

172 :名無しさん@1周年:2016/03/31(木) 08:50:33.69 ID:JCnfVAqI0.net
>>165
>ただのスイッチが連鎖不具合を起こすなんて予想できん

お前が技術屋側じゃない事を祈るよ
もしそうなら辞表書いてくれ

173 :名無しさん@1周年:2016/03/31(木) 08:51:19.17 ID:HnhnkS1s0.net
カタリストなら冗長設定できんじゃないの?
フェールオーバーするときの設定間違ってたとか?
まさか単体のL2設計はないだろうし

174 :名無しさん@1周年:2016/03/31(木) 08:51:48.70 ID:z4I/njSC0.net
まあ世界初のバグだろうがゴキが入り込んでショートしようが宇宙線()の影響だろうが、
何かが起こってあらゆる想定が崩れたときの為の次の一手を用意してないとだめで、
ナンセンスだろと客が思うレベルまで冗長性持たせないといかんのは、
まあ難儀な仕事ですね

175 :名無しさん@1周年:2016/03/31(木) 08:52:56.63 ID:oGOvOjRy0.net
>>155

お前、現場の人間じゃないだろ?
いろいろおかしいぞ()
運用が派遣とか言ってるが運用は事象を保守や顧客に報告して
対応するのは保守だ、

176 :名無しさん@1周年:2016/03/31(木) 08:53:32.59 ID:SVWxHQq+0.net
ネットワーク中継機って何かと思ったらカタリストか。
故障はしょうがないにしても、対策が余りにしょぼすぎる。

177 :名無しさん@1周年:2016/03/31(木) 08:53:56.81 ID:oGA1tO9b0.net
バカハブwwwwwww

178 :名無しさん@1周年:2016/03/31(木) 08:54:13.10 ID:zErxzHno0.net
これ、DBサーバーを構築した奴めちゃくちゃ憤っていると思う
急に呼びだされて罵られて急がされて、結果スイッチかよって
シスコにはあらかた原因がわかったあと連絡いっただろうし、なんの苦労もせず他人事だろうな
設計したの本国のやつらだしって感じで

179 :名無しさん@1周年:2016/03/31(木) 08:54:27.21 ID:oGOvOjRy0.net
>>172
恥ずかしいから一生romってろよ

180 :名無しさん@1周年:2016/03/31(木) 08:55:14.20 ID:toPtaePy0.net
なぜ理系は空気読まずヲタトークみたいに
専門知識を長文で書き込みたがるんだろね

181 :名無しさん@1周年:2016/03/31(木) 08:55:37.95 ID:cMQB95i20.net
>>167
インフラとかの止められないシステムは何重系にもしてどこが壊れても止まらないようにするのは基本
スイッチ故障時のネットワーク切替は初歩中の初歩だわ
本当に重要度が高いシステムは最悪ダウンしてもシステム縮退運転可能なように別拠点作ったりもするし

182 :名無しさん@1周年:2016/03/31(木) 08:55:47.58 ID:C4sH5FBI0.net
いいさ

183 :名無しさん@1周年:2016/03/31(木) 08:56:41.62 ID:rfaaS7so0.net
>>12
coregaのスイッチ10年以上使ってるわ

ちょっと接触悪いと接続切れる、ケーブル引っ張ると繋がったりする
さすがに無線に切り替えようか検討中

184 :名無しさん@1周年:2016/03/31(木) 08:57:58.13 ID:Y3vVgffg0.net
>>112
シスコめっちゃ金持ちだから
今回の損害全額被っても屁でもないよ。

185 :名無しさん@1周年:2016/03/31(木) 08:58:54.26 ID:HnhnkS1s0.net
>>172
スパニングツリープロトコルや重み付けとか言ってもわからん人だろう
enableてなに?ポイしw

186 :名無しさん@1周年:2016/03/31(木) 08:59:02.96 ID:oGOvOjRy0.net
>>181
震災停電とか派手に飛ばないと別拠点てことにならないからな〜、
今回の結構盲点かも、

187 :名無しさん@1周年:2016/03/31(木) 08:59:44.53 ID:cMQB95i20.net
>>173
冗長設定というか専用線で並列運転できるしなあ
スイッチの設定+サーバのハローコール異常検出機能がアホすぎてやらかしたんじゃない?

188 :名無しさん@1周年:2016/03/31(木) 09:00:08.35 ID:yQ6BWFDu0.net
>>112
それはないでしょ、何か金銭的な責任を負うことも無いだろうし
日本の馬鹿ユーザーの馬鹿な風評被害には遭うかもしれないけど…

189 :名無しさん@1周年:2016/03/31(木) 09:00:12.54 ID:7BZqVozf0.net
思いも寄らぬ中途半端な壊れ方をしたのかもしれんが、スイッチ故障でそんなに時間かかるのも珍しいな。
これ同じ機種導入してる奴らは客から詰められるんだろうなぁ。Ciscoにいなくてよかったw

190 :名無しさん@1周年:2016/03/31(木) 09:01:41.25 ID:Fzj95kfK0.net
2重化されてるが中途半端に死んだから検知出来ないって奴だろ。
スイッチがリブートかかるとかまで行ってくれりゃ問題なかったろうに。

191 :名無しさん@1周年:2016/03/31(木) 09:02:42.11 ID:2bwj/3sQ0.net
バッファローの安いの買って、
すぐ変えれるように予備たくさん持っておくほうが吉

192 :名無しさん@1周年:2016/03/31(木) 09:03:05.85 ID:V9FcD09z0.net
シスコ使ってても、使ってるやつがアホならこうなるわなw

193 :名無しさん@1周年:2016/03/31(木) 09:03:18.23 ID:JMh8yV/E0.net
>>8
去年も大規模システムダウンあったし

194 :名無しさん@1周年:2016/03/31(木) 09:04:03.62 ID:cMQB95i20.net
>>186
今回主要システム死んだとしても
各空港の端末に、
@最新ではないにしろ乗客情報のDB情報をCSVなりなんでもいいから残す
Aスタンドアロンになってもその情報を印刷可能にする
って最低限の機能があって印刷さえすれば
紙と鉛筆で、チェックイン、荷物検査、持ち物検査、搭乗手続き位はできただろって思うけどな
空港管制が落ちたわけじゃないし

195 :名無しさん@1周年:2016/03/31(木) 09:04:07.69 ID:9Gya6h+s0.net
>>180
ヲタだからだろ

196 :名無しさん@1周年:2016/03/31(木) 09:04:13.64 ID:Y3vVgffg0.net
>>164
いざってときにこんだけ損害出すことをわかってないからな。
ボンクラ決裁者にシステムは動いて当たり前みたいな人たち多いから。
やっぱり企業の経営陣はもっと若い人じゃないとこれからの時代の判断についていけんわな。

197 :名無しさん@1周年:2016/03/31(木) 09:04:31.11 ID:UefOBtX40.net
Ciscoって名前と値段高いだけだったのか・・・

198 :名無しさん@1周年:2016/03/31(木) 09:04:31.25 ID:JMh8yV/E0.net
>>192
アホに使えるの開発しないと意味なくね?
天下りみたいに斡旋してほしいためにシステム誤操作させる危機煽り?

199 :名無しさん@1周年:2016/03/31(木) 09:05:05.82 ID:UlIeJsEB0.net
イーサネットスイッチ?
ロードバランサーじゃないの?

200 :名無しさん@1周年:2016/03/31(木) 09:05:13.55 ID:JMh8yV/E0.net
>>194
csvもうね
プログラマの限界か

201 :名無しさん@1周年:2016/03/31(木) 09:05:41.07 ID:cMQB95i20.net
>>191
狂牛みたいな民生品をサーバ用途で使えると思うなよ・・・
負荷重くなるとSWでさばけなくなってスループット低下、終了
という最悪な事態になる

202 :名無しさん@1周年:2016/03/31(木) 09:05:41.10 ID:qUV/jEPr0.net
これって「ハブ」のことなのかかね?

おかしくなって
一旦電源を切って入れなおしてもダメなことはあるなぁ
ルーターの再始動と、端末の再始動の順番もあるよなぁ

203 :名無しさん@1周年:2016/03/31(木) 09:06:26.62 ID:+IGBjeXZ0.net
ほんとぉ?メインフレームが落ちたんじゃないのぉ?

204 :名無しさん@1周年:2016/03/31(木) 09:07:34.33 ID:oGOvOjRy0.net
>>189
外野が後から言うのは簡単、
死活監視だけだったらメモリ障害と特定するまで時間要しただろうし、

事象としてはレスポンス悪化だけでなんとか動いてようだし、
その後、サーバ1台コケて… いろいろパニクってただろうな

205 :名無しさん@1周年:2016/03/31(木) 09:07:36.73 ID:UlIeJsEB0.net
つうか、本番システムが落ちたときの業務運用を確立してない時点でANAがアホ

206 :名無しさん@1周年:2016/03/31(木) 09:08:33.35 ID:Y3vVgffg0.net
>>194
DBがからむシステムでそれは殆ど無理なんじゃないかな。
むしろcsvに書き出すよりDBファイルをrawで引っこ抜くほうが時間が短くて
システム負荷によるサービス影響は小さくできると思うけども、
そもそもどっちの方法にしろDBの静止点を確保するのはものすごく大変。

207 :名無しさん@1周年:2016/03/31(木) 09:10:19.90 ID:cNlpvv0P0.net
>>202
L3スイッチのUDLD機能とかそんなののバグなんじゃね。

今は冗長されてりゃバッサリ落としも問題ない。
障害を検知する仕組みの不具合だろ。

最近シスコ入れてるがバグでまくり。
品質酷いわ。

208 :名無しさん@1周年:2016/03/31(木) 09:10:25.18 ID:m9mt1HyL0.net
しかし、シスコでこれか。
安物ネットギアのうちは何時落ちてもおかしくないなw

209 :名無しさん@1周年:2016/03/31(木) 09:12:45.41 ID:cNlpvv0P0.net
>>201
今ハードウェア処理なんで、処理できなくなるトラフィクが流れるなんて無い。
ブロードキャストとかCPUで処理する系なら別だが。

210 :名無しさん@1周年:2016/03/31(木) 09:14:25.05 ID:WJiPpEne0.net
>今回はシグナルが発信されず、予備機に切り替わらなかった
シグナル無しだと厳しいな

211 :名無しさん@1周年:2016/03/31(木) 09:15:19.07 ID:oGOvOjRy0.net
>>207
障害発生機器が死活監視のみだったようだし
メモリ障害をアラートで検知できてりゃ違ったかも

サーバ4台全部落ちる事態は防げたかも

212 :名無しさん@1周年:2016/03/31(木) 09:16:32.09 ID:/fcwSeMF0.net
L2なのL3なの?

213 :名無しさん@1周年:2016/03/31(木) 09:17:43.27 ID:C3+GOVAH0.net
回線断で検知できなかったのかな

214 :名無しさん@1周年:2016/03/31(木) 09:18:10.07 ID:6SQX+rbR0.net
>>212
IOSを替えればL2にもL3にもなる

215 :名無しさん@1周年:2016/03/31(木) 09:18:37.43 ID:xRActgXY0.net
システムを1カ所におくからだよ。地震とかも考えてバックアップ
システムを大阪あたりにおいとけ。
そうすりゃ短時間で復旧するだろうが。

216 :名無しさん@1周年:2016/03/31(木) 09:19:41.21 ID:6SQX+rbR0.net
>>213
WANじゃなくLANの問題

217 :名無しさん@1周年:2016/03/31(木) 09:21:12.37 ID:ZpMEM8970.net
トラブルの内容的にすぐにネットワーク関係ってすぐにわかって
どこのL2かもすぐにわかったんだろうけど

修理交換したあとの運用方法とか
交換して、滞留しているデータが
どのようになるか予想がつかなくて
その判断に時間がかかったと思う

218 :名無しさん@1周年:2016/03/31(木) 09:21:41.19 ID:vHzKcpP70.net
バックアップ側に切り替わらない半分生きてる状態は嫌だな 

219 :名無しさん@1周年:2016/03/31(木) 09:22:11.04 ID:zQ2Km9Lz0.net
発表遅すぎる。
だからANAは信用しない。

220 :名無しさん@1周年:2016/03/31(木) 09:22:51.84 ID:us5xhuvZ0.net
>>61
メンテついでに、スイッチ再起動したら、壊れたとか?

221 :名無しさん@1周年:2016/03/31(木) 09:24:02.49 ID:OD227aiq0.net
減給でい〜さ〜

222 :名無しさん@1周年:2016/03/31(木) 09:24:03.03 ID:Po0mBKK+0.net
マジかよ太陽とシスコムーン最低だな

223 :名無しさん@1周年:2016/03/31(木) 09:24:03.42 ID:GTNpc8VW0.net
シスコ製は中国がハードウェアからして、情報を中国に送信するように
仕組まれているって10年以上前から言われてる

224 :名無しさん@1周年:2016/03/31(木) 09:24:10.94 ID:76HakY3Y0.net
>>92
RAC組むときはスパツリ厳禁な
ISL使ってたんだろ
4500XでVSSにしときゃよかったのに

225 :名無しさん@1周年:2016/03/31(木) 09:24:26.28 ID:/gYJpWnx0.net
>>219
おまえだったらその日のうちに調査完了できるのかよクソニート

226 :名無しさん@1周年:2016/03/31(木) 09:26:04.30 ID:zQ2Km9Lz0.net
>>225
処分の発表と調査発表を一緒にするのはキモいから

227 :名無しさん@1周年:2016/03/31(木) 09:26:09.33 ID:yGNsAq2S0.net
シスコ「どうしてもシステムがスカイネットに移行したがる」

228 :名無しさん@1周年:2016/03/31(木) 09:26:12.67 ID:cNlpvv0P0.net
>>215
別の場所に置いても今回の障害は発生するよ。
スイッチからの情報が無ければシステムが切り替わるようにサーバー側で変えたってあるから、
最初からそうしてりゃ良いだけ。

229 :名無しさん@1周年:2016/03/31(木) 09:27:36.81 ID:/gYJpWnx0.net
>>226
お前は何が気に入らないんだよ、発表まで時間がかかったことか?それとも調査結果と役員の処分が同居したことか?

230 :名無しさん@1周年:2016/03/31(木) 09:28:13.97 ID:dgiPyomr0.net
>>61
> 22日のトラブルが起きる直前の深夜にサーバーのメンテナンスをやってたんでしょ
> それで壊したんじゃないの?

あほかw

サーバーのメンテナンスをやった程度で壊れることはない。

231 :名無しさん@1周年:2016/03/31(木) 09:28:44.52 ID:cNlpvv0P0.net
>>224
4500Xもだいぶ枯れてきたから、一応スイッチングくらいしかしないなら安定してるな。

複雑なことやるとほんとバグ多い。

232 :名無しさん@1周年:2016/03/31(木) 09:29:17.79 ID:/zbNGnRg0.net
>>1
こういうのって何者かにLANケーブル抜かれてましたなんて事でも故障扱いするんじゃね
とか思ってしまうだけに何か腑に落ちないんだよなぁ

233 :名無しさん@1周年:2016/03/31(木) 09:29:28.00 ID:zQ2Km9Lz0.net
>>229
同居が変態会社を醸し出してるわ
しかもヘボシステムやん

234 :名無しさん@1周年:2016/03/31(木) 09:29:30.78 ID:HkvICdzT0.net
>>230
メンテナンス用に一時的に設定いじって作業しておいて
最後なおし忘れたとかそういうレベルならありえる

235 :名無しさん@1周年:2016/03/31(木) 09:29:54.56 ID:pclbU+g40.net
マジかよケロッグ最低だな

236 :名無しさん@1周年:2016/03/31(木) 09:34:27.56 ID:XfRAsZgQ0.net
こーいうの再現ドラマで見たいなー

237 :名無しさん@1周年:2016/03/31(木) 09:35:10.80 ID:zErxzHno0.net
>>235
俺はカルビーのフルグラがいいわ

238 :名無しさん@1周年:2016/03/31(木) 09:38:07.65 ID:acU0n+GJ0.net
はっきり言ってシスコの使いたくないわ
機能も多すぎるからだろ
こけたら大変だった

239 :名無しさん@1周年:2016/03/31(木) 09:40:15.80 ID:YNq/YT790.net
多少なりとも専門的な用語についていけない、イメージ出来ない奴が
「再起動でミスったに違いない!!!発表はウソ!」
って陰謀論で囃し立てて、自分が理解できないことから逃げてるだけなのに
「俺は真実を推理できる!」って妄想にすがりついてるなw

240 :名無しさん@1周年:2016/03/31(木) 09:40:22.00 ID:O/Ad78PM0.net
セキュリティのスペシャリストって大変な業務だね。

241 :名無しさん@1周年:2016/03/31(木) 09:40:30.34 ID:hqNEEuwP0.net
ANAってバカだなー。

どうせC言語とかいう言語でプログラミングしてたんだろ?

時代はC++言語なんだよ。

242 :名無しさん@1周年:2016/03/31(木) 09:41:17.73 ID:qJnnb+Sb0.net
冗談性に欠けるシステムだなキリッ

243 :名無しさん@1周年:2016/03/31(木) 09:42:16.43 ID:YJTiqRUb0.net
こう言うのってAWSに相似形のシステム置いておかないの?
最小インスタンスでレプリケーションだけしておくとか

244 :名無しさん@1周年:2016/03/31(木) 09:46:23.58 ID:3BsCwUSl0.net
スイッチがあるから起きた
スイッチは悪者

245 :名無しさん@1周年:2016/03/31(木) 09:48:48.14 ID:l/CE/oM10.net
チーミングしてなかったの?

246 :名無しさん@1周年:2016/03/31(木) 09:48:48.46 ID:HnhnkS1s0.net
>>230
電源再投入後に問題起こすことが多いよ機器て
1年間何ら問題なく動いてきたストレージが電源投入の電圧で赤ランプ付きまくったりはよくあること
半分生きてる状態でメンテ後のテストはクリアしたが実業務データ流したら問題芋ずるだったかな

247 :名無しさん@1周年:2016/03/31(木) 09:49:41.77 ID:cNlpvv0P0.net
>>242
シスコのスタック構成もマスターハングアップして、他の機器も通信できなくなることもあったし、
所詮壊れたらそんなもん。

248 :名無しさん@1周年:2016/03/31(木) 09:50:54.97 ID:lcAg6/ul0.net
故障してもアラート上がらないとか怖すぎ
未知のエラーならファームウェア替えないと、シスコさん頼むで

249 :名無しさん@1周年:2016/03/31(木) 09:51:06.39 ID:MRG7YQQJ0.net
知ったかのホラ話と的を得た話と両極端になってるなwww

250 :名無しさん@1周年:2016/03/31(木) 09:52:21.22 ID:XPRysnU30.net
やっぱメルコだな

251 :名無しさん@1周年:2016/03/31(木) 09:53:07.31 ID:8cHTujTE0.net
>>246
つまりハードウェアが故障したってことでしょう?

252 :名無しさん@1周年:2016/03/31(木) 09:55:33.19 ID:HnhnkS1s0.net
>>251
中途半端にエラーかハードウエアかその他か誰もわからんわw
メンテ後は問題は起きやすいてことだけ

253 :名無しさん@1周年:2016/03/31(木) 09:56:42.60 ID:V7ZH/i2l0.net
ネットワークを構成している機器の故障は
電源故障などで完全にネットワークから切り離されれば影響は最小限に抑えられるが
OSの暴走や変な壊れ方するとネットワーク全体に影響を及ぼすのは常識
またほとんど24H稼働だから電気設備点検などでたまに電源OFFしたあとのONで故障することがある

それを踏まえてルーティングを構成しないとこうなる

254 :名無しさん@1周年:2016/03/31(木) 09:58:00.25 ID:cNlpvv0P0.net
>>248
故障したらアラート上がらない場合があるから、
普通は定期的にポーリングして情報を取得するよ。

255 :名無しさん@1周年:2016/03/31(木) 09:58:31.61 ID:N8UJ2e890.net
日本製システム使えや

256 :名無しさん@1周年:2016/03/31(木) 09:58:53.99 ID:k4om96mv0.net
CISCOか?

257 :名無しさん@1周年:2016/03/31(木) 10:00:00.96 ID:HXKWKjIs0.net
>>8
イーサネットスイッチなんて、壊れるものなの?

258 :名無しさん@1周年:2016/03/31(木) 10:00:41.74 ID:W0EVhaDX0.net
>>243
awsに置いたところで今回のような障害では意味が無い

259 :名無しさん@1周年:2016/03/31(木) 10:00:55.53 ID:g5mbjaP80.net
アイヤー チャイナからパケットスヌープやろうとして 手がすべったアル

260 :名無しさん@1周年:2016/03/31(木) 10:01:37.59 ID:k4om96mv0.net
>>253
スイッチって冗長化しないっけ?
そういえばした記憶無いなぁ

261 :名無しさん@1周年:2016/03/31(木) 10:02:38.92 ID:cNlpvv0P0.net
>>257
たまーにあるよ。
運悪いとロット不良でリコールとかもある。

一番発生率高いのはファン故障かな。

262 :名無しさん@1周年:2016/03/31(木) 10:04:20.02 ID:RgbU9bs10.net
いーさいーさたまーにはあるさー

263 :名無しさん@1周年:2016/03/31(木) 10:05:18.48 ID:YNq/YT790.net
>>257
基本的に壊れない機器はない。

スイッチング機器も電気仕掛けである以上、
熱や経年劣化で部品の弱体化はするし、
電源切断/投入時の急激な電圧変化がきっかけで逝ってしまうケースはあるし、
そういう事がなくても逝ってしまう事もある。

264 :名無しさん@1周年:2016/03/31(木) 10:06:01.46 ID:6SQX+rbR0.net
>>261
確かにファンの故障は多いね。
故障したスイッチはファンも冗長できるみたい。

265 :名無しさん@1周年:2016/03/31(木) 10:06:11.26 ID:5xqK43Kc0.net
シスコも災難だな

266 :名無しさん@1周年:2016/03/31(木) 10:07:50.64 ID:k4om96mv0.net
portが死ぬのはあるけど全部逝っちゃったのかな?

267 :名無しさん@1周年:2016/03/31(木) 10:09:08.67 ID:X1axGwkD0.net
ストレートケーブルとクロスケーブルを間違えたじゃなくてよかったなw

268 :名無しさん@1周年:2016/03/31(木) 10:09:20.40 ID:n3Nhr0q50.net
スイッチングハブのことかいな?

269 :名無しさん@1周年:2016/03/31(木) 10:09:30.58 ID:qDFvkGXA0.net
>>253
OSの暴走って何?wwww

270 :名無しさん@1周年:2016/03/31(木) 10:10:45.63 ID:QNcaFirC0.net
シリアルだけ作ってろ!

271 :名無しさん@1周年:2016/03/31(木) 10:11:19.85 ID:YNq/YT790.net
>>270
俺はケロッグ派

272 :名無しさん@1周年:2016/03/31(木) 10:11:48.13 ID:+X48O/nC0.net
> 本来であれば、スイッチが故障すると「故障シグナル」を発信し、自動的に予備機に切り替わる設計になっていたが、今回はシグナルが発信されず、予備機に切り替わらなかった。
シスコ糞かよ

273 :名無しさん@1周年:2016/03/31(木) 10:11:52.53 ID:V7ZH/i2l0.net
日本ユニシス
これからANAのシステム担当に相当責められるな
故障の原因は何だとか、なぜ故障通報できなかったとか、なぜデータ迂回できなかったのかとか
故障そのものはciscoにスイッチ送って調査依頼
故障通報はソフトウェアの調査と見直し
データ迂回に関してはルーティングの調査と再設定
今度同じこと起こったら日本ユニシスは次期システム構築構想から相手にされなくなる

274 :名無しさん@1周年:2016/03/31(木) 10:12:36.39 ID:HXKWKjIs0.net
>>261
ファンレスとか、ないのん?
イーサネットって、枯れた技術でしょ?
ファームウェアも、大した処理してないんじゃないの?

カリカリにチューニングしなくても、それなりに動いてくれる機械でしょ?

275 :名無しさん@1周年:2016/03/31(木) 10:13:06.70 ID:X1axGwkD0.net
システム請負ってる会社は出禁だろうなこれ

276 :名無しさん@1周年:2016/03/31(木) 10:13:56.51 ID:+X48O/nC0.net
>>274
家庭用のスイッチじゃねーんだぞ
大規模サーバー用のスイッチの実物見たことあんのかお前

277 :名無しさん@1周年:2016/03/31(木) 10:14:19.35 ID:UlIeJsEB0.net
>>273
ユニシスのSEがやるわけないじゃん
現場の下請け切ってハイ終了ですよ
ITの元請クラスはただのヤクザ

278 :名無しさん@1周年:2016/03/31(木) 10:14:30.99 ID:6SQX+rbR0.net
>>266
ポートとかハードではなくソフトウェアのバグみたい。

279 :名無しさん@1周年:2016/03/31(木) 10:16:03.72 ID:HnhnkS1s0.net
>>274
鯖室の温度ならciscoファン壊れたぐらいでは暴走しないだろう

>カリカリにチューニングしなくても、それなりに動いてくれる機械でしょ?
冗長化したら既出のルーティングテーブルやら複雑になってくるよw

280 :名無しさん@1周年:2016/03/31(木) 10:16:10.60 ID:v7IkrFbW0.net
スイッチといっても、メカニカルな装置ではなくて、実際には一種のコンピュータ
だからね。
 それにしても4台のマシンが相互を繫ぐのにスイッチを1つ置いてそれと
各4つのマシンとの間が線で1本ずつ繫いでいたのだとすれば、それは
実に弱いおかしな構成で、冗長性を持たせるのには、スイッチも2個置いて、
各マシンからそれぞれのスイッチに合計2本の線を延ばして、
どちらのスイッチを経由しても通信が出来るようにするよね。
もちろんスイッチ同士も線でつなぐ。

281 :名無しさん@1周年:2016/03/31(木) 10:16:20.88 ID:HXKWKjIs0.net
>>276
ねーよハゲ
でも、やってる事は同じでしょ?

ネットワークエンジニアとか、エンジニアじゃねーよwww

とか言ったら怒るよね^ ^ だから言わないよ^ ^ ^ ^ ^ ^

282 :名無しさん@1周年:2016/03/31(木) 10:16:40.98 ID:CoMNXEGH0.net
これだけのシステムで冗長化してないとかありえない。

283 :名無しさん@1周年:2016/03/31(木) 10:16:44.95 ID:SP6EZ/bc0.net
アライドとかD-linkなんか喜んでいそうだな。w

284 :名無しさん@1周年:2016/03/31(木) 10:17:25.08 ID:QeJhNsmq0.net
故障信号送信っておかしくないの?
送信機能が損なわれたときの検知はどうするつもりだったんだろう

正常信号が定期的に送信されて一定時間受信がなかった場合は故障と判断とかならよく聞くのに

285 :名無しさん@1周年:2016/03/31(木) 10:17:48.11 ID:k4om96mv0.net
>>278
あそうなんだ
コリジョン起こしまくってるとかかなw

286 :名無しさん@1周年:2016/03/31(木) 10:18:08.08 ID:5GRvdQ360.net
PS4だとスイッチングハブにつなぐとなんかしらんけどネットワークエラーがよく出るのはうちだけか
だからルーターのポートに繋いでる

287 :名無しさん@1周年:2016/03/31(木) 10:19:04.19 ID:QeJhNsmq0.net
>>277
えっユニシスのSEってメーカーSEには珍しく現場仕事ガリガリやってる印象だったんだけど

288 :名無しさん@1周年:2016/03/31(木) 10:19:22.32 ID:BWKZgFJu0.net
>>272
製造したシスコが解析して故障箇所が判明したため、シスコが改善策を検討しているという。

これのがクソだろww
検討じゃなくて、改善したじゃねーのかと?

289 :名無しさん@1周年:2016/03/31(木) 10:20:26.94 ID:dThcNc2n0.net
>>27
VLANくらいは切ってるだろ

290 :名無しさん@1周年:2016/03/31(木) 10:20:28.00 ID:V7ZH/i2l0.net
>>277
お前はアホか
実際は大規模なシステムほど下請け、孫請けのSEが元請けの看板背負って出入りしてるんだよ
ANAは担当SEを元請けの技術者として受け入れているから責任は一括し手元請けが負う

291 :名無しさん@1周年:2016/03/31(木) 10:22:39.99 ID:5xqK43Kc0.net
>>105
ディップスイッチ時代からの伝統だお

292 :名無しさん@1周年:2016/03/31(木) 10:23:19.39 ID:YNq/YT790.net
>>274
枯れた技術のママチャリは故障しないとでも思ってんのか

293 :名無しさん@1周年:2016/03/31(木) 10:23:38.08 ID:HXKWKjIs0.net
ネットワークエンジニアって、他社の作った機械の設定を
いじくりまわしてるだけで、プログラム組んでるわけでも
ないんだから、IT業界では最下層でしょw

そんな連中に我々の社会はキンタマ握られてるのかと思うと、
おっそろしいよな

294 :名無しさん@1周年:2016/03/31(木) 10:24:09.11 ID:toPtaePy0.net
こういう仕事っておもしろいの?
すんげーつまんなそうなんだけど
ITドカタよりガチなドカタの方がましじゃね

295 :名無しさん@1周年:2016/03/31(木) 10:24:26.67 ID:0LZr08VE0.net
>>287
確かにその印象は俺もあるw

296 :名無しさん@1周年:2016/03/31(木) 10:25:21.84 ID:6SQX+rbR0.net
>>285
いや、恐らく予備機と死活監視していて故障したら予備機に切り替わるのがバグで故障したのに切り替わらなかったみたい。
故障したスイッチがずっと稼働していて障害発生。

297 :名無しさん@1周年:2016/03/31(木) 10:25:23.11 ID:kKmL83sg0.net
pingが切れずに故障のトラップもあがらず、ハングアップした状態になったの?
日本ユニシスの運用はかなりの問題だけどシステム自体には問題がなく、完全にciscoの問題だわ。
これ、ANAだけじゃなくほぼ日本中の全システムがアウトになるケースなんだが。
サーバーからスイッチにヘルスチェック投げるシステムなんて聞いたことがない。

298 :名無しさん@1周年:2016/03/31(木) 10:25:45.90 ID:SZvZUETk0.net
どうでもいーさ

299 :名無しさん@1周年:2016/03/31(木) 10:26:30.97 ID:SP6EZ/bc0.net
>>293
それを言ったら、電工なんてすべての産業のキンタマ握っているだろ。w

300 :名無しさん@1周年:2016/03/31(木) 10:27:07.81 ID:HXKWKjIs0.net
>>292
多少のガタがきても、それなりに機能するだろ

そういう意味では、ママチャリはシスコのクソスイッチよりも
遥かにフォールトトレラントなマスィーンだよなw

301 :名無しさん@1周年:2016/03/31(木) 10:28:03.33 ID:JrJbl7/H0.net
>>296
じゃあ単に運用側がアラートあげてないだけじゃ

302 :名無しさん@1周年:2016/03/31(木) 10:28:50.57 ID:HXKWKjIs0.net
>>299
やる事の複雑さと、不具合起きた時の社会への影響の度合いが、
全然違うじゃん

303 :名無しさん@1周年:2016/03/31(木) 10:30:01.20 ID:ga+toKJz0.net
>>302
こんなところでクソみたいな文章書いていないで働けよクソニート

304 :名無しさん@1周年:2016/03/31(木) 10:30:03.00 ID:V7ZH/i2l0.net
>>297
DBサーバやwebサーバなんかの実業務以外にネットワーク監視サーバがあるんだよ
このサーバが各ネットワーク機器に対して定期的にpingを飛ばす
規定時間内にレスポンスがないとその機器を障害とみなして通報する

305 :名無しさん@1周年:2016/03/31(木) 10:30:48.31 ID:APsXfJ540.net
しかし考えようによってはイーサネットスイッチの故障で社長が減給ってのも色々変な慣習w

306 :名無しさん@1周年:2016/03/31(木) 10:30:49.23 ID:v0C4G1TN0.net
リレースイッチと真空管の時代くる?

307 :名無しさん@1周年:2016/03/31(木) 10:30:56.79 ID:toPtaePy0.net
ヲタトークうぜーー
もっと一般人に分かるように説明しろや
職場でもそんなだからドカタ仕事しか任せてもらえないんだろ

308 :名無しさん@1周年:2016/03/31(木) 10:32:06.60 ID:GV/OwCdL0.net
すごいここまでほぼなんのことかわからん
こんな専門的な分野なのに薄給とか待遇悪いとかよく聞くよな
介護もそうだけど需要あって専門的なのになぜ待遇悪いのか・・・

309 :名無しさん@1周年:2016/03/31(木) 10:32:22.03 ID:6SQX+rbR0.net
>>301
そのアラートをあげる信号が出ないバグだから運用は気付かないと思うよ。

310 :名無しさん@1周年:2016/03/31(木) 10:32:52.50 ID:HXKWKjIs0.net
>>303
怒るなよーw

311 :名無しさん@1周年:2016/03/31(木) 10:32:59.42 ID:UlIeJsEB0.net
>>290
えっ、俺金融系で奴らに責任ごと丸投げされて相当嫌な目に遭ったけど?

312 :名無しさん@1周年:2016/03/31(木) 10:33:34.96 ID:2By8UsuO0.net
>>168
そういう問題じゃなくね?

313 :名無しさん@1周年:2016/03/31(木) 10:34:29.13 ID:RhyYpkmy0.net
とっとと日立のクラウドに移行しとけばよかったのに。

ハードウェアの故障で大規模な社会システムがダウンするって、
一言で言えば、「ユニシスは大馬鹿!」
 

314 :名無しさん@1周年:2016/03/31(木) 10:34:46.58 ID:3TuoHEFB0.net
中華製の偽者掴まされてるんじゃないのか

315 :名無しさん@1周年:2016/03/31(木) 10:35:32.82 ID:YNq/YT790.net
>>307
「自己診断機能が機能しなかった」

316 :名無しさん@1周年:2016/03/31(木) 10:36:31.10 ID:kb11nQov0.net
なんか拍子抜けだな。
そんなんで全滅するのかって。

317 :名無しさん@1周年:2016/03/31(木) 10:37:03.38 ID:kKmL83sg0.net
>>304
いや、運用監視を導入しているのは大前提でしょ。日立製なのか富士通製なのかは知らんけど。
それでスイッチのダウンを拾えてないなら、pingやsnmpは送れてるけど通信が出来なくスイッチからsnmpトラップも飛んでこない
ようはスイッチが内部的にハングアップした状態じゃないかな。
それだと運用監視ソフト側は検知出来ない。

318 :名無しさん@1周年:2016/03/31(木) 10:37:49.78 ID:b0RzaSpm0.net
>>316
10年前に同じ個所の不具合で全滅してるんだよ これが

319 :名無しさん@1周年:2016/03/31(木) 10:39:07.11 ID:X2tMb3hv0.net
ケーブル挿したらリセットボタン押しちゃう設計のスイッチもあったよな>シスコ

320 :名無しさん@1周年:2016/03/31(木) 10:39:10.30 ID:OrP3Cie+0.net
こりゃ福一もメルトダウンするわ

321 :名無しさん@1周年:2016/03/31(木) 10:39:32.69 ID:JrJbl7/H0.net
>>309
死活監視で外部からping
うつ設計なら分かるじゃん
またはボーリングしてりゃ
なんか発生してることは分かるよ

322 :名無しさん@1周年:2016/03/31(木) 10:39:35.85 ID:HXKWKjIs0.net
バカが知識自慢したくてドヤ顔で必要以上にカリカリに
チューニングするから、こういう事が起きるんだよw

小利口な大馬鹿にシステム任せたのが、全ての原因

323 :名無しさん@1周年:2016/03/31(木) 10:40:17.88 ID:x2lMURZT0.net
これは、なかなか難しい
作ってて大丈夫かなって少し不安になる事っていくらでもあるし
そんなのレベルで一々対応してシステム組んでたらキリがないわ

324 :名無しさん@1周年:2016/03/31(木) 10:40:38.37 ID:6SQX+rbR0.net
>>316
設計はちゃんとしてたからね。
予期せぬバグは追求するの難しいもんだよ。

325 :名無しさん@1周年:2016/03/31(木) 10:41:24.15 ID:zQ2Km9Lz0.net
株価暴落してないじゃんwww
良かったなwww
株主バカだらけで

326 :名無しさん@1周年:2016/03/31(木) 10:41:37.32 ID:aF0M2pz20.net
>>5
最近そこまでやらかしてないので
許して差し上げろ

327 :名無しさん@1周年:2016/03/31(木) 10:41:52.63 ID:5j2eljtQ0.net
減給で良かったな
千葉の小学校なら損額全負担だぞw

328 :名無しさん@1周年:2016/03/31(木) 10:42:01.56 ID:UlIeJsEB0.net
最近のANAのCMもアホっぽいもんな
ボルトのとか

329 :名無しさん@1周年:2016/03/31(木) 10:42:33.41 ID:YMb6816L0.net
家のバッファロー貸してあげたのに…

330 :名無しさん@1周年:2016/03/31(木) 10:42:59.95 ID:PN8fXqYI0.net
対応したエンジニアたちは今ごろ真っ白な灰になってるのだろうか? お疲れさま

331 :名無しさん@1周年:2016/03/31(木) 10:44:31.67 ID:YJTiqRUb0.net
>>258
スイッチが抽象化されてるから可用性設計を丸投げ
って考えでイカンのん?

332 :名無しさん@1周年:2016/03/31(木) 10:44:36.80 ID:+H5iksG70.net
冗長設計は案外うまくいかないものだよ
想定するトラブルが全て予想できているかというとそうでもない
考えてもなかったところでトラブルが起こるのな。

これどうせ故障検出のロジックが故障してたとか、ファームウェアのバグだったんでしょ

333 :名無しさん@1周年:2016/03/31(木) 10:45:31.06 ID:6SQX+rbR0.net
>>321
Ping監視はSNMPでしょ。
通常はポート監視くらいしかしてない。
今回のは予備機との切り替わるプロトコルの問題だよ。

334 :名無しさん@1周年:2016/03/31(木) 10:45:48.76 ID:xuIElDIX0.net
何のために高いシスコ使ってたんだろうな・・・

335 :名無しさん@1周年:2016/03/31(木) 10:45:50.03 ID:oGOvOjRy0.net
>>324
スイッチでここまでここまでなったのって余りないし
ここまでなるとは思ってなかっただろうし、

今後の設計、監視、リカバリ体制も見直されるだろうね、
他所も含めて

336 :名無しさん@1周年:2016/03/31(木) 10:46:01.64 ID:APsXfJ540.net
>>330
対応も大変だったろうけど社内のシステム担当してたひとたち首とか大幅減給とかありそう
>篠辺修社長ら経営陣3人の報酬を1カ月間減額

経営陣がこれだし八つ当たりされてそう
機器トラブルなのにカワイソス

337 :名無しさん@1周年:2016/03/31(木) 10:46:04.41 ID:Y3vVgffg0.net
>>215
こんだけリアルタイムで更新がかかるDBでしかもFCストレージだから
運用とか切り替え時の担保範囲の特定を容易にすることまで織り込むと
結構難易度が高いと思われる。

338 :名無しさん@1周年:2016/03/31(木) 10:46:25.19 ID:qQI7SwNM0.net
半端に落ちてactive,activeになって輻輳起こしたと予想。
クラスタのハートビート系でやっちまうと全停止もありうる。
お気の毒です。

339 :名無しさん@1周年:2016/03/31(木) 10:46:43.41 ID:xARZg1x20.net
アリスタのスイッチに替えろ

340 :名無しさん@1周年:2016/03/31(木) 10:46:51.25 ID:zR+VOUaA0.net
>>1

J( 'ー`)し たけしへげんきですか。そうじのときぬいた あおいでんせんをさしておくのわすれてました ごめんね

(`Д)   

341 :名無しさん@1周年:2016/03/31(木) 10:46:53.24 ID:SP6EZ/bc0.net
>>302
複雑じゃないから問題よ。w
線の色間違えたら、停電なんてすぐに起きるからな。w
大規模停電、原因は、線の色間違えての配線ミスとかな。w

342 :名無しさん@1周年:2016/03/31(木) 10:48:05.61 ID:HXKWKjIs0.net
案外、テケトーに組んでた方が信頼性増すんじゃねーのw

343 :名無しさん@1周年:2016/03/31(木) 10:49:18.95 ID:x2lMURZT0.net
>>342
ぶっちゃけ割り切りっすわ
ある程度以上のラインは、もう仕方ない
期限があるんだし

344 :名無しさん@1周年:2016/03/31(木) 10:49:20.38 ID:cVOIdeA+0.net
ハード故障で社長が減給て、納入してるベンダはどれだけ再発防止の対応すれば良いんだ?

345 :名無しさん@1周年:2016/03/31(木) 10:49:35.80 ID:C3+GOVAH0.net
DBのデータ不整合の観点からも検知できなかったのかねダミー更新とかして

346 :名無しさん@1周年:2016/03/31(木) 10:50:54.94 ID:SP6EZ/bc0.net
>>342
それ、言えるかもしれんな。w
コストダウン重視すれば、どうしてもcritical pathが出てくるもんな。
テケートだと、なぜか、critical pathを回避してることが多々ある。w

347 :名無しさん@1周年:2016/03/31(木) 10:51:55.55 ID:6bisgzpa0.net
原因機器とか公表するんだな。
銀行系とかまず公表しないけど。

348 :名無しさん@1周年:2016/03/31(木) 10:52:01.89 ID:G8X8gwgd0.net
ぶっちゃけ、スイッチングHUBの一つが壊れたってこと?

349 :名無しさん@1周年:2016/03/31(木) 10:52:23.84 ID:Y3vVgffg0.net
>>217
そうだろうね。

>>243
AWS信用しすぎなあほっているんだな

350 :名無しさん@1周年:2016/03/31(木) 10:53:01.57 ID:YJTiqRUb0.net
電話だけで成り立つ代替システムを設計とかしたら面白そう

351 :名無しさん@1周年:2016/03/31(木) 10:53:03.75 ID:YNq/YT790.net
まぁ交通事故が起きる度に
国交大臣や道路公団トップやら警視総監が処分受けてるわけでもないしな。

352 :名無しさん@1周年:2016/03/31(木) 10:53:39.41 ID:CZOfv2IJ0.net
>>346
なんでクリティカルパスって日本語で書かないの?
読みにくいんだけど。

353 :名無しさん@1周年:2016/03/31(木) 10:54:12.96 ID:Uc2K+kKL0.net
監視システム構築側としては寒気が走る話だ
ダメな時はダメなんだよ絶対なんて無いの…
役員減給だなんて、こっちは退職しなきゃだめか?

354 :名無しさん@1周年:2016/03/31(木) 10:54:14.34 ID:HXKWKjIs0.net
>>346
それよ。

何かにつけて根拠とか求められるから、念のためとかそういう
良かれと思ってやれる事が出来ないんだよねw

355 :名無しさん@1周年:2016/03/31(木) 10:56:04.43 ID:CZOfv2IJ0.net
http://www.nikkei.com/markets/company/chart/chart.aspx?scode=8056&ba=1&type=shuasi
日本ユニシスの株価は週足だと上がってるのに
http://www.nikkei.com/markets/company/chart/chart.aspx?scode=8056&ba=1&type=day
今日の午前に急落したのは、このニュースが原因かな

356 :名無しさん@1周年:2016/03/31(木) 10:56:23.45 ID:APsXfJ540.net
>>353
最低でも社内のシステム系の人らは始末書と賞与ゼロ、毎月30%の減給
社外のシステム屋もいたはずだからそのひとらは外注元の富士通なりには
とんでもないペナルティ
下手すると損害賠償とか・・・

あーやだやだ

357 :名無しさん@1周年:2016/03/31(木) 10:56:38.66 ID:YJTiqRUb0.net
>>349
信頼じゃなくてスケーラビリティを活かした低コスト待機って運用
>>258に対しては話がズレたが

358 :名無しさん@1周年:2016/03/31(木) 10:56:48.54 ID:3/RxE0o40.net
なんでもかんでも遠隔で確認しようとするからダメなんだよ。
障害の出てるエリアで問題箇所は即座に判断つくんだろうから、現場に行けばすぐ判っただろうに。

359 :名無しさん@1周年:2016/03/31(木) 10:57:23.06 ID:aZdCFyfq0.net
ハードとソフトを同時に入れ換えんな

360 :名無しさん@1周年:2016/03/31(木) 10:57:46.46 ID:Y3vVgffg0.net
>>311
仕事を引き受ける上での折衝能力の問題だなそれは

361 :名無しさん@1周年:2016/03/31(木) 10:58:23.93 ID:JgQBD/GR0.net
堅牢かつシンプルなトグルスイッチにすべき

362 :名無しさん@1周年:2016/03/31(木) 11:00:23.01 ID:kb11nQov0.net
伝書鳩を用意しておけばこんな事にはならなかった。

363 :名無しさん@1周年:2016/03/31(木) 11:00:42.57 ID:94T6j+wD0.net
まあ部品壊れたらどうしようもない
すべてを監視できるわけない
壊れる前提で非常時には手書きシステムに切り替えろや

364 :名無しさん@1周年:2016/03/31(木) 11:01:09.45 ID:6SQX+rbR0.net
>>358
遠隔から色々わかるように構築したんだよ。現場だってデーターセンターだろうから人はすぐに駆けつけたと思う。外見では今回の障害はわからない。

365 :名無しさん@1周年:2016/03/31(木) 11:01:57.01 ID:Uc2K+kKL0.net
>>356
多分この規模なら自分も外注ポジだろうけど
社長まで参戦して徹夜で始末書つくるとこから想像しただけで吐きそう

366 :名無しさん@1周年:2016/03/31(木) 11:02:11.02 ID:Ha91Xi3s0.net
複数のnicとswでボンディングしとけば防げるんじゃないの?

367 :名無しさん@1周年:2016/03/31(木) 11:03:24.38 ID:X1axGwkD0.net
世界がサイバー戦争になったら
最終的にモールス信号を使えるところが生き残ると思う

368 :名無しさん@1周年:2016/03/31(木) 11:03:32.92 ID:rfqkAupj0.net
んー?
冗長構成しててもダメだったんでしょ
じゃー仕方ないね
ジュニパーでも使う気?
ある程度の実績から考えればcatalystだけどなあ

369 :名無しさん@1周年:2016/03/31(木) 11:03:50.23 ID:+d5Lb0yb0.net
この手のスレはいつもプロフェッショナルの溜まり場になるな
システムの設計を2chに晒して添削してもらったら落ちなくなるかもねw

370 :名無しさん@1周年:2016/03/31(木) 11:05:49.04 ID:LB+7WwGD0.net
必要ならいいんだけどよぉ・・・

それしきに、そんなの使うなよって案件にすら、 これとか糞重いあのDBとか突っ込んでくるんだよなぁ・・・
まあ、そいつらと組んでるからなんだろうけど

371 :名無しさん@1周年:2016/03/31(木) 11:06:40.91 ID:Zvm/ZUj30.net
ネットワーク機器の障害か
電源かと思ったわ

372 :名無しさん@1周年:2016/03/31(木) 11:07:37.56 ID:21ffoOCQ0.net
あまりにもレベルの低いバグの場合、ハード故障を装うことがあるよねw

373 :名無しさん@1周年:2016/03/31(木) 11:08:10.21 ID:Y3vVgffg0.net
>>357
いや、それも含めてコストだよ。
いざ待機系を立ち上げるとなったら単なる動きゃいい中小企業の社内システムとはわけが違う。

374 :名無しさん@1周年:2016/03/31(木) 11:08:44.66 ID:x2lMURZT0.net
>>369
後から間違い探しはできるけど、最初から見つけるのは大変よ
気になる箇所なんていくらでも出てくるし
対応しようにも予算と期限の決まった中では限界がある
その限界を超えてしっかりしたモノを組もうと思うと
ろくすっぽ残業代も払われないのに残業地獄のデスマーチだ

375 :名無しさん@1周年:2016/03/31(木) 11:11:49.86 ID:Y3vVgffg0.net
>>366
active/standbyだったんだろ。

376 :名無しさん@1周年:2016/03/31(木) 11:13:31.31 ID:NQgfzJx00.net
>>220
装置が問題なく動いてる時は無理に電源のオンオフしないってのは基本だな
それで壊れることはほんとにあるし

377 :名無しさん@1周年:2016/03/31(木) 11:15:32.72 ID:o7Iz4LKI0.net
間にスイッチ使わないでも同期取れそうだけど

378 :名無しさん@1周年:2016/03/31(木) 11:17:59.22 ID:Y3vVgffg0.net
>>377
そりゃあ無理でしょ

379 :名無しさん@1周年:2016/03/31(木) 11:19:10.90 ID:6SQX+rbR0.net
>>377
無理。
冗長するシステムにはスイッチは必要。ポートが足りない。

380 :名無しさん@1周年:2016/03/31(木) 11:19:18.54 ID:lI+YVwUi0.net
おい!
イエローとマルチポートトランシーバ持ってこい!

381 :名無しさん@1周年:2016/03/31(木) 11:20:33.21 ID:HXKWKjIs0.net
必ず満席になるまでブチこむシステムが悪いんや!

必ず一割程度の空席残しといて、現場で手作業で捌けや

何でもかんでもリアルタイムで処理せな死ぬんかい?

382 :名無しさん@1周年:2016/03/31(木) 11:24:30.34 ID:jhJDHJLn0.net
>>27
ルーターよりはるかに設定が面倒だったりするんだが。

383 :名無しさん@1周年:2016/03/31(木) 11:25:11.93 ID:shfcRIut0.net
>>34
中古でも良ければ15万で買える。
http://www.ebay.com/itm/272119191560
送料込みでも17万。おひとついかが?

384 :名無しさん@1周年:2016/03/31(木) 11:27:45.07 ID:Y3vVgffg0.net
>>379
それもあるけどOracleRACのプライベートインターコネクトの要件から言っても直結はだめでしょうね
今回4ノードだし

385 :名無しさん@1周年:2016/03/31(木) 11:28:04.43 ID:mfriw+Md0.net
無能の減給とか内部の事はどうでもいいから、お詫びに1ヶ月航空運賃無料とかしろや

386 :名無しさん@1周年:2016/03/31(木) 11:29:14.13 ID:5bLuKvWX0.net
>>281
ハイエンドなのは1台数億円レベル
家庭用とは全然違うよ

387 :名無しさん@1周年:2016/03/31(木) 11:30:48.33 ID:iBMXj6sMO.net
>>16
(・∀・;)まずまずいけてる

388 :名無しさん@1周年:2016/03/31(木) 11:31:05.37 ID:jhJDHJLn0.net
>>220
これってままあるんだよな。 古い機器なんかだと特に。
そして「メンテに来て壊した」と言われる理不尽なパターン。

389 :名無しさん@1周年:2016/03/31(木) 11:31:23.67 ID:MRG7YQQJ0.net
>>307
仕方がないよ。スキルをひけらかしたい人種ばかりだから。

能ある鷹は爪を隠すじゃないけど本来スキルのある人はあまりひけらかすような
話はしないんだよね。それに人当たりがいいし。

この手の人種は現場でもスキルでマウンティングして争ってくるからすごくウザいんだよね。
だから土方しかやらせてもらえないんだよwww

390 :名無しさん@1周年:2016/03/31(木) 11:32:15.32 ID:L8vApHiw0.net
バッファローとかエレコムの使うからこうなる

391 :名無しさん@1周年:2016/03/31(木) 11:33:38.78 ID:HXKWKjIs0.net
今度から、コレガ使っとけ

392 :名無しさん@1周年:2016/03/31(木) 11:33:40.58 ID:lfSjP/iw0.net
>>380

え〜○○さーん、今日コネクタ上げする道具持ってきてませんよ〜
ハナシ違ってないっすかあ

393 :名無しさん@1周年:2016/03/31(木) 11:33:47.99 ID:5bLuKvWX0.net
>>333
ICMPだが

394 :名無しさん@1周年:2016/03/31(木) 11:35:37.47 ID:lI+YVwUi0.net
>>281
じゃあ片手間やっといてって言ったらみんな逃げるけどな…。

395 :名無しさん@1周年:2016/03/31(木) 11:37:01.37 ID:vHzKcpP70.net
どこでも起きうるってことか 
ANA以上にコケたらやばそうなのは東証とかか 

396 :名無しさん@1周年:2016/03/31(木) 11:44:54.87 ID:JyhdPgeI0.net
ping死活監視とsnmpトラップがごっちゃになってるな

397 :名無しさん@1周年:2016/03/31(木) 11:53:29.27 ID:6S3YASeb0.net
シスコのCatalyst 4948Eを晒しものにすることはないと思う

398 :名無しさん@1周年:2016/03/31(木) 12:01:44.07 ID:eCdJ43Cv0.net
DBは多重化してるのにネットワークは多重化してないのか

399 :名無しさん@1周年:2016/03/31(木) 12:06:25.65 ID:5n4ziybY0.net
>>369
このスレの殆どが素人と時代遅れの技術者だと思う

400 :名無しさん@1周年:2016/03/31(木) 12:09:00.00 ID:hUmT7+LW0.net
エレコムにしとけ

401 :名無しさん@1周年:2016/03/31(木) 12:09:37.99 ID:pS1cK24n0.net
サーバリプレースで古い旧サーバ落として移動して立ち上げたらCPUファンが壊れたことがあったな

402 :名無しさん@1周年:2016/03/31(木) 12:11:50.29 ID:PRYos3QI0.net
>>80
釣り?

403 :名無しさん@1周年:2016/03/31(木) 12:17:18.71 ID:OXDPbbh80.net
まあスイッチや回線は完全に落ちてくれれば検知も切り替えも簡単だが
半落ちとかエラー乗るとかはデータ壊れちゃうし厄介だな

404 :名無しさん@1周年:2016/03/31(木) 12:19:58.59 ID:kKmL83sg0.net
>>399
インフラなんて1〜2世代前のシステムの方が安定するんだよ

405 :名無しさん@1周年:2016/03/31(木) 12:20:17.78 ID:lKV+qtVz0.net
これL2の基幹スイッチっしょ。
単なるhubじゃないよ。

しかし信号云々いってるが、壊れる機材側の反応待ちとかアホとしか思えない。
普通は別機器でヘルスチェックするし、コールドスタンバイに手動で挿し直す手順を作っとくもんだ。

航空会社なんてパイロット以外は業務二重化と障害対応がメインのビジネススタイルだろうに、なんでシステムがこんななん?
ここんちの飛行機はトラブルでアッサリ落ちそうじゃね?

406 :名無しさん@1周年:2016/03/31(木) 12:26:03.00 ID:j/g3pc3U0.net
故障したらシグナル出ないだろ

407 :名無しさん@1周年:2016/03/31(木) 12:27:34.33 ID:zFx852qn0.net
こういう事態をふせぐために
冗長化してるんじゃないの?
ちよっとびっくり

408 :名無しさん@1周年:2016/03/31(木) 12:29:47.19 ID:kKmL83sg0.net
監視サーバー側から見たら障害と検知出来ないケースだったんだろうね。
pingやsnmpはスイッチにも飛んでいる、スイッチからは故障のシグナルが飛んでこない、でもデーターベースサーバーからは
故障のログが上がって来ていた場合、スイッチの障害と切り分けるのはかなり時間がかかる。

409 :名無しさん@1周年:2016/03/31(木) 12:29:59.51 ID:kKUpmx3L0.net
毎回シスコが壊れるならオープンシステムかメインフレームかなんて関係ねえじゃんw
安物のPC鯖でいいんじゃねw

410 :名無しさん@1周年:2016/03/31(木) 12:31:04.22 ID:MU0fTu2w0.net
>>8
元々シスコってのはそんなレベル
いかにも米国の製造産業という感じの品質レペル
弱電製品を強電の感覚で製造してる感じと言ったら分かるかな?
そんな感じ

411 :名無しさん@1周年:2016/03/31(木) 12:31:44.74 ID:+9rkgqcc0.net
システム屋、ホッとしてる?

412 :名無しさん@1周年:2016/03/31(木) 12:32:06.78 ID:kKmL83sg0.net
>>407
冗長構成になってるけどハングアップで切り替わらなかったんだろう。
サーバーで言えばクラスタソフトがダウンしたような状態か、サーバー自身が自分が障害である事を認識出来てない状態。

413 :名無しさん@1周年:2016/03/31(木) 12:32:17.06 ID:kKUpmx3L0.net
ネットワーク屋、カリカリきてる?w

414 :名無しさん@1周年:2016/03/31(木) 12:32:22.14 ID:SKZv68FU0.net
余ったPCにWireshark入れてニートを外国人研修費ぐらいで雇って
24時間座らせておけばいいんじゃね?w 300円x24のランニングコスト

415 :名無しさん@1周年:2016/03/31(木) 12:32:52.97 ID:8ziS3A6l0.net
故障してダウンしてくれればいいけど変な動きされるのが一番困る

416 :名無しさん@1周年:2016/03/31(木) 12:33:39.35 ID:Y3vVgffg0.net
>>404
んだね。
常に最新版使うのは素人丸出しだと思うわ。
最近ベンダーのサポートポリシーも世代の入れ替わりが速いのはあるけど。

417 :名無しさん@1周年:2016/03/31(木) 12:37:39.33 ID:BFHWZstN0.net
再発防止策はサーバーからもスイッチ故障を検知するってさ

418 :名無しさん@1周年:2016/03/31(木) 12:39:57.82 ID:FKV9mUw+0.net
>22日午前3時44分 1台DBサーバーダウン。
管理者「DBサーバーのハード障害か?」
OP「ハード警告無し。異常ありません。」
管理者「回線異常か?」
OP「回線良好。異常ありません。」
管理者「スイッチ異常か?」
OP「スイッチ警告なし。異常ありません。」
管理者「どこにも異常がないのになぜ…?」

>22日未明 2台目DBサーバーダウン。
管理者「え、どうなっているんだ?2台目も落ちたぞ??」
管理者「アタックか?ウイルスか?」
OP「回線異常なし!ウイルス等異常反応もありません!」

>>22日未明 3台目DBサーバーダウン。
管理者「おいこのままでは業務停止するぞ!!何か異常はないのか!?」
OP「データ整合性異常のほか見当たりません!このままでは第4サーバー持ちません!!」
管理者「異常を探し出せ!!」
OP「回線異常ありません!スイッチ異常ありません!!サーバー異常ありません!!!」

>22日午前8時22分 4台DBサーバーダウン。
管理者「…」
OP「…」

>22日午前8時59分 DBサーバー再起動。
管理者「異常がないんだったら、すぐさま再起動かけろ!!」
OP「再起動!・・・ ダメですサーバー安定しません!!!」

>22日午前9時27分 搭乗手続きシステムに絞りDBサーバー1台で再稼働
管理者「もうだめだ予約関係は諦めて、搭乗だけにしぼっけ回復させるぞ!」
OP「サーバー3台切り離し、1台に構成にして再稼働! … システム安定!搭乗手続き可能です!」


こういう世界、現実しる前は夢見るよね。

419 :名無しさん@1周年:2016/03/31(木) 12:40:07.79 ID:ZTb2FuPs0.net
ANAは前の重大障害のときも原因はネットワーク機器の故障だったんだよね。
世界で4例しかない極めてまれな障害だとかでさ。

で、今回の原因もスイッチングハブ?
本当の原因を隠してない?

420 :名無しさん@1周年:2016/03/31(木) 12:40:10.83 ID:51om/bqa0.net
l2なら型落ちなら数万からあるよ
l3だと型落ちでも数十万
世に通用するのは数百万から

421 :名無しさん@1周年:2016/03/31(木) 12:42:39.61 ID:tbxECkn/0.net
ダメルコ哀王

422 :名無しさん@1周年:2016/03/31(木) 12:45:00.32 ID:ZHtXfmhh0.net
>>257
NW監視の仕事やってりゃほぼ毎日何台か壊れる
つっても何万台のうちの1、2台ってレベルだし場所によっちゃ次の交換まで何もない事もザラ

423 :名無しさん@1周年:2016/03/31(木) 12:46:48.50 ID:dS3aSitL0.net
この手の機械の耐用年数ってどのくらいなん?

424 :名無しさん@13周年:2016/03/31(木) 12:53:01.81 ID:dVLGOu9WO
サーバとスイッチが100/half でつながってCRCやらコリジョン多発だがpingは通る。
データーベースの同期がエラー多発で落ち切り離される。
なんで生死監視は生きてるのに落ちるんだと混乱
初歩的すぎないかい?

425 :名無しさん@1周年:2016/03/31(木) 12:48:04.10 ID:ZHtXfmhh0.net
>>423
8年か10年くらいだろ
保障期間切れたらリプレースする

426 :名無しさん@1周年:2016/03/31(木) 12:49:23.34 ID:51om/bqa0.net
>>423
大抵はリース契約で数年
長くても5年以上は見たことない
その前にリプレイス入る

427 :名無しさん@1周年:2016/03/31(木) 12:50:14.33 ID:SKZv68FU0.net
耐久年数て資産上は10年なんだよなぁ ルータやスイッチ
コンデンサーそんなに持たんだろぉといつも思う

428 :名無しさん@1周年:2016/03/31(木) 12:50:25.89 ID:kKmL83sg0.net
>>417
DBサーバーからスイッチにヘルスチェックなんてアホの極みでしかないが、対外的にそう言わざる得ないんだろうな。
だって、その上位のスイッチが同じ現象で落ちたらどうすんの?って話になるからね。
スイッチをアクティブアクティブにするのがベストな気がするが、負荷とか考えたら現在のシステムじゃ無理なんだろう。

429 :名無しさん@1周年:2016/03/31(木) 12:52:25.14 ID:LoTghY+n0.net
>>1
騙リストがやらかしやがったのか。

430 :名無しさん@13周年:2016/03/31(木) 12:58:52.25 ID:dVLGOu9WO
ううん?
https://quickview.cloudapps.cisco.com/quickview/bug/CSCuw78751

431 :名無しさん@1周年:2016/03/31(木) 12:54:37.24 ID:oPEyvPi80.net
ハブって壊れるんだな
電源部分以外で、ハブが壊れた事無いわ

432 :名無しさん@1周年:2016/03/31(木) 12:56:36.12 ID:m7JpzM9k0.net
>>8
冗長化のシステムの組み方が悪いのかな
壊れること前提に対策取れなかったのかな

433 :名無しさん@1周年:2016/03/31(木) 12:57:14.60 ID:CoGf7Rw/0.net
>>426
出荷停止から5年で保守も切れるから、大抵5年以内で新しい機種にリプレースだよね

434 :名無しさん@1周年:2016/03/31(木) 12:57:22.64 ID:LoTghY+n0.net
>>431
電源回りよくやられるよな。
普通に焦げ臭くなって死んだり、
PoE スイッチがただのスイッチに化けてみたりw

435 :名無しさん@1周年:2016/03/31(木) 12:57:32.36 ID:ZHtXfmhh0.net
>>428
DBサーバ兼監視サーバなんかねえ
普通は監視サーバor端末からNWも鯖も見ると思うんだけど
act/actじゃないのはもう常時一方の回線使うと金かかるから・・・って事なんかね
システムもこれじゃエンジニアにも大して払って無さそうだな

436 :名無しさん@1周年:2016/03/31(木) 13:00:59.50 ID:lI+YVwUi0.net
落ちたのはL2でも、
切り替わらんかったのクラスタの条件設定か
何かと違うの?

よく知らんけど。

437 :名無しさん@1周年:2016/03/31(木) 13:05:11.63 ID:X4nPA05m0.net
結局、原因分からなくてシスコさんに汚名を被って貰ったんじゃね?

438 :名無しさん@1周年:2016/03/31(木) 13:06:55.56 ID:kKUpmx3L0.net
>>437
それはないわーないない

439 :名無しさん@1周年:2016/03/31(木) 13:07:10.19 ID:YNq/YT790.net
>>418
お前全然>>1読んでないのな

440 :名無しさん@1周年:2016/03/31(木) 13:10:07.60 ID:pNUPGieQ0.net
>>284
機器からの故障通知は必ずあるという前提で設計してるね
その前提がくずれるような不具合があれば、当然故障を検知できない

記事を信じるなら、設計のミスだと思うよ

441 :名無しさん@1周年:2016/03/31(木) 13:15:27.47 ID:i6rhC7aR0.net
>>418
>しぼっけ

見事に狼狽ぶりを表現

442 :名無しさん@1周年:2016/03/31(木) 13:15:47.05 ID:kKUpmx3L0.net
>>440
SBOは起きない前提で原発を運用していたのだから
機器からの故障通知は必ずあるというのは極めて日本的な正しい設計でしょ
断じて設計ミスではないw

443 :名無しさん@1周年:2016/03/31(木) 13:20:31.12 ID:TkHUuSb10.net
スイッチの故障って、コンデンサでも飛んだのか?
スイッチもああ見えて寿命があるからな。
クリティカルなシステムなら6〜7で買い替えんと。
ってか、運用環境はどうだったんだろう?
まさか最上段で熱こもりまくりのクソラッキングじゃなかろうな?w

444 :名無しさん@1周年:2016/03/31(木) 13:22:11.52 ID:kKUpmx3L0.net
シスコ様が故障通知を送らないなんてありえない!
シスコ様だぞシスコ様
そんな設計をしたら黄色いサル相手にもスイッチを売ってくれているシスコ様に顔向けできないではないか!
オマエはシスコ様を疑うのか?このケツの青いひよっこが
シスコ様〜

445 :名無しさん@1周年:2016/03/31(木) 13:22:14.89 ID:qASdqbYa0.net
図をみるとインコネくさいんだけどDHBはつかってなかったんか?

446 :名無しさん@1周年:2016/03/31(木) 13:29:55.11 ID:8MlKul3q0.net
不具合があったとしてもそのスイッチの電源を切ってしまえば
解決したのかな。
まあ切り分けが出来なくてズルズルって感じだろうか。

447 :名無しさん@1周年:2016/03/31(木) 13:31:48.74 ID:JyhdPgeI0.net
>>405
4948を単なるhub、で使うかよw

448 :名無しさん@1周年:2016/03/31(木) 13:33:40.02 ID:9MAPg6ja0.net
>>376
スイッチとかルーターって電源オンオフするためのスイッチが無くて、いきなり電断だからな。
ビルの法定電源検査で、停電時対応で復電して、スイッチぶっ飛んだ事あるわ。

449 :名無しさん@1周年:2016/03/31(木) 13:40:59.12 ID:kKmL83sg0.net
ciscoのバクは明らかとしても、監視装置側にsnmpトラップを解読する設定が入ってなかった可能性もある。

450 :名無しさん@1周年:2016/03/31(木) 13:44:31.67 ID:i6rhC7aR0.net
>>445
dhb使ってもサーバの生き死にじゃないから意味ないんじゃない?

451 :名無しさん@1周年:2016/03/31(木) 13:44:39.25 ID:8MlKul3q0.net
>>257
CEやってるけど毎日みるよw
客に何で壊れたのかよく聞かれるけど
運が悪かったですねとかこの機械よく壊れるんですよ。
って言葉をグッとこらえて
室温や湿度が少し高いとかどんな機械でも壊れない機械はないとか適当にいってるw

452 :名無しさん@1周年:2016/03/31(木) 13:47:28.14 ID:HRvlBYf+0.net
そこで、ネットギア?

453 :名無しさん@1周年:2016/03/31(木) 13:47:51.09 ID:yHUmO67B0.net
shutdownコマンド普通にあるだろ

454 :名無しさん@1周年:2016/03/31(木) 13:57:34.14 ID:R04DiFUl0.net
【会見詳報】ANA障害の原因判明、「世界4例のスイッチ故障がきっかけ、対応も遅れた」
http://itpro.nikkeibp.co.jp/article/NEWS/20070613/274694/

ANAは2007年にもスイッチ障害でシステム停止してる

455 :名無しさん@1周年:2016/03/31(木) 13:59:09.97 ID:ZHtXfmhh0.net
>>453
物理ボタンが無いって言ってるんだろう
コマンドで落としたら現地行って電源ケーブル抜き差ししないとダメだな

456 :名無しさん@1周年:2016/03/31(木) 14:00:25.18 ID:R04DiFUl0.net
高機能な製品は潜在的にバグが多い
余計な機能のない安スイッチのほうがバグが無い

457 :名無しさん@1周年:2016/03/31(木) 14:01:30.89 ID:oPEyvPi80.net
>>454
1度目は仕方ないとしても、2度目はバカだろ

458 :名無しさん@1周年:2016/03/31(木) 14:03:52.51 ID:YNq/YT790.net
>>456
人力車にでも乗ってろ

459 :名無しさん@1周年:2016/03/31(木) 14:11:03.29 ID:kKUpmx3L0.net
>>457
ところが3度目もあるんだなこれがw

460 :46歳無職童貞キモピザ低学歴低 身長禿ロリ ◆Zay2S8giCsrB :2016/03/31(木) 14:15:25.70 ID:Ov9+vEoC0.net
シスコとか、業務用じゃあ大手なんだがなぁ・・・・・・・・・・・
ただ性能の割には馬鹿高い・・・・・・・・・・・・ あと安物はマジでウンコ


・・・・・・・・・あれ?

461 :名無しさん@1周年:2016/03/31(木) 14:16:58.29 ID:ZHtXfmhh0.net
>>457
9年前の障害だからモノも違うだろうし故障原因も別だろう
普通にぶっ壊れるとかなら即復旧出来たろうけどレアな障害引くとどんどん長引くからな

462 :名無しさん@1周年:2016/03/31(木) 14:17:54.97 ID:Uc2K+kKL0.net
スイッチ故障報告が嘘だったとしても、現段階ではcisco機器に何か起きたんだろ
そうじゃなきゃciscoの名前だしたら大問題だし出来ないよ

463 :名無しさん@1周年:2016/03/31(木) 14:19:15.11 ID:i6rhC7aR0.net
>>457
同じシステムではないけどね。

464 :名無しさん@1周年:2016/03/31(木) 14:20:02.66 ID:4xFvX2lh0.net
>>434
俺はアダプターがやられたことがあったな、プラスチックが溶けてたwwwww
なんで電源部弱いんだろ?

465 :名無しさん@1周年:2016/03/31(木) 14:22:34.89 ID:yHUmO67B0.net
てか保守ベンダの責任だろ
大元叩いてどうすんだ

466 :名無しさん@1周年:2016/03/31(木) 14:25:38.35 ID:i6rhC7aR0.net
>>464
なぜなら電源部だからです。

467 :名無しさん@1周年:2016/03/31(木) 14:30:39.80 ID:l8LxofSp0.net
ケミコンかタンタルの故障と予想

468 :名無しさん@1周年:2016/03/31(木) 14:46:22.87 ID:CoGf7Rw/0.net
>>464
アナログの部分はどうしても故障率高くなるよね
ケミカル系のコンデンサは熱で劣化するし
あとは高電圧になる部分は埃とかでショートしやすい

469 :名無しさん@1周年:2016/03/31(木) 14:51:41.30 ID:C0S8Vsw00.net
>>465
ハード故障はベンダやシスコの責任じゃないよ。
だってハードは故障するもんだから。
その障害対応の開発をロクスポしなかったANAのシス開の責任。

470 :名無しさん@1周年:2016/03/31(木) 14:55:16.21 ID:i6rhC7aR0.net
>>465
直接引き金を引いたのが機器やソフトウェアでも
損害を大きくした問題の根幹が運用マターならユーザ側の責任。

471 :名無しさん@1周年:2016/03/31(木) 14:56:10.26 ID:s4paDJf/0.net
>>450
NHB切断してもDHBで1系統残らないっけ?
2〜4系統は切り離されるだろうけど

472 :名無しさん@1周年:2016/03/31(木) 14:56:47.53 ID:4463r8r40.net
なんだっけMTTFだっけ

473 :名無しさん@1周年:2016/03/31(木) 15:03:56.02 ID:1Ac2F/ou0.net
>>469
ANAのシス開にも責任はない。

実際に誰が責任をとったかを考えてみろ?

474 :名無しさん@1周年:2016/03/31(木) 15:05:04.55 ID:YNq/YT790.net
>>469
製造者責任全否定

475 :名無しさん@1周年:2016/03/31(木) 15:14:13.25 ID:i6rhC7aR0.net
>>471
そうなんだけど、結局のところインターコネクトのスイッチ障害の検知が出来てなかったなら
最初は原因不明でいったんサービス停止して切り分けのために再立ち上げしてみて
「あれ?複数だと上がらないな…」ってなってるであろうことは明白じゃない?
なので辿る話の経路が違うだけで結局同じことなんじゃないのってこと。

476 :名無しさん@1周年:2016/03/31(木) 15:44:19.02 ID:EmSMFCP30.net
日の丸品質のバッファローにしておけば良かったんだろ?

477 :名無しさん@1周年:2016/03/31(木) 15:51:25.71 ID:USInMdf/0.net
多ベンダーでシステム組むとこうなるって事だな
障害の切り分けが即座にできない

478 :名無しさん@1周年:2016/03/31(木) 15:52:01.38 ID:bmNYDEb80.net
>>476
L2なんてつくってねーだろ

479 :名無しさん@1周年:2016/03/31(木) 16:03:23.81 ID:utat9Z9J0.net
>>478
バッファローはエンプラ向けのも出していて、お金無いところはそういったの入れてる
シスコライクのOSだわ
ショボい機能しか使わないなら、一応安定してる

480 :名無しさん@1周年:2016/03/31(木) 16:05:51.46 ID:tonv9yXx0.net
FF11の時代にイーサネットって当然のように表示出て、意味分からんかったこと思い出す
今だとハードディスク程度に認識しとけばいいらしいが、ストレージとかいう言葉が納得しにくい

481 :名無しさん@1周年:2016/03/31(木) 16:06:02.90 ID:utat9Z9J0.net
>>448
そのためにUPS入れるんじゃん

482 :名無しさん@1周年:2016/03/31(木) 16:07:23.36 ID:GLgJGn3H0.net
ハードの故障とかほとんど中国製だから点検が大変だね

483 :名無しさん@1周年:2016/03/31(木) 16:07:44.72 ID:utat9Z9J0.net
>>453
shutdownなんてインターフェースの操作くらいしかできんわ
電源は落とせない

484 :名無しさん@1周年:2016/03/31(木) 16:16:10.48 ID:UHz4IuLt0.net
一台のサーバーが落ちたら他も落ちるって多重化する意味ねえじゃん
アホですか?

485 :名無しさん@1周年:2016/03/31(木) 16:19:22.90 ID:EtCE2rQc0.net
>>12
いゆ、そこはELECOMかBuffaloにしておこうぜ。

486 :名無しさん@1周年:2016/03/31(木) 16:25:44.73 ID:zocpIDy20.net
信頼と品質のヤマハで。

487 :名無しさん@1周年:2016/03/31(木) 16:33:04.39 ID:E6HUscPk0.net
>篠辺社長ら減給

安部はアベノミクス失敗の責任とらず退陣も減給もなし

488 :名無しさん@1周年:2016/03/31(木) 16:52:56.85 ID:nrK30R+i0.net
なにL3スイッチなのかw L4じゃないのかw

489 :名無しさん@1周年:2016/03/31(木) 16:54:45.88 ID:rjF1t6zP0.net
>>475
あー、なるほど
理解

490 :名無しさん@1周年:2016/03/31(木) 16:57:13.30 ID:CoGf7Rw/0.net
>>483
reloadだよな(´・ω・` )

491 :名無しさん@1周年:2016/03/31(木) 16:59:47.68 ID:Wynmf2R+0.net
>>489
とにかく異常に気づいてスタンバイ側に切り替えられたってシナリオはあるかもしれないけど
倒れるちょっと前までは投票ディスクに普通に見た目的には全ノードIOしてたんでは?とも。
そこら辺はわかんないけど、dhbなら何とかなったとはちょっと考えにくいかなと。

492 :名無しさん@1周年:2016/03/31(木) 17:02:59.39 ID:kKmL83sg0.net
>>469
今回のは故障じゃなく潜在バグっぽいから相当な賠償請求がciscoに行きそう。

493 :名無しさん@1周年:2016/03/31(木) 17:06:08.59 ID:FKV9mUw+0.net
>>492
よほど意識的に悪質な挙動でない限り、バグの責任してももらえる損害賠償のMAXは機器製品代まででしょう。

494 :名無しさん@1周年:2016/03/31(木) 17:08:58.57 ID:Wynmf2R+0.net
>>493
ふつう契約書に上限書いてあるからね。
製品価格じゃなくて保守契約の価格の場合もあるし。

495 :名無しさん@1周年:2016/03/31(木) 17:13:33.40 ID:kKmL83sg0.net
>>493
今回のは悪質なバグにあたるのかと。てか、政治(国じゃなく企業の)判断が入りそう。
日本ユニシス的にはSPLが守れなかったからANAに賠償請求されるのは確定だが、
日本ユニシス側としてciscoのバクが仕方ないと割り切れない金額なら、今後のシステムにcisco製品を入れないと脅しをかけることは多々ある。

496 :名無しさん@1周年:2016/03/31(木) 17:19:33.89 ID:Wynmf2R+0.net
>>495
いやそれはないな。
システムに対する責任はあってもシステムの業務上の重要性までは担保しない。
そんなのまで担保する責務が当然なのならそこらじゅう訴訟だらけだし、そもそもからして
システムに対してもっと支払額が高くないと請求する資格はないでしょう。
ANAではなくて一般論として。

497 :名無しさん@1周年:2016/03/31(木) 18:04:50.88 ID:DZJbSP2h0.net
どこがネットワーク構築してんの?
現ユニアの旧ネットマークス?

498 :名無しさん@1周年:2016/03/31(木) 18:09:53.35 ID:kKmL83sg0.net
>>496
それが日本の企業なんです。システム構築側やベンダに非が無くても重要な客なら負担するのはほんと良くある。
勿論、突っぱねてもいいというか下の方は突っぱねたいが、得意先相手だとトップと営業が折れる。

499 :名無しさん@1周年:2016/03/31(木) 18:25:17.95 ID:kamcDLsp0.net
訴訟まで行くことは稀だけど、損賠請求はわりと多いよ。公開されないから見えないけど。
大抵は構築時の契約額が上限になるので、ユーザ側が損する。
これだけの事態だから、Uに損賠請求しないとANAの株主が黙ってないだろうね。
問題は、Uはciscoにその賠償を転嫁できなくて、できてもスズメの涙ほどになることだろうか。
ciscoはその不具合のためにこの事態を招くだろうことを予見する立場にないから。

500 :名無しさん@1周年:2016/03/31(木) 18:39:51.14 ID:Wynmf2R+0.net
>>498
いや、よくあるのは知ってるけどもうちょっと
法律と今回の件を照らし合わせて考えればわかる。

501 :名無しさん@1周年:2016/03/31(木) 18:41:01.51 ID:Wynmf2R+0.net
ちなみに損害賠償ではない形で折り合いをつけるケースのほうが多いと思うが。

502 :名無しさん@1周年:2016/03/31(木) 19:21:24.95 ID:NG9zUib30.net
>>94
そりゃ会社に迷惑をかけたことに対する処分だよ。

客に対しては約款に書かれていること以上の責任はない。

503 :名無しさん@1周年:2016/03/31(木) 19:38:35.71 ID:MbUtDtOJ0.net
2007年も世界で4例しかない故障と言ってたな。
いちいち珍しいアピールして、被害者面したいのか?

504 :名無しさん@1周年:2016/03/31(木) 19:53:14.70 ID:eGGk6k3d0.net
>>115
死んだなら死んだって家

505 :名無しさん@1周年:2016/03/31(木) 19:54:09.46 ID:kamcDLsp0.net
損賠でない形というと、値引きとかかな?確かに騒ぎが大きくなると、請求する側もされる側も手間なので収めたいところ。
でも、ANAやUのような大企業になると、不当廉売や利益供与を問われかねないし、損賠額相当を値引くと国税監査でも問題視される。
大きな会社ほど、経営層の金に対する裁量がきかなくなるから、むずかしいかもよ。

506 :名無しさん@1周年:2016/03/31(木) 20:04:29.27 ID:ltpZrDb10.net
社長が責任取るのはおかしいって……

頭オカシイ

507 :大島栄城 ◆n3rBZgRz6w :2016/03/31(木) 20:10:43.38 ID:eNMHo4+X0.net
アサンテのハブを馬鹿ハブとか言ってたけど、あれにあったアース端子はCISCOには無くて
それで落ちないで落ちてるだけじゃねえの?

hp /serviceguard使うなら2重化してるイーサーネット機材もhpにしとけばいいのに

508 :名無しさん@1周年:2016/03/31(木) 20:14:32.48 ID:Fmdyi5A50.net
プラネックス、ネットギア、アラクサラ、ヤマハ、好きなの選んで

509 :名無しさん@1周年:2016/03/31(木) 20:14:45.76 ID:xdVsMKGp0.net
>>257
> >>8
> イーサネットスイッチなんて、壊れるものなの?

今回はバグと言うことで、壊れたわけではない。
CISCO製品は、高機能だけど、バグが多いことも覚悟して使わないとダメ。

510 :名無しさん@1周年:2016/03/31(木) 20:15:15.22 ID:xdVsMKGp0.net
>>12
> coregaにしよう

壊れる壊れない以前にパフォーマンスが出ない。

511 :名無しさん@1周年:2016/03/31(木) 20:16:41.83 ID:Dfx8/wRT0.net
>>509
いやシスコで信頼性が無いなら他はどこもダメだろw

512 :大島栄城 ◆n3rBZgRz6w :2016/03/31(木) 20:29:20.32 ID:eNMHo4+X0.net
>>511
それ、なぜCISCOが流行したか解ってると嘘でしか無いんだけど

513 :名無しさん@1周年:2016/03/31(木) 20:32:17.40 ID:ZuRzTYET0.net
篠辺修社長の月額報酬の1カ月、20%を減額するなどの社内処分も発表。
ANAホールディングスの伊東信一郎会長と片野坂真哉社長もそれぞれ1カ月、20%を自主返上する。

意味の有る行動なのだろうか。シスコより頭脳明晰なら納得するが。

こいつら経営者はシスコの社員より頭悪いから
別に責任取らなくてもいいんじゃね〜〜の。

514 :名無しさん@1周年:2016/03/31(木) 20:33:16.19 ID:g4cOoWjw0.net
>>512
何故なの?

515 :名無しさん@1周年:2016/03/31(木) 20:35:02.26 ID:g4cOoWjw0.net
>>491
投票ディスクって何ですか?

516 :名無しさん@1周年:2016/03/31(木) 20:45:56.24 ID:kybsiBA80.net
juniperにしよう

517 :名無しさん@1周年:2016/03/31(木) 20:47:00.78 ID:07MjpckP0.net
>>454 これが汚名挽回って奴か

518 :大島栄城 ◆n3rBZgRz6w :2016/03/31(木) 20:47:31.70 ID:eNMHo4+X0.net
>>514
俺と大塩佳織って女の件が関係してるだけの嘘で構築されてるから

519 :名無しさん@1周年:2016/03/31(木) 20:48:50.49 ID:U3uCjpa00.net
ネットワークの二重化切り替えって、故障したスイッチが自分で
故障シグナルを上げるのが前提なの?
なんか根本的に考え方がおかしいような。

520 :名無しさん@1周年:2016/03/31(木) 20:53:00.12 ID:SKZv68FU0.net
>>519
SNMPで故障した箇所を上げるのと対のSWでpingでキープアライブ見てて判断するか
中途半端に生きててエラー処理がされない時がややこしい
落ちてないからフェールオーバーで切り替わらないが壊れてるからパケエラ連発で処理できないモードに・・

521 :名無しさん@1周年:2016/03/31(木) 20:54:28.54 ID:PRYos3QI0.net
電源切った後起動しないのは
電源の電界コンデンサーの容量抜けと
フラッシュメモリーの電荷抜けと
DRAMの劣化があるね
メモリーはだいたいロット不良だけど
半導体メーカーもセットメーカーも
まず認めないね

522 :ドクターEX:2016/03/31(木) 20:55:37.82 ID:5XpBS3HK0.net
定価280万で保守契約必須なのに、壊れるとかm9(^Д^)プギャー

523 :名無しさん@1周年:2016/03/31(木) 20:55:47.89 ID:PRYos3QI0.net
あと宇宙線も言い訳によく使うけど嘘だからwww

524 :名無しさん@1周年:2016/03/31(木) 20:57:06.34 ID:pti0aoow0.net
>>1
こういう、ポートが密集してるやつって、真ん中あたりのを差し替えたくなったとき、どうするの?

525 :名無しさん@1周年:2016/03/31(木) 20:58:39.65 ID:3Y9Ly2ED0.net
>>524
別に普通にいけるだろ
よほど手が巨大じゃなければ

526 :名無しさん@1周年:2016/03/31(木) 20:58:52.44 ID:U3uCjpa00.net
通信はできないくせに、生きてるか聞いたら生きてるって返事が来るような感じか。
通信ができないことを検知して切り替えれば良いのにな。

527 :ドクターEX:2016/03/31(木) 20:59:12.69 ID:5XpBS3HK0.net
うちではまだファストハブが現役である。www

528 :名無しさん@1周年:2016/03/31(木) 21:02:15.83 ID:+IL3Z4R/0.net
監視の話と切り替わりのための検知の話がごっちゃで
頭がフリーズしてまいそう。

529 :名無しさん@1周年:2016/03/31(木) 21:03:53.79 ID:SRkSJhvd0.net
>>523
一回だけの再起動はビットエラーとか言われて様子見対応になるね

実際グーグルのサーバーでのテスト結果だと、ビットエラーはかなりな率で発生しているらしい。
宇宙線、太陽フレアによるビットエラーの説明はたまにするわ。

530 :名無しさん@1周年:2016/03/31(木) 21:04:05.55 ID:UEdG55gR0.net
故障通知を受けてはじめてホットスペアの別スイッチに切り替えるとかナメめているだろ
低能なSIがよくもそんな重要なところを担当しているのかと腹を抱えて笑ってしまう

531 :名無しさん@1周年:2016/03/31(木) 21:05:29.37 ID:SKZv68FU0.net
>>529
EMP兵器かよw
オカルトならベテルギウスのガンマ線バースト来るんじゃね?

532 :名無しさん@1周年:2016/03/31(木) 21:07:24.41 ID:pti0aoow0.net
>>525
ツメのところを片手の人差し指で押した状態で、もう一方の手で、ケーブル掴んで引っこ抜く感じかね

ABCDEF
GHIJKL

に全部差し込まれてて、Cだけ抜きたくなっても、Cのコネクタ部分を掴めないよね?

533 :名無しさん@1周年:2016/03/31(木) 21:07:37.45 ID:Dfx8/wRT0.net
確かcdpだっけ? もう忘れたが

534 :名無しさん@1周年:2016/03/31(木) 21:14:53.09 ID:cfI8CU0i0.net
>>1
「故障シグナル」ってのはなんだ?SNMPのTrapのこと?
Trapが飛ばなかったくらいでこんな事にはならないと思うんだけどなぁ〜

535 :名無しさん@1周年:2016/03/31(木) 21:17:26.72 ID:Y7IkZ0ao0.net
イーサネットのハブごときに、なんで専門知識がいるんだ?

パフォーマンス?

そんなギリギリの設計する方が悪い

536 :名無しさん@1周年:2016/03/31(木) 21:18:44.67 ID:rTunjGYm0.net
搭乗券もマイル会員以外の一般利用者の人も不要になってきてるし、システムに依存するところは大きいだろう

537 :名無しさん@1周年:2016/03/31(木) 21:22:51.95 ID:99EP39bD0.net
毎年、八丈島に行くけど悪天候以外で帰れないのは勘弁していただきたい

538 :名無しさん@1周年:2016/03/31(木) 21:23:04.10 ID:RgdwghYp0.net
金が無いからとNETGEARのスイッチを入れたが
何故かバカにされる
なんで

539 :名無しさん@1周年:2016/03/31(木) 21:24:54.58 ID:SRkSJhvd0.net
>>531
宇宙線のビットエラーは普通にあるのよ
各社いろいろ対策してる
http://www.ntt.co.jp/news2013/1303/130321a.html

540 :名無しさん@1周年:2016/03/31(木) 21:25:11.93 ID:zba0ico20.net
リンクアグリで2重化とらんとかバカなの?アホなの?

541 :名無しさん@1周年:2016/03/31(木) 21:28:53.38 ID:SDWWpKdh0.net
ネットワークの多重化も技術的には高度だからなあ。

542 :名無しさん@1周年:2016/03/31(木) 21:30:33.26 ID:UEdG55gR0.net
だいたいのビットエラーは電源ユニットに入る(コンセントからの)電気ノイズが原因
ノイズフィルターを付けると半減

543 :名無しさん@1周年:2016/03/31(木) 21:30:42.92 ID:PRYos3QI0.net
>>539
そう、そことか

http://www.oeg.co.jp/semicon/softerror.html

こういうところで評価した上で
言ってるならいいんだけど
単なる言い訳で根拠無しなんだよね

544 :名無しさん@1周年:2016/03/31(木) 21:32:08.58 ID:2AEr6ABQ0.net
昔シスコのエンジニアが日本に来ていたが頓珍漢な受け答えだったし、こっちが残業して
いるのを見てアメリカではこんなに働かない、といって驚いていたし、だめだこりゃ、と思った
まあむしろだめになったのはこっちの方だったが

545 :名無しさん@1周年:2016/03/31(木) 21:34:02.57 ID:0gO10Pno0.net
>>132
懐かしいな〜。Hyper-V使って客の物理鯖5台を仮想化したの懐かしい。

クラスタ組んでホスト間移動にかかる時間を検証して、ワーニング発生時から業務復旧までの実質的な損失を算出して、、、あ〜、インフラ屋時代、懐かしい。

今じゃ離れて正解な業界だったぜ。

546 :名無しさん@1周年:2016/03/31(木) 21:35:36.83 ID:PRYos3QI0.net
>>542
そんな気がする

547 :名無しさん@1周年:2016/03/31(木) 21:36:12.09 ID:UEdG55gR0.net
訂正

「だいたいの」を「1/3程度の」に変更
スマソ

548 :名無しさん@1周年:2016/03/31(木) 21:36:27.75 ID:SRkSJhvd0.net
>>543
正直原因分からないからねぇ

549 :名無しさん@1周年:2016/03/31(木) 21:37:42.78 ID:Uc2K+kKL0.net
他の記事読んだけど二重に障害が起きたからしょうがないって話だろうかね
仕方ないからサーバー側からも見れるように三重にしたんじゃないのかな…?
結局サーバーからの死活監視みたいなのも作ったところでうまくいかないときはうまくいかないし

550 :名無しさん@1周年:2016/03/31(木) 21:41:45.10 ID:PRYos3QI0.net
>>548
夏になると増えたりとかねw

551 :名無しさん@1周年:2016/03/31(木) 21:45:08.72 ID:M7MzV9zY0.net
普通にRTPの不具合じゃね?

552 :名無しさん@1周年:2016/03/31(木) 21:45:36.79 ID:QFY4Oozt0.net
鉄道システムの足元にも及ばないしょうもない組み方してるな

553 :名無しさん@1周年:2016/03/31(木) 21:47:14.33 ID:kamcDLsp0.net
>>551
L3だよ。RACだし、スパツリは使わない。

554 :名無しさん@1周年:2016/03/31(木) 21:48:35.12 ID:u3Rgj9U00.net
バッファローなんか使うからだ。

555 :名無しさん@1周年:2016/03/31(木) 21:49:47.29 ID:pti0aoow0.net
>>552

山手線の新型車両は、ブレーキ指令をEthernetで送るらしいぞ

IPアドレスはDHCPで振るらしい

556 :名無しさん@1周年:2016/03/31(木) 21:49:52.83 ID:SRkSJhvd0.net
今スパツリなんか使わないシステム構築するよ
スパツリクソ

557 :名無しさん@1周年:2016/03/31(木) 21:51:18.81 ID:QFY4Oozt0.net
ところでこのシステム、停電したらどうなんの?

558 :大島栄城 ◆n3rBZgRz6w :2016/03/31(木) 21:52:26.04 ID:eNMHo4+X0.net
>>535
だから言ってるだろ、アサンテのおまえらがいう馬鹿ハブにはあった
本体のアース端子が、Ciscoには無いだけだろ

設置がちゃんとしてないんだろ

559 :名無しさん@1周年:2016/03/31(木) 21:53:22.14 ID:RhyYpkmy0.net
だから死す子のマークが津波だと

560 :名無しさん@1周年:2016/03/31(木) 21:54:25.46 ID:HHNBq5Zz0.net
シスコが改善策を検討なんて珍しいな

並みの客に対しては仕様で済ませるくせに

561 :名無しさん@1周年:2016/03/31(木) 21:55:51.44 ID:kamcDLsp0.net
系間スイッチダウン
⇒HSRPの未知のバグ引いて切り替わらず
⇒よってノード側もチーミング切り替わらず
⇒ノードが互いの死活が確認できない状態
⇒スプリットブレイン防止のため、RACが次々とノードを落とした

…ということかなと思った。
そんな単純なオペミスや検討漏れで説明つくような話ではないかも。
枯れまくってるHSRP、かEIGRPにそんなバグあったと想定することはむずかしそう。

562 :名無しさん@1周年:2016/03/31(木) 21:56:12.01 ID:toL/SMR40.net
>>560
組み込まれたソフトのバグなんだろうかね

563 :名無しさん@1周年:2016/03/31(木) 21:56:57.22 ID:Ut4fXtja0.net
>>560
またろくろ職人の話が聞けそうだw

564 :名無しさん@1周年:2016/03/31(木) 21:58:07.71 ID:4463r8r40.net
>>557
全社員でチャリ漕ぎ

565 :名無しさん@1周年:2016/03/31(木) 21:58:25.09 ID:mZDiFUfI0.net
>>5
ワラタ

566 :名無しさん@1周年:2016/03/31(木) 22:00:13.44 ID:LQcAxZGO0.net
>>1
冗長ないのか??

567 :名無しさん@1周年:2016/03/31(木) 22:02:34.02 ID:U3YnaM9Y0.net
なんか腑に落ちないのでもっと詳しい解説プリーズ

568 :名無しさん@1周年:2016/03/31(木) 22:06:30.11 ID:yO/BMcom0.net
よーわからんわ
航空機に異常がないなら飛べるだろ

アリタリアなんて糞システムですぐ落ちるから
ささっと手書きで航空券を作成してくれるわ

569 :名無しさん@1周年:2016/03/31(木) 22:08:32.49 ID:Uc2K+kKL0.net
>>568
誰を乗せていいかわからなくなっちゃうんじゃないの

570 :名無しさん@1周年:2016/03/31(木) 22:08:38.31 ID:UKUlU8wD0.net
>>本来であれば、スイッチが故障すると「故障シグナル」を発信し、自動的に予備機に切り替わる設計になっていたが、今回はシグナルが発信されず、予備機に切り替わらなかった。

故障シグナルってSNMPのことか?
いくら多重化しようがバックアップ経路作ろうが「異常発生」を検知出来なければ機能しないのは当たり前。本件に限って言えばシスコの落ち度だろ

571 :名無しさん@1周年:2016/03/31(木) 22:10:26.99 ID:U3uCjpa00.net
シスコのスイッチを使ってネットワーク二重化してたけれど、
ネットワーク二重化のバグで切り替わらなかったってことか。
二重化の意味無いじゃん。

572 :名無しさん@1周年:2016/03/31(木) 22:18:25.51 ID:L08l1Xyu0.net
SPOFはスイッチだったのかwww

573 :名無しさん@1周年:2016/03/31(木) 22:18:35.26 ID:BhqJvC+K0.net
>>571
二重化だろうが、三重化だろうが
「システムが(長時間)止まる可能性を限りなく0に近づけるための工夫の一つ」にすぎない。

「玄関のドアのカギを2個付けたけど、泥棒に入られた、二個付けても意味ないじゃん」とは言わんだろ。

574 :名無しさん@1周年:2016/03/31(木) 22:19:03.26 ID:XpFTyThn0.net
>>570
4台のDBサーバーを収容していたスイッチということならたぶんL2スイッチとして使っていたはずで
L2の経路切り替えならSNMPなんか使わなくても普通は切り替わると思うんだよなぁ。

どんなシステム設計なのか興味あるわ。

575 :名無しさん@1周年:2016/03/31(木) 22:19:36.27 ID:BhqJvC+K0.net
>>572
予備も用意してたけど、予備に切り替わらなかっただけの話や。

単一障害点とは話が違う。

576 :名無しさん@1周年:2016/03/31(木) 22:21:36.00 ID:kamcDLsp0.net
動き出して長いシステムだし、障害試験なんか死ぬほどしてるはず。ANAのIT部門はかなり有識者も多い。
ベンダが試験をズルしたら許してくれないだろう。
それでも詰めなかった不具合だから、不具合が起こる特殊な条件があるんだろうね。
起動してから600日以上経つと発生するとか。
アホみたいだけど、ほんまにそういうのあるよ。

577 :名無しさん@1周年:2016/03/31(木) 22:24:53.60 ID:ld7jgoG60.net
>>559
ゴールデンゲートブリッジやろ(´・ω・` )

578 :名無しさん@1周年:2016/03/31(木) 22:32:23.27 ID:6qa3+om+0.net
こんなんアメリカで起きたら日本のメーカーが巨額な賠償させられる

579 :名無しさん@1周年:2016/03/31(木) 22:33:58.46 ID:2NnIBjOd0.net
>>6
これ

580 :名無しさん@1周年:2016/03/31(木) 22:39:16.80 ID:U3uCjpa00.net
>>573
泥棒が2個鍵を破らなければいけないなら意味があるけど、泥棒が1個鍵を
破った瞬間に2個目も勝手に開いてしまうなら2個ある意味が無いだろ。
二重化に意味が無いのではなくて、お粗末すぎて二重化している意味が無い。

581 :名無しさん@1周年:2016/03/31(木) 22:39:36.87 ID:PWjFd/5E0.net
多重化はコストダウンで廃れました

582 :名無しさん@1周年:2016/03/31(木) 22:46:01.00 ID:B+HS5b4V0.net
>>571
そういうことか。

ま、批判的な書込があるけど、今回のはやむを得ないのかな・・・

583 :名無しさん@1周年:2016/03/31(木) 22:49:22.68 ID:oYDyWyQy0.net
>>6
これかな

ハングみたいなのは検知難しいよね
そこまで考えて設計してるのは少ないんじゃね
よほどミッションクリティカルなシステムくらいでしょ

584 :名無しさん@1周年:2016/03/31(木) 22:52:19.03 ID:MdGYVndg0.net
バッキャローの方がマシなのでは?

585 :名無しさん@1周年:2016/03/31(木) 22:54:01.61 ID:Uc2K+kKL0.net
でもこれでユニシスに賠償請求検討って…
二重障害も許さないってこと?何重障害まで想定してたの?

586 :名無しさん@1周年:2016/03/31(木) 22:56:58.34 ID:ld7jgoG60.net
お粗末!

587 :名無しさん@1周年:2016/03/31(木) 23:00:01.33 ID:RQHq3Q2H0.net
>>158


切り替わるには障害通知が出ないといけないが、それが出ないバグっていうんだから想定外だろ。

588 :名無しさん@1周年:2016/03/31(木) 23:03:03.74 ID:PmDGFsZCO.net
ハートビートかね?

589 :名無しさん@1周年:2016/03/31(木) 23:04:26.80 ID:RQHq3Q2H0.net
>>585


契約があるんじゃないの?
停止時間何時間で賠償みたいな

590 :名無しさん@1周年:2016/03/31(木) 23:05:29.38 ID:F1gEMgyJ0.net
原因となったスイッチは不安定ながらも動作していたってどっかに書いてあったから
icmpやsnmpには応答するしDBサーバと接続しているポートもリンクアップしてるけど
RACの通信は出来なかったって感じなのかな?

591 :名無しさん@1周年:2016/03/31(木) 23:05:33.47 ID:gb99mzQY0.net
昔Ciscoでsnmpwalkすると固まるというとんでもないバグあったなあ

592 :名無しさん@1周年:2016/03/31(木) 23:07:23.90 ID:J62WyKKI0.net
>>549
生命維持装置を付けすぎて、応答遅延して死んだと誤認して崩壊するスタイル

593 :名無しさん@1周年:2016/03/31(木) 23:11:58.90 ID:gb99mzQY0.net
miiだけだとリンクアップしたまま死ぬことあるよな

594 :名無しさん@1周年:2016/03/31(木) 23:13:47.13 ID:4463r8r40.net
結論

絶対に落ちないシステムは作れない

595 :名無しさん@1周年:2016/03/31(木) 23:16:49.35 ID:n097Jzyw0.net
>>594
絶対に動かないシステムは簡単に作れるのにな…

596 :名無しさん@1周年:2016/03/31(木) 23:17:12.95 ID:8L5Dolj60.net
トラブル検知でバックアップに切り替えも大事だけど
予め定期的にこういう装置は交換した方がいいんじゃない?

597 :名無しさん@1周年:2016/03/31(木) 23:17:33.26 ID:hOKK7KeX0.net
単に輻輳さして処理能力限界近くになっただけ。
ケチってアップアップなら上位スイッチにするし、バグで再送とかループ、大量誤送信
ならバグ修正とチェック処理を追加、監視常時化でしょ。
手動切り替えの判断もできなかったか、しなかったかだろな。

598 :名無しさん@1周年:2016/03/31(木) 23:17:54.66 ID:r9YXBgjM0.net
日本のIT業界は信用できないからね、この話自体が信用できない。

まあ仮にルーターが原因だったとしても、普通はルーターの故障なんて真っ先に疑う事だからね。

また、障害時のロジックも実装していなかったからこうなっているという事です。

要するに、何が理由なのかは知らないが、丸一日対応にかかるような問題じゃないのにこうなってるのは

サポート体制がおかしいからでしょ。

今時、POSシステムでもこんな幼稚なエラーは発生しない。

599 :名無しさん@1周年:2016/03/31(木) 23:29:44.86 ID:r9YXBgjM0.net
今の業務用ルーターは当たり前のように独自にOS積んでるからね、

ルーターに管理者ログインしてチェックすれば異常はある程度はすぐに判断できるはずです。

また、OSサイドで異常が検知できなかったとしても何らかの違和感は生じるからね。

もちろん送信されているかどうかのチェックなんて当たり前ですし、

そんなの定期的なメンテナンスでやるべき事です。

要するに、この会社、異常時のチェックプロシージャもまともに用意してなかったという事でね。

こういう故障に弱い設計をした時点でIT企業の”仕事に対する態度”が分かりますね。

600 :名無しさん@1周年:2016/03/31(木) 23:31:42.47 ID:w/mc03ee0.net
オーシャンズ30の仕業ね

601 :名無しさん@1周年:2016/03/31(木) 23:34:23.85 ID:pti0aoow0.net
飛行機の中で起きなくて良かったよな。

飛んでるときに、3台のFMCの同期がとれなくなりました、停止します。とか嫌だよ。

602 :名無しさん@1周年:2016/03/31(木) 23:34:57.00 ID:nWIN+gry0.net
凄く間抜けな原因だな、、。

603 :名無しさん@1周年:2016/03/31(木) 23:35:56.11 ID:lMYmwazE0.net
>>601
4発エンジン積んでいても全部止まるトラブルも時にはあるしね…

604 :名無しさん@1周年:2016/03/31(木) 23:37:03.53 ID:9lW9xtrY0.net
イーサンハントに見えた

605 :名無しさん@1周年:2016/03/31(木) 23:39:07.64 ID:JZIh/pI+0.net
スイッチの障害か。ベンダの立場を考えればあまりにも可哀想な障害だな・・・w

606 :名無しさん@1周年:2016/03/31(木) 23:41:49.36 ID:xI/As9/y0.net
故障しても落ちないスイッチほど扱いに困るものはない。
何のエラーも吐かずにこっそり数%のパケットを壊してたんだろ。素直に落ちればスパツリだの何だので何の問題もないのに。

607 :名無しさん@1周年:2016/03/31(木) 23:43:24.51 ID:DJYLPLsE0.net
重故障エラーが出なかったのか

608 :名無しさん@1周年:2016/03/31(木) 23:44:25.76 ID:/0xrZ+pp0.net
死ぬほどテストしてもものすごいタイミングで障害が起きるのよね

609 :名無しさん@1周年:2016/03/31(木) 23:45:09.55 ID:r9YXBgjM0.net
>>606
そんなものを選らばなければよかったんですよ。当たり前の話でね。

同じCISCOでもバグが枯れたスイッチングハブなんていくらでもあったでしょうに。

現場のサポート技術者のレベルが低い事は分かってた事ですし、全て後手後手ですね。

偉そうにしてる人間ほど自分の腕はヘボなんだよねw まあ知ったこっちゃないがね、もう。

610 :名無しさん@1周年:2016/03/31(木) 23:45:15.05 ID:HwY/tyMd0.net
スイッチングハブなの?

611 :名無しさん@1周年:2016/03/31(木) 23:46:15.10 ID:kamcDLsp0.net
今のルーターは独自OS積んでるじゃなくて、OSがないルーターは存在しないよ。
定期的にログ見てても、突然死の予兆なんてわからない。
あんたの浅知恵で論破できるほど、システムの作りはおかしくない。

>>575 の指摘が一番正しいと思う。
とはいえ、U社の責任は重いと思うけど。

612 :名無しさん@1周年:2016/03/31(木) 23:47:27.13 ID:Gsnq8WwR0.net
>>1

スカイマーク、ANAの発券システム断って良かったな。

613 :名無しさん@1周年:2016/03/31(木) 23:49:14.56 ID:kamcDLsp0.net
>>606
おっしゃるとおり。
壊れてるのに、中途半端に生きてるノードが一番やっかいですね。
死ぬのなら、きっぱり死んで欲しい。
それを識別するロジックをつくるとソフトウエアが複雑になり、よりバグが起こりやすくなるし。

614 :名無しさん@1周年:2016/03/31(木) 23:50:47.87 ID:XoebzrzJ0.net
>609
えらそうにしてる人間ってぶん殴ってやりたよなw
そういうやつはお里が知れる人間が多いwwwww

615 :名無しさん@1周年:2016/03/31(木) 23:51:31.68 ID:r9YXBgjM0.net
>>611
浅知恵もクソもない、”社長が謝罪をしなければならないほどの重大障害が起こっている”事だけが

事実でしょう。何を言ってるの?あなた。この業界、結果だけが全てですよ。

「予備も用意していたけど、予備に切り替わらなかっただけ」なんて素人が聞いたら”世にも奇妙(間抜け)な物語”でしょう。

現場で使ってる人は自分は関係ないのに”ごめんなさい”と誤らなければいけないのに、

あなたたちは身内を甘やかしすぎなんですよ。

ITだからこれでいいけど、ビルやダムが倒壊して”ごめんなさい”じゃすまないからね。

本当にあなたたちは好戦的なだけで、中身ゼロですね。

とにかく妨害すんなよ、しょぼい人は。当たり前の事も出来ないのに変なプロシージャばかり考えやがって。

616 :名無しさん@1周年:2016/03/31(木) 23:53:35.19 ID:5q8hTrMy0.net
>>6
正論。

617 :名無しさん@1周年:2016/03/31(木) 23:55:11.95 ID:xi3QRNbs0.net
死んだハード自身に死んだ信号出させてそれに頼り切るなってことか

618 :名無しさん@1周年:2016/03/31(木) 23:56:33.01 ID:5q8hTrMy0.net
>>28
マルスができるまえの、人力予約システムの
ターンテーブルで回り続ける棚に
予約台帳を投げ入れる動画がみたい。

619 :名無しさん@1周年:2016/03/31(木) 23:59:49.67 ID:xI/As9/y0.net
>>615
明日はまだ金曜日だ、素直に精神科受けてこい。

620 :名無しさん@1周年:2016/03/31(木) 23:59:58.40 ID:XSD40hYcO.net
スイッチはPING飛ばして生死監視すべき。経路別にな。
多重化して障害時はFWごとバッサリ切り替えるんや。ぞくぞくするでえ、ほんまに。

621 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 00:00:48.98 ID:qh2VuBxJ0.net
死ぬに死ねないハブられの苦情にかんしては、舘ひろしにどうぞ

622 :名無しさん@1周年:2016/04/01(金) 00:01:08.33 ID:LpNJKeTZ0.net
乞食もすんなよ、おい。

俺はお前ら乞食の知性なんてこれっぽっちも必要としてないからな。

本当にクソのIT業界はクソだらけだな。自業自得だよな。

俺はお前ら”カスのしょぼい人”になんて一切の評価をお願いしてないから、それを理解しろよ。

本当に関わりたくもないぜ、カスのど三流企業やど三流日本支店となんて。

絶対に殴りたくなるので二度と面もあわせたくないが、犯罪者の特定はしないとな。じゃあな。

623 :名無しさん@1周年:2016/04/01(金) 00:02:44.99 ID:VsI/dzOo0.net
普通はウォッチドッグのプロセスがいたりするもんだけど違うのか?

624 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 00:03:03.72 ID:qh2VuBxJ0.net
>>622
だからさ、予備の大塩佳織の件に切り替えさせずに、みやけまゆみにこだわったのは舘ひろしに
おまえ文春だろが

まったく

625 :名無しさん@1周年:2016/04/01(金) 00:04:04.11 ID:uvlnrpt00.net
>>615
ベンダやANAのシステム部門の責任は重いと言っている。
あんたの言うような「当たり前の話」でこの事件が起こったわけじゃない。
システムはビルやダムのようなコンクリートの塊じゃない。
ただ、「結果だけがすべて」というあんたの指摘は正しいと思う。
IT業界は、こういう事態が発生すると賠償を請求されて、ペナルティを免れない。
でもIT業界と関係ない、あんたがたジジイ世代は、入れ歯はずして寝る時間だよ。

626 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 00:04:29.72 ID:qh2VuBxJ0.net
なぜ、みやけまゆみに拘ったか、そっちに莫大なドルが偽札でも北朝鮮製造でもあって

どうしてもそれの価値を優先させたい、日本円よりもそれが優先


それだけで週刊文春じゃいつも記事書いているよなあ

627 :名無しさん@1周年:2016/04/01(金) 00:06:01.13 ID:15jKtB6G0.net
>ネットワーク用語では、「スイッチ」と略されることが多い。

ネスペだが文脈もなしに、スイッチなんて略さないからw

628 :名無しさん@1周年:2016/04/01(金) 00:06:05.90 ID:TJv71U3U0.net
外資のくせにヤケに対応が親身で笑える。
あいつらが最も嫌がる休みやクリスマス休暇
とか狙って働かせたい

629 :名無しさん@1周年:2016/04/01(金) 00:08:18.16 ID:/R2rRcLlO.net
社長が報酬返上したから、君は一年給料10%カット、那須は返上ねと言われた正が後輪

俺はITインフラと関係ないんです怒wwwww
年収400無いんですけどwwwwwww

ノルマの五倍は四年連続稼いでいるんですけどwwww

630 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 00:08:27.14 ID:qh2VuBxJ0.net
そう?俺もなんか作業項目おもいついたわ、どうしよ

631 :名無しさん@1周年:2016/04/01(金) 00:15:18.64 ID:uvlnrpt00.net
>>622
気を悪くしてすまなかったね。
おやすみなさい。

632 :名無しさん@1周年:2016/04/01(金) 00:15:44.19 ID:BMCntj8n0.net
>>627
現場じゃエルツーやらバカハブやらスイッチていうけどなー
専門じゃないのでネットワークスペシャリストは受けてないわw

633 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 00:18:06.40 ID:+mE2rLFL0.net
アホなこと考えさせられると、どんどん作業量が増えるいつものパターンにはまってきた

634 :名無しさん@1周年:2016/04/01(金) 00:18:54.61 ID:9OwNYjWd0.net
switchのサイレント障害がトリガーか。
肥大化したシステムだと、ありがちだと思う。
突き詰めると障害検知の仕組み過信しすぎた設計and/or運用が悪いだけとは思うけど

今回は影響が大きすぎたね。
Unisysとciscoの担当者は他人事ながらご愁傷様

635 :名無しさん@1周年:2016/04/01(金) 00:19:38.16 ID:dYMlj9ED0.net
>>3
IOSだよ。春厨!

636 :名無しさん@1周年:2016/04/01(金) 00:21:26.07 ID:LLxypx1J0.net
しかしユニシス訴えられてあたりまえ。
一つのスイッチ配下に4つのDB配置してどうするのよw
せめて2つのアクセススイッチに2台ずつ配置と思うが。

あとはana側が過去の障害にとらわれて変な設計を強要したりしてないかな。
スイッチの故障シグナルが何か知らんが、クラスタ構成のDBの設計がおかしい。

637 :名無しさん@1周年:2016/04/01(金) 00:22:45.43 ID:XVWW6Rmc0.net
>>12
なんでコンシューマー向け製品?
シスコの方が堅牢じゃないのか?

638 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 00:22:53.93 ID:+mE2rLFL0.net
俺も頭痛いし金もないのに要求ばしばい言われてもな

639 :名無しさん@1周年:2016/04/01(金) 00:26:31.20 ID:BMCntj8n0.net
>DBサーバーからスイッチの故障を検知できるよう
スイッチングハブの冗長性の問題はさてき、こちらが本当だsったらやっつけ仕事対応の方が神がかり的

640 :名無しさん@1周年:2016/04/01(金) 00:27:02.27 ID:sC0ZVtBL0.net
>>632
ハードウェアルーティングしてるルータしか最初触ってなくて
それでネスペ受けたら、「ルータはソフトウェア処理だからパフォーマンスが出ない」ってのが定説だったのはショックだった
そんな遅れた知識のテストってどうなのかと

641 :名無しさん@1周年:2016/04/01(金) 00:28:30.83 ID:XVWW6Rmc0.net
>>634
ベンダーが接待漬けして導入した設計とかだとこうなるよな。

642 :名無しさん@1周年:2016/04/01(金) 00:28:50.89 ID:sC0ZVtBL0.net
>>628
外資といえども休暇はその国に合わせるんだよね
当たり前だがw

643 :名無しさん@1周年:2016/04/01(金) 00:29:24.51 ID:Ksdw7TWd0.net
>Catalyst 4948E

コアにこんなの使ってんの?w

644 :名無しさん@1周年:2016/04/01(金) 00:30:23.32 ID:15jKtB6G0.net
>>640
なんかいろいろ勘違いしてそうだw

645 :名無しさん@1周年:2016/04/01(金) 00:30:43.09 ID:E8VJLMtR0.net
>>636
冗長取ってたよ > スイッチ

646 :名無しさん@1周年:2016/04/01(金) 00:32:26.99 ID:QeIMj7i30.net
>>641
4948Eで接待とか

647 :名無しさん@1周年:2016/04/01(金) 00:39:03.67 ID:XVWW6Rmc0.net
>>598
ANAのシステム保守してる会社が糞なんだろ?
だから何回も障害起こしてる。

使っている用語に違和感ありまくり。
駒の兵隊かおまえさんは

648 :名無しさん@1周年:2016/04/01(金) 00:41:16.54 ID:93QTNLXW0.net
スイッチングハブの故障ってだけで
あれだけ大事になるのかよ

649 :名無しさん@1周年:2016/04/01(金) 00:41:27.14 ID:Gx65Y23/0.net
全部のサーバが停止するまで待ってたみたいだけど
他の拠点に回避させることは出来なかったんかな

650 :名無しさん@1周年:2016/04/01(金) 00:42:18.21 ID:E8VJLMtR0.net
>>648
スイッチングハブじゃないけどな

651 :名無しさん@1周年:2016/04/01(金) 00:43:03.30 ID:uvlnrpt00.net
>>643
系間スイッチだからねー。
モジュラ型のでっかいスイッチ買うほどでもないかもよ。
敗因があるとしたら、4948はCiscoが自社開発した製品じゃなくて、M&Aした会社の
ハードウェアという点だろうか。
HSRP/EIGRPは実績あるいぶし銀の技術だけど、それ用のiOSは新規開発したわけ
だから、枯れたとはいえなくなる。

652 :名無しさん@1周年:2016/04/01(金) 00:44:13.32 ID:93QTNLXW0.net
>>61
それだなw

653 :名無しさん@1周年:2016/04/01(金) 00:47:57.60 ID:15jKtB6G0.net
負荷としては旅客システムなんて知れてるからな。
故障してるくせに故障してませんって返されたら、SEは他の原因を必死に探して当然。

654 :名無しさん@1周年:2016/04/01(金) 00:48:42.83 ID:LLxypx1J0.net
>>645
冗長化といってもノード単位で機能していないから、別ノードに分けて配置すべきだよ。
4948ってスタックにもvLAGにも対応してないから、サーバ側でL3の冗長化組んでるのだろうが、こんなスイッチに基幹システム預けてるANAにもちょっと驚き。
あと、DB一台だけ稼働で動いたってなんだろうな。
クラスタのHBがIGMPで稼働してて、4948のマルチキャストに不具合発生したのかな。
そうすると全DBがAPサーバとユニキャストで通信できるがHB受信できないため、全DBがプライマリとして稼働したとか。

655 :名無しさん@1周年:2016/04/01(金) 00:49:31.51 ID:9OwNYjWd0.net
今回のはUnisysがサーバーの付属品で納めたswitchが問題だった。
アプリ寄りのSIer屋の設計したネットワークだから何か抜けてたのかと勘ぐってる。

あと客側の運用の問題だとしても、政治的にベンダーの責任になるパターンにも思える

656 :名無しさん@1周年:2016/04/01(金) 00:51:35.65 ID:BVZVCcEu0.net
>客側の運用の問題だとしても、政治的にベンダーの責任になるパターン

SIerはどこに行ったのん

657 :名無しさん@1周年:2016/04/01(金) 00:54:11.38 ID:15jKtB6G0.net
>>654
人が死ぬシステムじゃないし、同期保持のために止まったくれて、決済情報も消えず、年金システムみたいにお金が消えてなくなこともなかった。
めでたしめでたしじゃん。

658 :名無しさん@1周年:2016/04/01(金) 00:55:50.35 ID:NnP7GpbL0.net
>>653
それが2960じゃ役者不足で上位機種に変えたらしい。ショートパケットか?

659 :名無しさん@1周年:2016/04/01(金) 00:56:22.76 ID:BlMok3hE0.net
>>654
4台全部プライマリ

660 :名無しさん@1周年:2016/04/01(金) 00:58:01.82 ID:JF8A7C+F0.net
>>654
装置を選定する側は「安さが正義」だから
「機能を満たしていて、価格も安かったから選定した」は定量的な説明がつくので
何も考えなくていい

661 :名無しさん@1周年:2016/04/01(金) 00:58:20.05 ID:LLxypx1J0.net
>>659
クラスタとして正常稼働してるのではなく、全DBが自分以外は死んだと勘違いして稼働すると今回のような動きにならないか?

662 :名無しさん@1周年:2016/04/01(金) 01:00:31.59 ID:15jKtB6G0.net
>>660
IT業界以外の人は、シスコとかオラクルとか異常に信頼してるけど、実際そうでもないんだよな。故障するしバグも多々ある。

663 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 01:01:36.99 ID:+mE2rLFL0.net
しかし、自分で関係しといて言うけどhpのハブって高いな・・・

664 :名無しさん@1周年:2016/04/01(金) 01:03:07.07 ID:++D4n0eI0.net
>>662
どのメーカーでもネットワーク機器には不具合が有るよね、国産でもね
昔々の電話交換機は別だけど

665 :名無しさん@1周年:2016/04/01(金) 01:03:07.20 ID:LLxypx1J0.net
>>660
仮にOracleのRAC構成だったとして、クラスタ組むための機能要件満たすだけならそれこそコレガのスイッチで十分なわけで。
PCオタクの趣味で組んでいるわけじゃないだろうから、安いだけじゃNGではないかな。

666 :名無しさん@1周年:2016/04/01(金) 01:03:58.87 ID:zfA3r79+0.net
メーカ指定耐用年数超過とかアラートだしててもまだ壊れてないから予備交換にNG出す奴いるんだよな

667 :名無しさん@1周年:2016/04/01(金) 01:05:54.65 ID:O/NSELbH0.net
>本来であれば、スイッチが故障すると「故障シグナル」を発信し、自動的に予備機に切り替わる設計になっていた

切替機さん「お前、死んだら絶対俺に言えよ」
スイッチさん「…」

668 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 01:06:12.42 ID:+mE2rLFL0.net
車の金が無いんだ・・・

669 :名無しさん@1周年:2016/04/01(金) 01:06:40.53 ID:7KGy2LpK0.net
>>665
>安いだけじゃNG
必須機能を提示してそれを満たす製品が提案されてくる
最終的に価格勝負になる
採用したくないベンダーのものは弾くような要件いれればいいだけ

670 :名無しさん@1周年:2016/04/01(金) 01:10:37.13 ID:LLxypx1J0.net
>>667
胡散臭い表現だよね。
HA構成の切り替わり時は故障シグナルが届くのではなく、生きてますシグナルが届かなくなるのが一般的。。。

671 :名無しさん@1周年:2016/04/01(金) 01:12:58.53 ID:8cbbhd3u0.net
>>515
簡単にいうと私動いてますって情報を書き込む
インターコネクトが途切れたら、そこが使われる
で、インターコネクトでデータ同期もするから
お前うごいとったらあかんだろってなってシャットダウンをかける

672 :名無しさん@1周年:2016/04/01(金) 01:15:12.69 ID:LLxypx1J0.net
>>669
今回のは基盤を構成するコンポーネントの一部として構成されてたのがこのスイッチってことでしょ。
君の言うようにスイッチ単体でRFP、いや、この場合はRFQか、出てて、応札した中から要件みたした最安値のもの選んだのなら、ANAはユニシスを訴えるだろうか?
今回はそういう問題ではないよ。

673 :名無しさん@1周年:2016/04/01(金) 01:17:38.40 ID:sC0ZVtBL0.net
>>672
可能性だけで語られても

674 :名無しさん@1周年:2016/04/01(金) 01:21:37.55 ID:8cbbhd3u0.net
>>648
駅に入場できなくなったのと同じだから

675 :名無しさん@1周年:2016/04/01(金) 01:22:46.01 ID:O/NSELbH0.net
>>670
怪しいというか>>1の説明には全然納得がいかない。
故障した機器自体が自分で発報しないと予備系に切り替わらないなんて
そんな切替の設計自体ありえるのかと。

676 :名無しさん@1周年:2016/04/01(金) 01:23:05.82 ID:7aD92MOR0.net
3月だからまだマシだが、ゴールデンウィーク、夏休みの時期なら軽く死人が出るレベル
ま、メンテ失敗が原因だろ。システム弄るから起こる負の連鎖

677 :名無しさん@1周年:2016/04/01(金) 01:23:36.41 ID:cD05jqTu0.net
>篠辺修社長ら経営陣3人の報酬を1カ月間減額

こんなの痛くも痒くもないだろな
退職の時には数億円もらうんだから

678 :名無しさん@1周年:2016/04/01(金) 01:23:51.58 ID:bc+VD9ZQ0.net
思い切って抜く勇気も必要だったんだな

679 :名無しさん@1周年:2016/04/01(金) 01:24:53.81 ID:Z5kIZF/50.net
>>672 おまえ、発注したことないでしょ。
RFPって言いたかっただけだよねw

680 :名無しさん@1周年:2016/04/01(金) 01:27:18.70 ID:6LrcETZz0.net
ぶっちゃけ、スイッチの故障ならもうちょっと早くわからんかったのかね。
普段からネットワーク扱ってる人間なら真っ先にとはいかないまでも、それなりに早く疑いそうなものだが。

681 :名無しさん@1周年:2016/04/01(金) 01:31:45.54 ID:Ag17mjVl0.net
ネットワークの設計が出来て詳しく理解していてログも見れる優秀な人は基本的に運用部隊に居ない・・・

682 :名無しさん@1周年:2016/04/01(金) 01:33:15.30 ID:bc+VD9ZQ0.net
たとえいたとしても責任とれんからなあw下っ端に臨機応変な対応を期待する方が無理かと

683 :名無しさん@1周年:2016/04/01(金) 01:35:56.73 ID:Ag17mjVl0.net
優秀な人は「これがこうなったら異常」みたいな誰が読んでもわかるマニュアルを作る側
じゃあ、誰が監視してるかというとそのマニュアルを読む人

684 :名無しさん@1周年:2016/04/01(金) 01:42:57.20 ID:Yaz2ALcR0.net
あー
ハートビートのチェックでフェンス撃ち合っちゃったかw

685 :名無しさん@1周年:2016/04/01(金) 01:43:48.93 ID:Za/2XbOX0.net
>>651
そんな事言ったらCISCOの製品はほとんど買収したのばっかやん(´・ω・` )

686 :名無しさん@1周年:2016/04/01(金) 01:46:18.38 ID:nZ8aQC2m0.net
>>654
なんかわかってるようで全然わかってないなあなた

687 :名無しさん@1周年:2016/04/01(金) 01:47:46.79 ID:UNlgHuzy0.net
ONFHに共通設計を指示して超高信頼スイッチを作らせるべきだったな
一台数億円の

688 :名無しさん@1周年:2016/04/01(金) 01:48:38.82 ID:bc+VD9ZQ0.net
今回は低次元なレベルでの迷走だけど、早々にスイッチアレだとあたりをつけても
メインの電源ブッコ抜けるかその辺興味がある

689 :名無しさん@1周年:2016/04/01(金) 01:49:41.40 ID:nZ8aQC2m0.net
>>675
パンピーにイメージしやすい表現にしてあるだけで
実際はtrapのことだろ?

690 :名無しさん@1周年:2016/04/01(金) 01:52:31.58 ID:QD4RCx/M0.net
電源部が故障してOFF状態に落ちた場合は自身でどうやってトラップ上げるんだろね

691 :名無しさん@1周年:2016/04/01(金) 01:58:21.55 ID:eLbLRAHg0.net
メインフレーム→SW(正)→DB×4ってなってて、SW(正)がおかしいんで
SW((副)に切り替えるべきところをメッセージがでなかったんで、自動で切り
替わりませんでした!

なんだけど、そもそもメインフレームからくるデータorパケットがおかしい→
登録or参照すべきデータなので何回もSWに送られる→SWのメモリor処理能力オーバー
→SW(副)に切り替えるべき→不通ではないor閾値越えてないか値間違えた→SW
切り替わらない→DBに登録できない→席予約DBとか更新できない→更新できてないけど
参照とか追加くる→DB落ちる

みたいなの?

692 :名無しさん@1周年:2016/04/01(金) 02:11:55.65 ID:teTbprBT0.net
そう言うなよ数年前NTTがやらかしたたった1個の故障で東日本大ネット停止もあったんだぞ
こんなもの軽症だわ

693 :名無しさん@1周年:2016/04/01(金) 02:19:28.67 ID:K9aKyjvw0.net
スイッチが故障じゃ無くてバグでしかも再現したのに、なんでスイッチの取り替えで大丈夫なんだろか。。

694 :名無しさん@1周年:2016/04/01(金) 02:20:08.65 ID:BMCntj8n0.net
>>690
そんなのping送って1分返答なければ落ちてる判断でいいじゃん

>>691
たぶんそうだろうね
で閾値越えでエラーみなすようにシステム組み替えて
今度は自動フェールオーバー祭りになったりして

695 :名無しさん@1周年:2016/04/01(金) 02:22:00.00 ID:JSwD2rBK0.net
       巛巛巛
       》》巛》》巛
       巛巛巛
        〓〓
        〓〓
         〓〓_
      /       \
      三    ― ― |
     |.≡   ⊃ ⊃
     ∂      > |
      |    ┏━┓|   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
     |   ┃─┃|  < 押すなよ!押すなよ!
     | \   ▼_/     \________
      |    ̄ 川 |   (⌒)
    /ト、   /7:`ヽ、ノ ~.レ-r┐
  /::::::::| ~''x‐''''~~ /:::ノ__ | .| ト、
/::::::::::::::::| ,,イ;;;;>、 〈 ̄   `-Lλ_レ′
::::::::::::::::::::::| /:::::| /:::: ̄`ー‐---‐′
             /. ̄ ̄ ̄\
            _|\:::::::::::  /|
           /::|:::::` ̄ ̄ ̄ ..|  ̄\
         /::::::::\::::::::   / ... /
         \     ̄ ̄ ̄   /

696 :名無しさん@1周年:2016/04/01(金) 02:23:11.21 ID:yLbYbq340.net
>>694
電源落ちた人がトラップ上げるってどうすんのって話なのに気づこうね

697 :名無しさん@1周年:2016/04/01(金) 02:23:54.95 ID:E8VJLMtR0.net
>>694

698 :名無しさん@1周年:2016/04/01(金) 02:26:41.75 ID:K9aKyjvw0.net
スイッチ単体で電源は冗長化されてるだろ。

699 :名無しさん@1周年:2016/04/01(金) 02:27:34.14 ID:BMCntj8n0.net
>>696
電源落ちた機器がトラップなんてあげれないからpingでキープアライブとってりゃいいじゃん???

700 :名無しさん@1周年:2016/04/01(金) 02:29:47.49 ID:15jKtB6G0.net
>>699
それで? とれないからサーバを自動停止したんだけど?

701 :名無しさん@1周年:2016/04/01(金) 02:39:17.76 ID:6MzZPDbo0.net
>>680
ciscoだからなあ。枯れてるから大丈夫と思ったのでは。自分でもまずそう思ってしまう。

702 :名無しさん@1周年:2016/04/01(金) 02:42:07.90 ID:dj3yOZbI0.net
http://ecx.images-amazon.com/images/I/51XMmvOh4mL.jpg

703 :名無しさん@1周年:2016/04/01(金) 03:14:40.90 ID:nZ8aQC2m0.net
>>691>>694
全然システム構成理解してなくてワロタw

704 :名無しさん@1周年:2016/04/01(金) 03:30:47.21 ID:xbS2eZwqO.net
ようするにハブみたいなもの?
うちのテレビ会議システムが全国的障害起こしたときも、サービス提供会社内のスイッチが原因って言われた。

705 :名無しさん@1周年:2016/04/01(金) 05:16:44.79 ID:HQM1L3ZX0.net
>>704
ハブもスイッチも、ネットワークのたこ足配線器としては一緒。

ハブは単に、たこ足配線するだけだけど。(なーんも設定できない)

スイッチだと、
「2個用意して、普段は1個め使って、壊れたら2個目に自動的に切り替える仕組みを入れよう!」
「これ1ギガのスイッチだけど、サーバーとスイッチは3本の線でつないで、3本束ねて3ギガで通信できるようにしようぜ!」
とかいろんな設定ができるのよ。モノ(=スイッチの賢さのレベルによる)によるけどね。

706 :名無しさん@1周年:2016/04/01(金) 05:27:29.72 ID:ljPBzcWC0.net
カタチあるもの全ていつかは壊れる。更改時には例えスイッチやハブでも使い回すべからず

707 :名無しさん@1周年:2016/04/01(金) 05:28:29.28 ID:HQM1L3ZX0.net
>>704
>>705
もう一個だけ・・。
スイッチも「ただのスイッチ」だと、なんも設定できない。
ハブに多少毛が生えたようなものもある。

708 :名無しさん@1周年:2016/04/01(金) 05:59:43.88 ID:JSwD2rBK0.net
>>704
> ようするにハブみたいなもの?

自宅で使っているハブは正式には「スイッチングハブ」という。

スイッチングでないハブは昔あったが15年ぐらい前から
スイッチングハブの値段が下がり今では売られていない。

>>705が言ってるのは高価なスイッチングハブの話であって、
家庭用のスイッチングハブにはついていない。

709 :名無しさん@1周年:2016/04/01(金) 06:11:45.75 ID:Rrbthy7B0.net
>>708
昔はバカハブとスイッチングハブで使い分けてたな。

710 :名無しさん@1周年:2016/04/01(金) 07:22:15.49 ID:a0N6sdiv0.net
ここにいるのはネットワーク屋?

711 :名無しさん@1周年:2016/04/01(金) 07:28:47.85 ID:TYepc4sv0.net
>>689
「シグナル」というのがSNMP Trapのことだとして。
故障した機器が自分でTrapを送らないと予備系に切り替わらない、という設計は
壊れた機械が正常にTrapを送れることを期待している点でそもそもおかしい。

それにL2の経路切替をSNMP Trapを契機に行うなんてことは普通はやらないし。

>>1の説明読んでも「それホントですか?」って感じ。

712 :名無しさん@1周年:2016/04/01(金) 07:32:48.68 ID:eigpHEGY0.net
ハブが壊れたの?

713 :名無しさん@1周年:2016/04/01(金) 07:37:57.62 ID:Rrbthy7B0.net
>>711
イーサネットスイッチが死ぬ間際に必ず
「私、もうダメ」
と言うことを信じてシステム設計したのに言わなかったから、
イーサネットスイッチのバグ。

このように仮定すると >>1 の説明は合理的。

714 :名無しさん@1周年:2016/04/01(金) 07:48:03.23 ID:hRfqnaTZ0.net
>>713
スイッチの仕組みにそんなものはない

715 :名無しさん@1周年:2016/04/01(金) 08:04:17.38 ID:NAkhROaH0.net
だからバッファローはやめとけと

716 :名無しさん@1周年:2016/04/01(金) 08:09:20.79 ID:PmLTvWkh0.net
スイッチをハンマーで叩き壊す直前に、スイッチが「私もうダメ、あとはよろしく〜」なんてトラップ
送る仕様ならビックリするわw

これは記事の書き方がおかしいから混乱してしまう。
スイッチが壊れたら、その機器を迂回するような経路を作ってやるようにネットワーク機器や間で情報交換して、迂回経路が機能する。

その前に生きてるスイッチが、隣のスイッチが壊れたことを検知しないといけない。そのため何度も色んな方法で隣のスイッチにシグナル?を送り呼びかける。
他の機器にも、あいつ生きてる?と聞いたりする。
それで応答がない場合、お亡くなりになったと判断し、仕事を隣から奪い、俺があとを引き継ぐと他の機器に宣言する。

たぶん、隣が死んでることを検知できなかったか、検知して仕事を奪ったけど、そのことを他の機器が認識してくれなかったか、
実は隣の人は半死に状態で中途半端に仕事を続けてたかのどれかかな。

717 :名無しさん@1周年:2016/04/01(金) 08:09:34.52 ID:a0N6sdiv0.net
>>714
そういう説明にしか読めないぞ

718 :名無しさん@1周年:2016/04/01(金) 08:11:41.65 ID:f1B0oPlO0.net
あのメーカーがって驚きだけど

719 :名無しさん@1周年:2016/04/01(金) 08:13:07.70 ID:0yQuhX8o0.net
中途半端が一番困るんだよな

720 :名無しさん@1周年:2016/04/01(金) 08:17:22.89 ID:YiL9IKXM0.net
RACのインターコネクト通信の中継なら機能的にはL2で十分だし
L2の冗長化でスイッチ側に必要なことって、せいぜいがループを避けるSTP/RSTPくらいじゃないの?
スイッチ2台までならそれすら要らない。

721 :名無しさん@1周年:2016/04/01(金) 08:20:28.53 ID:4XkTnyLu0.net
予約発券は動いてたんでしょ?
とりあえず、マニュアルで客詰め込んで飛べばよかったのにw

722 :名無しさん@1周年:2016/04/01(金) 08:24:56.75 ID:PmLTvWkh0.net
>>721
手書き搭乗券とスタンプでやってたよ。
でも到底さばききれない。

723 :名無しさん@1周年:2016/04/01(金) 08:27:46.70 ID:z4bpaOfC0.net
NSAは輸出するCisco製品にバックドアツールを仕込んでいた──スノーデン氏関連の新刊書が暴露
http://www.itmedia.co.jp/news/articles/1405/15/news096.html

724 :名無しさん@1周年:2016/04/01(金) 08:30:06.53 ID:AfqFJkOA0.net
>>532
専用工具
http://www.totsuki.co.jp/supplyproduct/images/rj45hikinuki00.jpg
意外と高い

725 :名無しさん@1周年:2016/04/01(金) 08:45:09.65 ID:LOdkqgTE0.net
アプレシアに変更だな

726 :名無しさん@1周年:2016/04/01(金) 08:46:41.11 ID:sUlvpSPT0.net
バッファローはバッキャローだし
コレガはこれが壊れる

727 :名無しさん@1周年:2016/04/01(金) 08:47:54.17 ID:s7ouVxS80.net
>>726
ヤマハはヤマ張ってスイッチされるのか?

728 :名無しさん@1周年:2016/04/01(金) 08:56:26.58 ID:7LRzXjwv0.net
>>725
MMRP-PLUSで冗長かw

729 :名無しさん@1周年:2016/04/01(金) 09:01:21.76 ID:2dmwZrEJ0.net
実はこういう問題だったら笑える
http://www.publickey1.jp/m/blog/15/post_257.html
4948Eは大丈夫だろうけど

730 :名無しさん@1周年:2016/04/01(金) 09:05:53.32 ID:rx/FYQXs0.net
シスコが駄目ならどこも駄目だ

731 :名無しさん@1周年:2016/04/01(金) 09:07:54.98 ID:Up1BjuyW0.net
武者修行中氏どうなったのかと思ったが、3月は2千万儲けたのか。

732 :名無しさん@1周年:2016/04/01(金) 09:11:48.83 ID:Ehx44pb60.net
原因を突き止められたんだからまだ優秀

733 :名無しさん@1周年:2016/04/01(金) 09:22:41.92 ID:GzFn7CJg0.net
おい今度は日航だぞ

734 :名無しさん@1周年:2016/04/01(金) 09:23:21.31 ID:FuHYwg+c0.net
マジでどうなってんだよ今度はJALとか

735 :名無しさん@1周年:2016/04/01(金) 09:23:41.52 ID:DuaspawC0.net
JALもやらかしたと聞いて飛んできました

736 :名無しさん@1周年:2016/04/01(金) 09:24:07.14 ID:m7xgMaDz0.net
今度はどこの国でテロかな

737 :名無しさん@1周年:2016/04/01(金) 09:25:11.10 ID:HQM1L3ZX0.net
>>708
質問者が、

> うちのテレビ会議システムが全国的障害起こしたときも、サービス提供会社内のスイッチが原因って言われた

って効いてんだから、キャッシュ機能まで語ると長くなるから割愛しただけよ。

738 :名無しさん@1周年:2016/04/01(金) 09:25:53.52 ID:FuHYwg+c0.net
システム屋いいかげんにしろよマジ困るんだから

739 :名無しさん@1周年:2016/04/01(金) 09:27:57.02 ID:gDneju1r0.net
JALも続けて落ちたか
こりゃ、単純な自然発生の出来事じゃないだろ。

740 :名無しさん@1周年:2016/04/01(金) 09:34:59.21 ID:shubMtTH0.net
JALもサーバー4機の接続障害っすか

741 :名無しさん@1周年:2016/04/01(金) 09:35:04.66 ID:2dmwZrEJ0.net
JAL障害キター

742 :名無しさん@1周年:2016/04/01(金) 09:35:51.26 ID:pAxKRjgM0.net
シナ製は恐いな

743 :名無しさん@1周年:2016/04/01(金) 09:36:48.00 ID:nVKSOEAl0.net
ジャアアアアアアアアアアアップwwwwwwwwwwwwwwwwwwww

744 :名無しさん@1周年:2016/04/01(金) 09:37:02.48 ID:q7M3JsU80.net
日航 システム障害で欠航や遅れ 復旧めど立たず
http://www3.nhk.or.jp/news/html/20160401/k10010464131000.html?utm_int=all_contents_just-in_001

>1日午前、日本航空の旅客機の重量や重心などを管理するシステムがダウンし、
>その影響で羽田を発着する日本航空の国内線の合わせて24便の欠航が決まり、
>そのほかの国内線や国際線の便にも遅れが出ています。

745 :名無しさん@1周年:2016/04/01(金) 09:37:16.17 ID:bW+eYQmGO.net
北チョンの電磁波攻撃かよwwwww

746 :名無しさん@1周年:2016/04/01(金) 09:40:52.84 ID:w/92JZ5z0.net
>>745
ありえるな 実は日本対して攻撃してたのか

747 :名無しさん@1周年:2016/04/01(金) 09:41:26.24 ID:jkP3COER0.net
いったい何が起きてるんです?

748 :名無しさん@1周年:2016/04/01(金) 09:41:41.35 ID:qrzTUh1M0.net
普通にサイバーテロって奴じゃないの?

749 :名無しさん@1周年:2016/04/01(金) 09:41:42.41 ID:03muXqKW0.net
JALもかよw

750 :名無しさん@1周年:2016/04/01(金) 09:42:36.33 ID:CBmy+SwD0.net
JALよお前もか 請負が日本ユニシスだったらびびるw
http://headlines.yahoo.co.jp/hl?a=20160401-00000001-rescuenow-soci

751 :名無しさん@1周年:2016/04/01(金) 09:44:02.34 ID:w/92JZ5z0.net
>>747
サイバーテロ始まった

752 :名無しさん@1周年:2016/04/01(金) 09:46:14.20 ID:ZgzVjlzGO.net
JALはIBMだったっけ?

今回は重量計算だから全日空の時とは性質が異なるが

753 :名無しさん@1周年:2016/04/01(金) 09:50:52.54 ID:caOytlf00.net
なんでスレ立たないの?

754 :名無しさん@1周年:2016/04/01(金) 09:51:49.47 ID:s7ouVxS80.net
>>753
立ってるよ。

【航空】日本航空(JAL)、旅客機の重量などを管理するシステムに不具合 国内線と国際線の便で欠航や遅れが発生©2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1459471651/

755 :名無しさん@1周年:2016/04/01(金) 10:10:14.84 ID:mG46uEEw0.net
200万以上するのかな?値段が表記されてないから
ぼったくり用の製品なんだろうね

756 :名無しさん@1周年:2016/04/01(金) 10:11:22.89 ID:ClDdLGi+0.net
今までスレ見た感じだと原因はスイッチの問題で死活監視はしてたけどリンクアップもピングも通るけど何か挙動がおかしくて切り分けに時間がかかったってことかな?
でその場合に自動で切り替わらなかったと
であればレイヤ3以上の細かい挙動の監視が必要になるね

757 :名無しさん@1周年:2016/04/01(金) 10:11:46.49 ID:zrayWazA0.net
サーバーにNIC2つ付けて、別々のIP振って別々のスイッチに接続して、片側のネットワークがおかしくなったら、もう一つのNICから情報を送れば良いだけじゃないか?
これなら簡単に出来そうだけど。

758 :名無しさん@1周年:2016/04/01(金) 10:13:30.49 ID:zrayWazA0.net
>>100
プラチナポイントの付与かな?
修行僧なら

759 :名無しさん@1周年:2016/04/01(金) 10:14:55.09 ID:A2sUHrAm0.net
>>757
「ネットワークがおかしくなった」ってのをどう言う基準で判断するのかが難しい

760 :名無しさん@1周年:2016/04/01(金) 10:18:56.54 ID:w/92JZ5z0.net
>>757
それで直らないから テロの疑いがある

761 :名無しさん@1周年:2016/04/01(金) 10:19:46.26 ID:9kb82UnF0.net
>>723
テロっぽい

762 :名無しさん@1周年:2016/04/01(金) 10:19:54.93 ID:yG1rnCVI0.net
>>757
今回のはスイッチのバグで片側のネットワークがおかしかくなったってのが検知できないから起こった

763 :名無しさん@1周年:2016/04/01(金) 10:23:15.18 ID:kUq7r2FN0.net
CISCOの機器は互いに監視しあってるからな
検知がうまくいかなかったのか、検知したけどそのあとがダメだったのか、そこが問題だ

764 :!omokuji:2016/04/01(金) 10:28:50.47 ID:5zjvwzbe0.net
>>752
2014年にも重量管理システムの障害あったけど、その時はルフトハンザシステム製って書いてあった。

765 :名無しさん@1周年:2016/04/01(金) 10:29:22.02 ID:ClDdLGi+0.net
ciscoって中国生産なの?

766 :名無しさん@1周年:2016/04/01(金) 10:32:05.46 ID:HQM1L3ZX0.net
>>765
今、CCNPの取得用に購入した、古いCiscoのルータとスイッチ見たら両方
メイドイン中国って書いてあるわ。

まぁ、ものとしては10年は前の品だけど。

767 :名無しさん@1周年:2016/04/01(金) 10:36:32.65 ID:A4jxIQn00.net
JALはもう復旧したぞ。
この速さは、IBMか日立だな。

768 :名無しさん@1周年:2016/04/01(金) 10:37:32.83 ID:ClDdLGi+0.net
>>766
ファームウェアになんか仕込まれてる可能性はあるね

769 :名無しさん@1周年:2016/04/01(金) 11:20:03.79 ID:nZ8aQC2m0.net
>>757
おかしくなったのが検知できなくて切り替わらなかったのに?w

770 :名無しさん@1周年:2016/04/01(金) 11:47:29.32 ID:FTYpwTjt0.net
故障シグナルがsyslogかtrapか判らんが
その程度のバグで長時間提出なんで
完全に運用設計ミスだろう

771 :名無しさん@1周年:2016/04/01(金) 11:48:28.32 ID:Rrbthy7B0.net
>>767
4月1日にありそうなのは契約の期限切れ。

772 :名無しさん@1周年:2016/04/01(金) 12:09:47.48 ID:nLPvJa6L0.net
>>757
リンクは生きてたんじゃね? 通信に以上があったかどうか、判断できるかどうかは分からんけど。

773 :名無しさん@1周年:2016/04/01(金) 12:12:16.31 ID:nZ8aQC2m0.net
>>770
そう思う。
ユーザ側がシステム詳細を完全に理解できてないで運用とかするとこうなるのかな。
システム自体の概要設計とか詳細設計まではカネ貰ってやってても運用はグレーな時あるよね。
運用手順書までベンダーに作らせても理解してなきゃ意味ないしな。

774 :名無しさん@1周年:2016/04/01(金) 12:15:26.25 ID:JSwD2rBK0.net
システムはたったの3時間で復旧してるんだが?

775 :名無しさん@1周年:2016/04/01(金) 12:16:11.51 ID:nZ8aQC2m0.net
>>772
想像でしかないけど、Oracle Clusterwareが発見してくれる前提だったんじゃない?
タイムアウト未満で死んだり復活したりして乱れてると恐らくだめだからね。
脳死だけど心臓は動いてるみたいな。

776 :名無しさん@1周年:2016/04/01(金) 12:20:07.78 ID:FTYpwTjt0.net
>>774

3時間もだろう・・・
トップニュースになる程の障害で「たった」はないと思うよ

777 :名無しさん@1周年:2016/04/01(金) 12:20:08.48 ID:pX2amRbI0.net
>>775
カタリストの故障の全てをオラクルで網羅しろってのはムチャだぜ

778 :名無しさん@1周年:2016/04/01(金) 12:20:41.42 ID:MTdB774i0.net
記事が内容にあわせると

2台のスイッチでEEM Scriptingで作り込みするも機能せず
当然、監視運用でsnmpやsyslogで不感知
oracle側のheatbeatでも感知できなかったので
同期処理アラートがでるとDB鯖側でもハンドリングできるようにしてみますた
-=≡Σ(((⊃゜∀゜)つ

779 :名無しさん@1周年:2016/04/01(金) 12:22:52.38 ID:A+ssPzNX0.net
スイッチガー

780 :名無しさん@1周年:2016/04/01(金) 12:24:36.81 ID:FTYpwTjt0.net
>>776


例えば、それが天変地異とかよほど特殊な障害だったら理解出来るし、

「たった3時間で復旧」と言えるけど

「故障シグナルを送信しない程度のバグ」では、「監視設計ミス」

としか言いようがない

MIBでゲットするとか異常時はポートトラフィックレートとエラーカウンターを
確認するとか色々やりようがあると思うけどこれほどのシステムで
どんな運用監視をしてたのか気になる

781 :名無しさん@1周年:2016/04/01(金) 12:24:46.29 ID:MTdB774i0.net
という感じなのかな?

782 :名無しさん@1周年:2016/04/01(金) 12:25:10.15 ID:nZ8aQC2m0.net
>>777
いや俺は別にスイッチ障害がそれで賄えるなんてことは言ってない。
あくまでその4948EはRACのインターコネクトのものだから
本来の役割を果たしてない場合にそこで検知して切り離せることを想定してたんでしょって。

だからスイッチの半死にみたいにそれだと対応できないでしょうって言ってるだけですが。

783 :名無しさん@1周年:2016/04/01(金) 12:25:58.66 ID:AxQSpcCa0.net
>>12
名前だけじゃん。作ってもいない。

784 :名無しさん@1周年:2016/04/01(金) 12:26:45.45 ID:BlMok3hE0.net
システム障害つーかネットワークエラーだよねこれ・・・

785 :名無しさん@1周年:2016/04/01(金) 12:27:51.14 ID:pX2amRbI0.net
>>782
そか、横槍すまんな

786 :名無しさん@1周年:2016/04/01(金) 12:30:43.23 ID:hnGeEcUH0.net
>>15
10base5 がいいなぁ

787 :名無しさん@1周年:2016/04/01(金) 12:37:01.77 ID:JSwD2rBK0.net
>>776
> トップニュースになる程の障害で「たった」はないと思うよ

トップニュースになるのは、利用者が多いからだろ。
通常は巨大なシステムのほうが復旧に時間がかかる。
個人のパソコンじゃあるまいし。
それがたったの3時間で復旧したんだよ。

788 :名無しさん@1周年:2016/04/01(金) 12:38:35.75 ID:WfMq12ow0.net
心臓発作を起こした人が最後に助けてー!って言わないと助けてくれないシステム。
倒れた人を見つけたら助けるシステムにしろよw

789 :名無しさん@1周年:2016/04/01(金) 12:40:10.73 ID:HzhHF9TN0.net
>>787
スイッチ切れたら入れ直せばいいのに
3時間もお茶飲んでサボってたんだよw

790 :名無しさん@1周年:2016/04/01(金) 12:43:19.85 ID:0Bzd6mZE0.net
クスコなんぞしらんわ
ルーターと言えばコレガやろ

791 :名無しさん@1周年:2016/04/01(金) 12:44:04.12 ID:nLPvJa6L0.net
>>778
鍛冶屋か消防士みたいでカッコいいなw heatbeat。

792 :名無しさん@1周年:2016/04/01(金) 12:45:42.05 ID:nLPvJa6L0.net
>>784
発端わデータエラーかSQLかサーバーのような気もするが。

793 :名無しさん@1周年:2016/04/01(金) 12:48:24.70 ID:A2sUHrAm0.net
>>788
倒れたので様子を見てたらムクリと起き上がったので大丈夫かと思ったらまた倒れた
ってのを延々と繰り返してたりしてな

794 :名無しさん@1周年:2016/04/01(金) 12:53:10.99 ID:JSwD2rBK0.net
>>789
> スイッチ切れたら入れ直せばいいのに
だから一般家庭レベルで物を言うなってw
インターネットに繋がりませ〜んって話じゃないんだから。

まずデータベースが停止してるんだよ。
その時点でスイッチ再起動してもだめだろ。

スイッチ自身は(バグで)異常はないと通知していて、
データベースが落ちたのなら、普通はまずデータベースに問題があると推測するよな?
そして時間がかかるのが問題がどこにあるかの切り分けだ。
試行錯誤しないといけないから時間がかかる。

安易に再起動したら、今度は本当にそれが原因だったかがわからなくなる。
再起動したら直ったんですよね〜。原因なんでしょうねぇ〜。
再現できないからまた同じこと起きるかもですね〜。じゃだめ。
本当にスチッチが原因なのか確認しないといけない。

そしてネットワークが繋がったからと言ってそれで復旧完了じゃない。
データに異常がないかチェックしないといけない。

原因はわかった後ならなんとでも言える。
原因がわかる所までの作業が大変なんだよ。

795 :名無しさん@1周年:2016/04/01(金) 12:53:12.38 ID:TAzZumQ70.net
>>793
それっしょ
バグかイーサの故障かで
パケットが一部ロストしてたとかそんなもん

796 :名無しさん@1周年:2016/04/01(金) 12:55:10.09 ID:FTYpwTjt0.net
>>787

そんな利用者が多くてサービスに直結する基幹システムは、
冗長化して単一障害ではシステムがダウンしないようにするんだよ

で、今回はスイッチの故障自体はAM03:44分に発生してたみたいだけど
残り3台のサーバーが停止するAM8:22までシステム管理者は何をしていたの?

4948Eでどんな故障が発生してたかは知らないが機器にログインしてCLIで状態を
確認すればすぐ判るだろうに
この5時間の間に適切な処理を施せば、サービス断は0だったんだよ

それをせず/出来ずにダラダラと1台で運用して結果高負荷となり、
たかだか1台のスイッチ障害で基幹業務が3時間も停止するってのが
ありえないって言ってるんだ

797 :名無しさん@1周年:2016/04/01(金) 13:00:26.18 ID:FTYpwTjt0.net
>>794

いや、だからその故障を検知する仕組みがおかしいんだよ

スイッチがバグで「故障シグナルを送信しない」としても
NMSからのpoolingでMIBの異常検知ぐらいするだろうし、
スイッチのトラフィックとポートエラーカウンターを監視
してれば簡単に検知できそうな気がするが

798 :名無しさん@1周年:2016/04/01(金) 13:01:42.32 ID:JSwD2rBK0.net
>>796
> そんな利用者が多くてサービスに直結する基幹システムは、
> 冗長化して単一障害ではシステムがダウンしないようにするんだよ

冗長化しているだろ。

>>797
> スイッチがバグで「故障シグナルを送信しない」としても

あとからならなんとでも言える。

799 :名無しさん@1周年:2016/04/01(金) 13:02:15.62 ID:Rrbthy7B0.net
>>796
管理者は
「(システム異常の)目覚ましが鳴らなかったので寝てました」
と言うのが普通。

800 :名無しさん@1周年:2016/04/01(金) 13:02:26.10 ID:w3E56Xyx0.net
>>625
自分らで中身の責任まで取れねえものを安く(実際安くもねえが)買ってきて
それをオープンシステムでございとクリティカルなシステムにまで突っ込んでるだけだろ
オレは>>615にまるっと同意するね
とくにこのくだり
>とにかく妨害すんなよ、しょぼい人は。当たり前の事も出来ないのに変なプロシージャばかり考えやがって。

801 :名無しさん@1周年:2016/04/01(金) 13:04:39.18 ID:JSwD2rBK0.net
>>796
> で、今回はスイッチの故障自体はAM03:44分に発生してたみたいだけど
> 残り3台のサーバーが停止するAM8:22までシステム管理者は何をしていたの?

残り3台で運用していた。

802 :名無しさん@1周年:2016/04/01(金) 13:05:08.28 ID:A2sUHrAm0.net
>>796
情報システムとネットワークで保守部門が分かれてて切り分けに時間がかかったのかもな

803 :名無しさん@1周年:2016/04/01(金) 13:05:38.88 ID:Rrbthy7B0.net
>>625
発注者が検収してOKを出したんだから
損害賠償はやりすぎ。
でも株主を恐れて、とりあえず損害賠償?

804 :名無しさん@1周年:2016/04/01(金) 13:09:21.72 ID:JSwD2rBK0.net
http://www.aviationwire.jp/archives/85999

>  その後、午前8時59分に1台を再起動出来たが、DBサーバーを複数
> 立ち上げると不安定な状態が続き、午前9時27分に1台のDBサーバーで
> 運用することを決めた。これにより、空港の自動チェックイン機や旅客係員が
> 使う端末の使用再開に向けて準備作業を開始し、午前11時30分に搭乗手続きに
> 関しては業務を再開できた。


まずは原因追求よりも業務再開のほうが重要なので、
わずか30分でシステムを稼働できる状態に持っていっている。

11時30分までにやったのは、手続きを行うための準備じゃねーか。
システムが直ったからってすぐに使えるわけじゃない。
何人も人はいるんだから

805 :名無しさん@1周年:2016/04/01(金) 13:10:40.91 ID:FTYpwTjt0.net
>>798

で冗長化してるにも関わらず故障箇所の検知に時間がかかり
意味をなさなかったと

それって設計ミスなのでは?

>>801

プレスリリーでは8:59からは1台運用だ

http://itpro.nikkeibp.co.jp/atcl/news/16/033000936/?SS=imgview&FD=1153259116&ST=erm>>798

806 :名無しさん@1周年:2016/04/01(金) 13:12:47.04 ID:A2sUHrAm0.net
>>805
冗長化と故障箇所の検出は関係ないっしょ(´・ω・` )

807 :名無しさん@1周年:2016/04/01(金) 13:15:44.40 ID:fXxWqHa00.net
>>786
動画じゃないからそんな太いのいらないよ

808 :名無しさん@1周年:2016/04/01(金) 13:19:12.16 ID:FTYpwTjt0.net
>>806

故障箇所を検知できずにバックアップに切り変わらないのなら
冗長化の意味自体がないっしょ

809 :名無しさん@1周年:2016/04/01(金) 13:19:57.46 ID:53ngVFyF0.net
>>786
イエローケーブルは面倒すぎ
ドリルで掘る時に失敗したら切れるし

810 :名無しさん@1周年:2016/04/01(金) 13:23:16.24 ID:JSwD2rBK0.net
>>805
> それって設計ミスなのでは?

設計漏れな。間違いじゃないが足りなかった。
本来はスイッチの故障はスイッチ自身が持ってる故障検知機能でわかるはずだった。
スイッチの故障+ 検知機能のバグ という2つの障害が重なった。
この場合の設計が漏れていた。

でたった3時間で直せたのは、設計が漏れていたことに気づいていないわけだから
その点は大丈夫だと思っていたわけで、データベースが落ちたのだから
スイッチよりもデータベースに問題があると考えるのが普通。

1台だと正常に動くと言うのも、原因がわかったわけじゃなく、
1台でやってみたら正常に動いたってだけ。このとき正常に動くのか
しばらくしたら落ちるのか確かめるためにある程度の時間も必要。

原因がスイッチだとわかっていれば、データベースに問題はないとすぐに判断できるだろうが、
この時点ではスイッチに問題があるなんて分かっていない。
直ったように見えた後も、その他の問題が起きてないかデータベースを含めあらゆる所を検査しないといけない。
そうして初めて直ったといえるんだよ。

何万人も使ってるシステムで、なおりました → と思ったら直っていませんでした なんて
適当な案内はできない。

お前が思ってるほど簡単なことじゃないんだぞ?
お前が考えてるのは数人が使ってるインターネットが繋がらなくなってなんか知らないけど
再起動してなおした。この経験から俺なら数分で直せるけどなって言ってるに過ぎん。
何も考えていない。


> プレスリリーでは8:59からは1台運用だ

だから1台運用になるまでは3台で運用してたんだろ。
運用していた=正常稼働ってことだ。
4台全てが停止したのは午前8時22分だ。

811 :名無しさん@1周年:2016/04/01(金) 13:27:25.60 ID:MdHj0O+N0.net
鯖もDBもネットワークも全部わかる人は貴重
でも育てるのが大変なんだよな

812 :名無しさん@1周年:2016/04/01(金) 13:28:44.42 ID:A2sUHrAm0.net
>>808
冗長化の切り替えは故障箇所の検出だけがトリガーでは無いよ?(´・ω・` )

故障箇所は分からないけど一定時間応答しないとかも含まれるのだが?

813 :名無しさん@1周年:2016/04/01(金) 13:31:32.26 ID:f/LjAYEW0.net
クロスケーブルとストレートケーブルと違いがあるのをわからなかったってマジかよw!?

814 :名無しさん@1周年:2016/04/01(金) 13:38:10.68 ID:nZ8aQC2m0.net
>>797
MIBで引っかからなかったからこうなったんだろ?

815 :名無しさん@1周年:2016/04/01(金) 13:40:34.21 ID:nLPvJa6L0.net
>>813
それはスイッチ側で判断できるし、それ言うならケーブルが1Gbpsまでだったとか、繋ぎまつがいかポート設定まつがいな気がする。
そしてハードを試験環境持ってって再現っつーなら、試験環境もまつがいかよと。

816 :名無しさん@1周年:2016/04/01(金) 13:40:36.62 ID:2sC2vaYd0.net
>>789
多分スイッチが違う

817 :名無しさん@1周年:2016/04/01(金) 13:42:05.85 ID:FTYpwTjt0.net
>>810


>設計漏れな。間違いじゃないが足りなかった。

OK、まず問題箇所が設計にあるって事は一致したね

>本来はスイッチの故障はスイッチ自身が持ってる故障検知機能でわかるはずだった。
>スイッチの故障+ 検知機能のバグ という2つの障害が重なった。
>この場合の設計が漏れていた。

ここの故障検知ってのがSyslog or SNMP Trapなら「設計ミス」だと思うよ
たまたまバグだったけどその通知パケットがNW上でDROPされたらどうなる?
UDPだから再送されずに同じ事になったんじゃないの?

普通に監視サーバーからのSNMP-GETかスクリプトでローカルログを自動
確認してれば防げたんじゃないの?


>でたった3時間で直せたのは、設計が漏れていたことに気づいていないわけだから
>その点は大丈夫だと思っていたわけで、データベースが落ちたのだから
>スイッチよりもデータベースに問題があると考えるのが普通。

複数のデーターベースがほぼ同時に同期できなくなったんならNWも疑うでしょう
もちろんアプリ側が一番怪しいけどNW機器も疑わないとダメだよ

>原因がスイッチだとわかっていれば、データベースに問題はないとすぐに判断できるだろうが、
>この時点ではスイッチに問題があるなんて分かっていない。

ここが遅いと言ってるんだ
要はスイッチ1台の故障だろ?

なぜそれの切り分けにこんなに時間が掛かるんだ

>直ったように見えた後も、その他の問題が起きてないかデータベースを含めあらゆる所を検査しないといけない。
>そうして初めて直ったといえるんだよ。

それはわかる
しかし3:44~8:22までの間に原因箇所を切り分けてスイッチを待機系に切り替えれば
システム断は発生しなかったと思うが違うのか?

>お前が思ってるほど簡単なことじゃないんだぞ?
>お前が考えてるのは数人が使ってるインターネットが繋がらなくなってなんか知らないけど
>再起動してなおした。この経験から俺なら数分で直せるけどなって言ってるに過ぎん。
>何も考えていない。

おれがいつそんな事を言った?
俺の意見を要約すると、

「スイッチの故障の割には問題箇所の切り分けに時間かかりすぎじゃね?」

だよ

>だから1台運用になるまでは3台で運用してたんだろ。
>運用していた=正常稼働ってことだ。
>4台全てが停止したのは午前8時22分だ。

そしてデーターベースが同期出来ない理由が分からず、1台で運用した結果
システムが輻輳して業務影響が出たと

818 :名無しさん@1周年:2016/04/01(金) 13:45:14.60 ID:FTYpwTjt0.net
>>812

一定時間相手が応答しない(パケットを返さない)ってのも故障検知の一つでしょ

スイッチの故障内容自体はわからんが、DBの同期が出来ない=DB間での通信が出来ないって
ことなら検知して動的・手動で切り替えしなきゃだめだよ
それが運用設計ね

819 :名無しさん@1周年:2016/04/01(金) 13:46:10.69 ID:nZ8aQC2m0.net
>>813
どこ情報?
それなら最初から正常動作しないだろ。

820 :名無しさん@1周年:2016/04/01(金) 13:47:05.01 ID:JSwD2rBK0.net
>>817
> ここの故障検知ってのがSyslog or SNMP Trapなら「設計ミス」だと思うよ
> たまたまバグだったけどその通知パケットがNW上でDROPされたらどうなる?

じゃあどうする?

検出機能を自分で作るのか?
その検出機能がバグっていたらどうする?

> 普通に監視サーバーからのSNMP-GETかスクリプトでローカルログを自動
> 確認してれば防げたんじゃないの?

それがバグっていたらどうする?

821 :名無しさん@1周年:2016/04/01(金) 13:48:15.97 ID:FTYpwTjt0.net
>>814

故障シグナルを送信しなかったって事なら「MIBをTrapしなかった」って事だろう
MIB/OIDを返さない不具合なら別の発表になると思うよ

822 :名無しさん@1周年:2016/04/01(金) 13:48:18.12 ID:nZ8aQC2m0.net
>>810
スイッチの問題と特定=データベースは問題ない

って、あなたあほですか?

823 :名無しさん@1周年:2016/04/01(金) 13:49:25.49 ID:53ngVFyF0.net
シスコの分際でメルコダウン

824 :名無しさん@1周年:2016/04/01(金) 13:49:26.51 ID:yG1rnCVI0.net
>>813
大昔じゃないんだからAutoMDIXに任せればいいと思うんだけど
スイッチポートの設定は今でも固定奨励なんだろうか?

825 :名無しさん@1周年:2016/04/01(金) 13:49:39.09 ID:JSwD2rBK0.net
>>817
> 「スイッチの故障の割には問題箇所の切り分けに時間かかりすぎじゃね?」

問題の切り分けだけに時間がかかったんじゃない。
問題が解決するまでの時間がかかった。

問題の切り分け自体は30分で終わっている。

http://www.aviationwire.jp/archives/85999
>  その後、午前8時59分に1台を再起動出来たが、DBサーバーを複数
> 立ち上げると不安定な状態が続き、午前9時27分に1台のDBサーバーで
> 運用することを決めた。これにより、空港の自動チェックイン機や旅客係員が

切り分けが完了したら、そこでシステム復旧じゃないんだが。

826 :名無しさん@1周年:2016/04/01(金) 13:49:52.81 ID:nZ8aQC2m0.net
>>810
あ、すまん。
後半でそうではないって書いてるね。
読み間違えてた。

827 :名無しさん@1周年:2016/04/01(金) 13:51:26.51 ID:FTYpwTjt0.net
>>820

だから機器の故障をその装置自身が通知するってのが間違いなんだよ
人でも機械でもこの場合は第三者側から確認させるだろう


>それがバグっていたらどうする?

導入前のテスト(障害&負荷試験)で事前に潰す

828 :名無しさん@1周年:2016/04/01(金) 13:51:45.25 ID:nZ8aQC2m0.net
>>821
だって記事なんて知識を持つ人だけじゃなく
一般人にもある程度イメージ的にわかる表現にするんだよ。
専門家からみて違和感のある日本語だからってのはあてにならないよ。

829 :名無しさん@1周年:2016/04/01(金) 14:04:20.70 ID:ClDdLGi+0.net
原因が外部にあるのにサーバの障害を調べるのはきついな
いくら調べても調べても原因らしきものがない、でも正常に動かない
眠いわ焦るわであの絶望感は本当に異常
で、どうもネットワーク側に異常がありそうだと分かり始めるんだけど
大抵サーバとネットワークは業者は別で間にSIerが入る感じでこちら側で簡単には調べられないんだよ
だから初動を間違えると時間かかるしSIerがハンドリングを間違えると本当に悲惨なことになる

830 :名無しさん@1周年:2016/04/01(金) 14:06:20.22 ID:JSwD2rBK0.net
問題と方針が分かった状態で、最善策に持っていく作業なら簡単だろうが、

1台で運用可能といっても、本来2台のスペックが必要なシステムを
実績がない中で1台で運用する決断にも時間がかかる。
動いたけどスペック不足で処理できませんと言う二次災害が起きる可能性がある。

まずは通常通りの状態(2台構成)に修復するのが先だろうし、
諦める(1台構成にする)までに試行錯誤しているはず。
搭乗手続きのみにシステムを変更するのにも時間はかかる。

状況がわかっていない中での再起動は問題原因を隠蔽してしまう可能性もある。
今回のスイッチの問題は、再起動したら原因がわからなくなるタイプじゃないのか?

高いスイッチには、ログインしてスイッチの状態を調べる機能があるはずだが、
そこで問題はないと表示されていたんだろ?
ならば問題ないと勘違いして、その他の部分に問題があると考えそちらの調査にも時間がかかる。

新たに監査機能をつければマシになるだろうが、それでも
「スイッチに異常はないとでてるのに、なぜか通信ができない」ということになる。
その結果スイッチを疑わないでケーブルやコンピュータに原因があると勘違いする可能性が高い。

このように考えることはたくさんあるんだよ。

831 :名無しさん@1周年:2016/04/01(金) 14:06:31.24 ID:A2sUHrAm0.net
>>818
故障箇所の検出は出来て無いよね?(´・ω・` )

> で冗長化してるにも関わらず故障箇所の検知に時間がかかり
> 意味をなさなかったと

って言うから、故障箇所の検出が出来無くても冗長化は機能するよ、って言いたかったのだが

832 :名無しさん@1周年:2016/04/01(金) 14:09:32.75 ID:2sC2vaYd0.net
つか、冗長化って言うか、クローンみたいなシステムはなかったんだろうか?

833 :名無しさん@1周年:2016/04/01(金) 14:11:12.15 ID:JSwD2rBK0.net
>>827
> だから機器の故障をその装置自身が通知するってのが間違いなんだよ

機器の内部が2つの構成になっていれば問題ない。

つまりハードウェア自体は一体であったとしても、スイッチの機能とは別にコンピュータが
独立して存在しており、そのコンピュータがスイッチを検査している。

実質、スイッチ機能と、そのスイッチ機能を検査するコンピュータの二台構成ってわけだ。
普通はそうなってるはずだが?

今回は、スイッチ機能の故障と検査機能のバグの2つが重なったにすぎない。
別の装置で通知するにしても、それは単に、スイッチ機能+検査機能+検査機能2という
検査機能を追加したに過ぎない。その追加した検査機能もバグってたらどうする?w

834 :名無しさん@1周年:2016/04/01(金) 14:11:25.07 ID:A2sUHrAm0.net
>>830
情報システム部門の人がスイッチの管理までしてるかと言うとそうでない場合もあるんだよね(´・ω・` )
スイッチにログインして調べれば何か分かったかも知れないけど、ネットワーク部門に問い合わせないとスイッチのマネジメントポートのIPアドレスすら分からないって事もあったりする

835 :名無しさん@1周年:2016/04/01(金) 14:12:13.26 ID:JSwD2rBK0.net
>>827
> 導入前のテスト(障害&負荷試験)で事前に潰す

テストはバグが有ることを検出することは出来るが、
バグがないことの証明はできない。

836 :名無しさん@1周年:2016/04/01(金) 14:13:17.03 ID:YOkdY4Sm0.net
このスレに書き込んだあと大手ネットショップ見に行ったら、
シリアル-USB変換ケーブルお勧めされた
ネットってこえー

837 :名無しさん@1周年:2016/04/01(金) 14:13:32.97 ID:JSwD2rBK0.net
>>834
> スイッチにログインして調べれば何か分かったかも知れないけど

今回のはスイッチにログインしても異常なしって表示されたんだろ?
優先順位で考えれば、これを信じてその他の場所に問題があると思うだろうな。

838 :名無しさん@1周年:2016/04/01(金) 14:19:32.01 ID:A2sUHrAm0.net
>>837
ポート or ケーブル故障でCRCエラー多発とかだったらshowコマンドで分かったかも
IOS自身のバグで何か特定の機能が異常になってた場合は難しいだろね(´・ω・` )

839 :名無しさん@1周年:2016/04/01(金) 14:26:03.43 ID:FTYpwTjt0.net
>>825

>バグがないことの証明はできない。

そんな当たり前の事を言われても・・・
バグのない機器なんて存在しないから、システムが想定通り動く事をテストして確認するんだろうに

さらにテストで検知できなかった不具合が本番環境で発生するのを想定して
障害時の切り分けフロー・手順を作って運用でカバーすると

>>837


発表内容は「機器が故障シグナルを送信しなかった」だからねCLIの情報は正確だったと思うよ
逆にCLIやMIBが異常な値を返すような不具合だと確かに時間は掛かよね。

840 :名無しさん@1周年:2016/04/01(金) 14:54:35.06 ID:FTYpwTjt0.net
>>831

>って言うから、故障箇所の検出が出来無くても冗長化は機能するよ、って言いたかったのだが

なるほどそういう事ね。

ただ、今回はその故障検知が出来ないと切り替わらない仕様だったから障害が長期化したって事だよね。

>スイッチが故障状態であるにもかからず、故障を知らせる「故障シグナル」を発信しなかった。
>国内線システムは故障シグナルを検知するとスイッチを予備機に切り替えるが、今回はその機能そのものを作動できなかった。

で再発防止策もその検知システムを変更したから一番の原因は運用設計に問題があったのではと言うのが俺の意見

>ANAは再発防止策も公表。まず同様の不具合でもシステムが正常稼働するようにトラブル発生2日後の3月24日に>システム改修を終えた。スイッチが「故障シグナル」を出さなくても、DBサーバーからスイッチの故障を検知でき>るようにした。

841 :名無しさん@1周年:2016/04/01(金) 15:44:24.14 ID:FTYpwTjt0.net
>>833

>機器の内部が2つの構成になっていれば問題ない。

そういう機器がある事は知ってるが、今回のC4948は単一シャーシ&CPUでstackも無理だ。

そもそもアラートの通知をSyslog/SNMP Trapだと仮定すると
通知パケットがNW上で破棄されたらどうするつもりだ?
UDPはTCPと異なり応答確認はなく、再送はしないぞ

一度に大量のTrapが来ると監視サーバー側でも正常に受信できる保証はないぞ

>別の装置で通知するにしても、それは単に、スイッチ機能+検査機能+検査機能2という
>検査機能を追加したに過ぎない。その追加した検査機能もバグってたらどうする?w

バグを回避する事は出来ないがリスクは減らせる。
SNMP-GETなら適切なIntervalで必要な情報だけどピンポイントで取得できる。
少なくとも「機器が故障を自分自身で送信して切り替える」って設計はリスクだらけでありえないし、
だからここを改善したんだろう

842 :名無しさん@1周年:2016/04/01(金) 16:01:26.82 ID:JSwD2rBK0.net
>>839
> バグのない機器なんて存在しないから、システムが想定通り動く事をテストして確認するんだろうに

システムが想定通り動く事をテストして確認してるだろ。
それでもバグが発生する。

843 :名無しさん@1周年:2016/04/01(金) 16:04:52.21 ID:w3E56Xyx0.net
>>842
SBOは発生しない前提の原発みたいなアタマの弱いやつが考える想定だろ

844 :名無しさん@1周年:2016/04/01(金) 16:05:29.74 ID:K+LcFOyB0.net
リモートで、ソフトのアップデートをやっていて、
スイッチの動作のプログラミングを変更した結果、
スイッチのルーティングが間違って設定されて
しまった結果、もはやリモートで作業することも
出来なくなって、そのうちシステム全体が動作
しなくなり、カウント10でダウンして敗戦。

この件では飛行機に乗れなかった客がどのような
補償をしてもらえたのだろうかが重要だろう?

845 :名無しさん@1周年:2016/04/01(金) 16:10:25.96 ID:w3E56Xyx0.net
>>844
>>502

846 :名無しさん@1周年:2016/04/01(金) 16:17:53.34 ID:2j/RpGKG0.net
>>844
推測なのか事実なのかはっきりしない書き方はアホの極みだな

847 :名無しさん@1周年:2016/04/01(金) 16:26:25.76 ID:e9RZOYHn0.net
バグで症状が発生している状況なんだから、ある極々まれなパターンになった時に誤動作をしているのであって
たとえばそのスイッチを切り離して障害確認しても、正常という反応しか返ってこないだろと。

848 :名無しさん@1周年:2016/04/01(金) 16:49:28.40 ID:kO70sdGu0.net
L2の経路冗長化にSNMPなんて不要だと思うんだけどな…
何をどう切り替えようといたのか不思議。

849 :名無しさん@13周年:2016/04/01(金) 17:06:48.58 ID:MRTA680r1
だからsnmpとかtrapとかハートビートとかそれ以前の問題だって。
DB間をオートネゴシエーションで繋いでたら故障によりhalfで繋がったんだよ。
halfでも通信はできるがエラーが出るわな。
それで同期が重くなって落ちた。
じゃないと損害賠償の話になるのかって?

850 :名無しさん@1周年:2016/04/01(金) 17:05:34.54 ID:2j/RpGKG0.net
何もわかってないSIerからとにかく全部trap上げたいんだけどとか言われて呆れる時はあるな
システムとか特性や運用から考えて優先度の高い物を自分で考えて絞り込まないと
trapまみれで意味なくなんのになw

851 :名無しさん@1周年:2016/04/01(金) 17:08:31.53 ID:15jKtB6G0.net
>>829
なわけあるか。

852 :名無しさん@1周年:2016/04/01(金) 17:16:51.36 ID:2j/RpGKG0.net
いやいやでも技術力を外部に依存しきってるSIerに当たるとそういうこともあるぞ。

853 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 17:21:06.46 ID:+mE2rLFL0.net
hpの元関係者だからってわけでもないが、今回みたいにhp-uxでhp/serviceguard入れてる場合
2重化してるネットワークのハブもhpにしといてくれたほうがいいと思うだけですね

聴いた話じゃ、宇宙ステーションで使ってるのはCiscoじゃなくてhpのプロカーブらしいし

854 :名無しさん@1周年:2016/04/01(金) 17:23:38.44 ID:HUj2v4EE0.net
社長の給料減額っていっても、昼食手当2日分減額くらいだろう。

855 :名無しさん@1周年:2016/04/01(金) 17:23:56.44 ID:15jKtB6G0.net
hpっはすぐテスト端折るから。

856 :名無しさん@1周年:2016/04/01(金) 17:25:19.18 ID:dpwYnBBz0.net
>>1
連続でこんな事起きるかってJALwww
ANAで報道されなかったんでJALだったんじゃね?

857 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 17:25:52.91 ID:+mE2rLFL0.net
>>855
ハブの名前の文句言われても困るんですよ、角松敏生とか関係ないし

858 :名無しさん@1周年:2016/04/01(金) 17:29:17.58 ID:fNxjXgJW0.net
カタリストがガタリスト

859 :名無しさん@1周年:2016/04/01(金) 17:31:09.25 ID:y/Ny8rll0.net
>>4
そう、製造は中国
そしてシスコのパチモノも中国製で、安いからってシスコのパチモノを導入する
企業も多い

860 :名無しさん@1周年:2016/04/01(金) 17:45:07.69 ID:nLPvJa6L0.net
ちなみに、DBサーバー2*二重化?→2*二重化+待機系、スイッチ二重化→
2*二重化にするって聞いたけど、そのカネはANAが払うの?

ハード代は払うけど、運用代と構築代は据え置きねwなの?
責任者の人柱と、下請け以外は損しないよね?

861 :名無しさん@1周年:2016/04/01(金) 17:47:29.89 ID:PVJf3cT90.net
>>859
セキュリティ終わるだろ

862 :名無しさん@1周年:2016/04/01(金) 17:53:18.52 ID:j72ngbHM0.net
もっとエンジニア向けに詳細版を公開してもいいと思うんだよね
一般人向け記事の「故障シグナル」をベースに話をするからsnmptrapだのsyslogだの違う方向の話になったり、変な勘繰りをされたりする

863 :名無しさん@1周年:2016/04/01(金) 17:55:38.78 ID:15jKtB6G0.net
>>862
SIerは自称SEなので。

864 :名無しさん@1周年:2016/04/01(金) 18:11:26.82 ID:A2sUHrAm0.net
>>859
そう言えばHuaweiは最初はCISCOの完全コピー製品作ってたんだよね(´・ω・` )
IOSのバイナリでそのまま動くというシロモノで、CISCOから訴えられた結果今のような完全CISCO非互換CLIになったという、、、
あれすごく使いづらかった

865 :名無しさん@1周年:2016/04/01(金) 18:43:54.52 ID:oDoUitg20.net
>>224
今回の場合どうせクラスタ停止してるしSTPでも大差なかったのではw
ベンダー拡張使わないとあかんけど

866 :名無しさん@1周年:2016/04/01(金) 18:45:51.87 ID:oDoUitg20.net
>>241
Javaだよユニシスが導入事例に上げてる
今回のトラブルには何の関係もないがw

867 :名無しさん@1周年:2016/04/01(金) 19:17:49.87 ID:oDoUitg20.net
iosのmulti-chassis redundancy関連で
signalの単語が出てくるのは
NSF/SSO
mLACPでETH-ALS
辺りだけど独自用語の可能性の方が高いかな
独自用語じゃないとするとETH-ALSかもしれんが
active/standbyで構成するかなあ

868 :名無しさん@1周年:2016/04/01(金) 19:45:31.16 ID:VsCfp+HZ0.net
シスコのスイッチが原因で前も障害起こしていなかったっけ?

なんでシスコを使い続けているの?

869 :名無しさん@1周年:2016/04/01(金) 20:01:27.04 ID:PmLTvWkh0.net
serviceguardもRACも、サポートマトリックスみたらhpスイッチよりciscoのほうが多い。

870 :名無しさん@1周年:2016/04/01(金) 20:06:03.94 ID:HQM1L3ZX0.net
>>868
Ciscoつかっときゃええねん!Ciscoつかっときゃ!
という思考停止。

まぁ、なんだかんだでネットワーク市場全体で見れば、シェアナンバーワンだし、障害件数で見ちまえば、
どーしたって、障害発生件数も多くなる。大規模案件で使われることだって多いだろうし。

出てきた障害の件数だけで見ちまえば、
「トヨタ車と光岡自動車比べると、トヨタ車の方が事故発生件数が多い」
「これはトヨタ車に問題があるからではないか」
って話をしてるようなもんよ。

871 :名無しさん@1周年:2016/04/01(金) 20:11:23.30 ID:PmLTvWkh0.net
>>870
ほんとそれ。

こんな大規模なシステムに、ciscoじゃなくてhpだかなんだかのルーターでVRRPを提案するとかありえない。
実績なさすぎで怖いし、絶対お客も嫌がる。

872 :名無しさん@1周年:2016/04/01(金) 20:52:36.26 ID:zcYtBUOA0.net
>>860
二重化って何かわかってないだろ。

873 :名無しさん@1周年:2016/04/01(金) 20:57:31.06 ID:FTYpwTjt0.net
>>848

etherの場合は単一性方向ポート障害とかあるからSNMPでポ−トステーテスは見た方がいい
サーバー側でUDLDでも動かせれば別だけどね

>>862

同感だけど「機器が発信する故障シグナル」のバグが長期化原因で、
対策は「DBサーバーから障害検知する方法に変えた」なら
SNMPをTrapからGetに変えた以外になにか考えられる?
もしこれがYesであれば素人レベルのミスだけど・・・・

874 :名無しさん@1周年:2016/04/01(金) 21:03:14.78 ID:yib+44yE0.net
まさか冗長化してなかったの?
大企業でありえんよなあ
大体、スイッチなんてそうそう故障しないけどな

875 :名無しさん@1周年:2016/04/01(金) 21:04:10.82 ID:zcYtBUOA0.net
>>862
外野に変な勘ぐりをされたところで痛くも痒くもないのでは。

876 :名無しさん@1周年:2016/04/01(金) 21:11:32.75 ID:dj3yOZbI0.net
>>868
コレガつかって障害起こすより皆が納得してくれるからだ

877 :名無しさん@1周年:2016/04/01(金) 21:18:35.57 ID:yib+44yE0.net
>>868
実績あるんだよ
大体、どんだけのShareで世の中で動いてると思ってるんだ
母数考えたら故障率の低さにビビるぞ
100%故障しない機器なんてないしな

878 :名無しさん@1周年:2016/04/01(金) 21:19:11.22 ID:rZQSstTE0.net
>>873
一体どういうトラップを想定してるの?
誰が何をトリガーとしてどういうトラップを送るわけ?

879 :名無しさん@1周年:2016/04/01(金) 21:19:56.40 ID:Cv2TdNGA0.net
>>386
スイッチ1台で数億?百万前後じゃないの?

880 :名無しさん@1周年:2016/04/01(金) 21:20:34.29 ID:rZQSstTE0.net
>>868
スイッチの問題じゃない
設計が悪い
ややビザンチン障害っぽいとはいえ
金額考えるとお粗末という他ない

881 :名無しさん@1周年:2016/04/01(金) 21:31:10.63 ID:rZQSstTE0.net
この案件はポート数も少なければ
バックプレイン容量も大して要求されないので
百万単位のスイッチで問題ないよね
けどこのレベルの案件にシャーシ内で
全てのコンポーネントが二重化されてる
シリーズを使わない意味は分からない
DBは四台も使って冗長化してるのに
油断じゃないか?
最低三重化しとかないと実働プラス一系統は待機させたまま
業務止めずに更新出来ないよね

882 :名無しさん@1周年:2016/04/01(金) 21:31:18.85 ID:15jKtB6G0.net
>>877
ここ最近、メーカー限らずネットワーク機器の故障率は低いとは思えない。
10年以上前の10baseメインならともかく1000baseで24h365日運用はなかなかきつい。
普通に負荷高いから熱設計がどれもギリギリなんだろう。

883 :名無しさん@1周年:2016/04/01(金) 21:40:26.73 ID:FTYpwTjt0.net
>>878

L2スイッチ用途であれば、ざっと思いつくのはこんな感じかな?

ポートステータス
ポートセキュリティ
ASICステータス
FANステータス
CPU閾値
温度閾値
メモリ閾値
シャーシステータス

Cat4948Eに該当OIDがあるかは知らん

>誰が何をトリガーとしてどういうトラップを送るわけ?

Cat4948Eが自身で内部ステータスをヘルスチェックして
異常があれば監視サーバーに送信

884 :名無しさん@1周年:2016/04/01(金) 21:51:02.26 ID:PmLTvWkh0.net
>>883
あの、その、だからw、自分が自分自身のステータスチェックして、それ信頼できるのかな?
俺のx番ポートはリンクアップしてるから大丈夫!っていわれても、対抗からそこにpingが届かないとか起こり得ないかな?

885 :名無しさん@1周年:2016/04/01(金) 21:57:33.43 ID:TiZOMucx0.net
> 自分が自分自身のステータスチェックして、それ信頼できるのかな?

自分自身じゃなくて、他人がステータスチェックすれば
信頼できると思ってる?

そうだね。じゃあ、スイッチングハブの中に
自分と他人を同居させればいいだけでは?

886 :名無しさん@1周年:2016/04/01(金) 21:57:58.91 ID:uvlnrpt00.net
ベンダやANAをディスりたい気持ちもわかるし、彼らの責任は重い。
でも、ちょっとパソコンに詳しい、家庭内ネットワーク構築したぐらいの知識で、事後の高みから嘲笑できるような単純なトラブルじゃないよ。

887 :名無しさん@1周年:2016/04/01(金) 21:57:58.93 ID:zcYtBUOA0.net
>>884
それを言い出したらじゃあどうやって?って話じゃないか?
ストレージとかだって自己診断機能と死活監視に頼る以外に正攻法はないから
CPUメモリの処理に依存せずにパーツ一つ一つを監視したいならパーツ一つ一つに
それぞれ専用のセンサーなりでも付けないと成り立たないでしょ。

そういうあり得ない理想論を言うのは技術者とは言わない。

888 :名無しさん@1周年:2016/04/01(金) 21:59:42.84 ID:FTYpwTjt0.net
>>884

ある程度は信頼できるが担保は出来ないよ。
だから「機器が故障シグナルを発信しなかったから予備機に切り替え出来なかった」って記事に驚いてる

>俺のx番ポートはリンクアップしてるから大丈夫!っていわれても、対抗からそこにpingが届かないとか起こり得ないかな?

十分起こり得る。
だからTrap単体での死活監視はありえず、他と複合的に監視するのが定石

889 :名無しさん@1周年:2016/04/01(金) 22:01:58.48 ID:TiZOMucx0.net
それから自分自身がチェックしない場合はこういう流れになるんだよ。

・他人がチェックする。
・なぜかネットワークがつながらない。
・その原因はなんだ?
・コンピュータか? OSか? LANデバイスか? ケーブルか? スイッチングハブか?
・ともかく原因は分からないが繋がらない。
・スイッチングハブの自己診断機能はどうだ? → 正常だ!
・では何が原因だ? あれこれ調べる。

な? あまり手順は変わっていない。

890 :名無しさん@1周年:2016/04/01(金) 22:03:42.12 ID:TiZOMucx0.net
>>888
> だから「機器が故障シグナルを発信しなかったから予備機に切り替え出来なかった」って記事に驚いてる

機器が故障シグナルを発信したら、その機器を予備機に自動的に切り替えるだろう?

では聞くが、

原因不明の状況でデータのやり取りが出来ない場合に
「何を」予備機に切り替えるというんだ?

891 :名無しさん@1周年:2016/04/01(金) 22:04:03.04 ID:15jKtB6G0.net
>>889
ネットワーク障害の切り分けは上の層からするのが基本なんですよw

892 :名無しさん@1周年:2016/04/01(金) 22:05:33.37 ID:TiZOMucx0.net
>>891
だから切り分けして障害を修復させたんだろ。
何を言ってるんだ?

893 :名無しさん@1周年:2016/04/01(金) 22:06:48.42 ID:uvlnrpt00.net
>>887
わかんないかな。。
ストレージのマルチパスの切替契機って、ストレージの自己申告じゃなくて、ホスト側が判断するでしょ?
NICのチーミングなら、デフォゲと疎通できるかとか、ホスト側でチェックして切替の判断をする。

あんたの言うポーリングに対する自己申告はたしかに負荷状態やトラブルの予兆をみるには有用だけど、自己申告の情報だけで、系切替をする判断材料にすることはない。

894 :名無しさん@1周年:2016/04/01(金) 22:08:15.58 ID:15jKtB6G0.net
>>892
おまえがこういう流れと言っておきながらド素人みたいな流れを書くからだ。

895 :名無しさん@1周年:2016/04/01(金) 22:09:56.72 ID:TiZOMucx0.net
>>894
だから何?

896 :名無しさん@1周年:2016/04/01(金) 22:11:03.26 ID:15jKtB6G0.net
>>895
おまえのプロジェクトはいつもデスマーチ。

897 :名無しさん@1周年:2016/04/01(金) 22:11:04.23 ID:uvlnrpt00.net
SNMPポーリングやトラップと、HSRPやVRRPのトラッキングは、どちらも死活をチェックするシグナル?かもしれないが、用途は全然ちがうから!
マスゴミがシグナルとか書くから、みんな知らないところをイロイロ想像力をで埋めようとする。

898 :名無しさん@1周年:2016/04/01(金) 22:11:59.64 ID:rlMZzUsw0.net
これ、vrrpとかで冗長化してるんじゃないのか?スイッチの故障でシグナルがいかないとか意味がわからん。シグナルがこないから、バックアップのルータがマスターになるんじゃないの?わかる人教えて。

899 :名無しさん@1周年:2016/04/01(金) 22:14:00.87 ID:TiZOMucx0.net
>>896
はいはい。良かったねw

900 :名無しさん@1周年:2016/04/01(金) 22:14:12.19 ID:zcYtBUOA0.net
>>893
あのさ、こんだけ検出困難なケースでありなおかつそういうものを全て包括的にって話をあんたは言ってるわけでしょ?
それだけ壮大な理想論をぶちあげといてマルチパス切り替えだけに絞って話をするっておかしくないか?
ちなみにストレージのマルチパスはホスト側じゃないから知ったかぶりもいいとこだよ。

901 :名無しさん@1周年:2016/04/01(金) 22:14:23.20 ID:JGGJQLCo0.net
シスコ以外なら選定責任が発生するからな

902 :名無しさん@1周年:2016/04/01(金) 22:15:13.45 ID:Jx+wTXh30.net
>>881
偉い人はDBの冗長化まではわかってくれるけど、スイッチまでは及ばないもの。

てゆうか、この件って一応L2は二重化してたんでしょ。L2スイッチの三重化とか
四重化ってあるの?

903 :名無しさん@1周年:2016/04/01(金) 22:16:21.11 ID:zcYtBUOA0.net
ホスト側じゃないってのは言葉足らずか。
必ずしもホスト側じゃないってこと。

904 :名無しさん@1周年:2016/04/01(金) 22:17:33.52 ID:FTYpwTjt0.net
>>890

で今回は「機器が故障シグナルを発信しなかった」から予備機に切り替わらなかったんだろ
お前が言いたい事がさっぱりわからん


>原因不明の状況でデータのやり取りが出来ない場合に「何を」予備機に切り替えるというんだ

長時間その原因不明な状態になったのがまずいんだよ
Cataystでどんな障害が発生したかは知らんが、ようはHW故障だろう
よほど特殊な故障以外は監視システムに不備があったとしか思えん

905 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 22:19:17.93 ID:+mE2rLFL0.net
>>904
俺は、この手の動作不良はアースが取れてないだけとおも

906 :名無しさん@1周年:2016/04/01(金) 22:20:23.43 ID:PmLTvWkh0.net
なんで死にかけノードの自己申告で、リスクを伴う系切替をするという発想になるのかな。
そんな提案してるベンダいるのかな?
SNMPポーリングで取ってきた情報で切替する設計なら、ポーリング間隔の間は障害発生に気が付けないんだよ。

907 :名無しさん@1周年:2016/04/01(金) 22:20:33.78 ID:TiZOMucx0.net
>>898
簡単な話。

故障したというシグナルが来たら、その機械が故障したことがわかる。
故障したと言うシグナルが来なかったらどこが故障したかわからない。
だから自動的に何かを切り替えることは出来ない。


だからここから人手で問題の切り替えを行う。
そして約たったの30分で1台構成ならば問題が起きないことを確認。

今までやったことがない1台構成の運用を行うことを決めたが
そもそも2台必要な負荷を想定していたシステムのため
1台で絶えきれるように、負荷を下げるため有効にする機能を絞り込む。

データに不具合が発生していないかなどの検証を経て、
各担当者に連絡、手動対応からシステム対応に戻すために調整を行う。
というのはたったの2時間半で対応したのだよ。これは凄く速い。

908 :名無しさん@1周年:2016/04/01(金) 22:22:12.96 ID:TiZOMucx0.net
>>904
> 長時間その原因不明な状態になったのがまずいんだよ

長時間ではない。たったの30分で1台構成であれば
問題が起きないことを突き止めてる。

909 :名無しさん@1周年:2016/04/01(金) 22:22:17.53 ID:uaeCFLh60.net
swの障害なんて、大規模センターなら結構あるだろ。
マヌケなのは、sw壊れてdbイカレるシステム設計だろ。
通信出来なかったらシステム止めろよ

910 :名無しさん@1周年:2016/04/01(金) 22:23:58.32 ID:PmLTvWkh0.net
>>909
ま、事後ならなんとでも言えるわな。

911 :名無しさん@1周年:2016/04/01(金) 22:25:46.86 ID:AEWL9SYi0.net
>>48

コレガはアライドテレシスになったんで
結構いいよ。
尤も親会社の方が赤字垂れ流し状態だけど

912 :名無しさん@1周年:2016/04/01(金) 22:26:05.86 ID:TiZOMucx0.net
>>910
そのとおりだね。スイッチが故障していたなんて後からわかったこと。
後からならなんとでも言える。

理由はわからないがデータベースが何故か停止する。
原因追求は置いといて、とりあえずシステムを復旧しなければいけない。
1台構成ならば問題ない事が判明。

ここまでたったの30分だから。

913 :名無しさん@1周年:2016/04/01(金) 22:29:43.36 ID:+EqDlX260.net
>スイッチが故障すると「故障シグナル」を発信し、自動的に予備機に切り替わる
これが具体的には何なのかを発表してくれないかな
絶対snmp trapとかじゃないと思うんだよ
snmp trap拾ったのを契機にNICの経路切り替えるなんて普通やらないだろ

914 :名無しさん@1周年:2016/04/01(金) 22:31:31.72 ID:Jx+wTXh30.net
>>909
この手のシステム1分止めたらいくらの損失になるか知らない零細企業の派遣乙

915 :名無しさん@1周年:2016/04/01(金) 22:32:00.59 ID:A/y+M6hX0.net
アライドを使っていれば問題なかったのに

916 :名無しさん@1周年:2016/04/01(金) 22:32:25.57 ID:uaeCFLh60.net
>>912
ネットワークなんざ切れる前提でシステム設計しとけよ
アプリ屋はネットワーク稼動率100%でシステム作り杉なんだよ
冗長化したって、切り替わらないことなんていくらでもあんだから

917 :名無しさん@1周年:2016/04/01(金) 22:33:37.02 ID:TiZOMucx0.net
>>913
どうせ高い機械だろ? なら専用の機能じゃねーの?

例えば、同じハードウェアを2つ用意する。
そのハード専用についている自動的な切り替え機能を使う。
これにより、ソフトウェアからは切り替わっても
経路を含めて何も変わってないようにみえる。

918 :名無しさん@1周年:2016/04/01(金) 22:33:39.14 ID:xsND78dI0.net
>>1の説明で成る程なと納得するシステムエンジニアやネットワークエンジニアはいないでしょ。

919 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 22:35:08.84 ID:+mE2rLFL0.net
うちのRACは外資はプリンタだけです

空調の富士通が問題です、空調にまで攻撃されてます

920 :名無しさん@1周年:2016/04/01(金) 22:35:11.87 ID:FTYpwTjt0.net
>>908

30分?
1台目のDBで異常発生から5時間以上経過してるだろ
お前さん切り分け開始を4台のDB全停止からカウントしてるぞ

921 :名無しさん@1周年:2016/04/01(金) 22:36:16.27 ID:Jx+wTXh30.net
>アプリ屋はネットワーク稼動率100%でシステム作り杉なんだよ

プログラマー「すいません…もう4日寝てないんです。お金いらないんで家に帰してください…」

922 :名無しさん@1周年:2016/04/01(金) 22:37:06.69 ID:TiZOMucx0.net
>>916
だからネットワークが切れたから、安全のために
データベースシャットダウンしてるんだろ。

お前、いつも想定通りの都合のいい障害ばかり起きるとは限らないんだぞw
想定外のことが起きたときに、自動的に対応なんてできん。

なぜか知らんがデータの同期が取れなくなった。起きた現象はこれだけ。
この時点でスイッチに問題があるかなんてわからん。
理由もわからんのに自動的に回復なんかできん。

そしてシステム再開を優先し、1台構成ならば問題がないことを
突き止めるまでわずか30分。

923 :名無しさん@1周年:2016/04/01(金) 22:37:49.97 ID:h1bhA3tf0.net
あるポートを突くとあれするよなw
言わないけど穴ある、Ciscoが使う用のポート

924 :名無しさん@1周年:2016/04/01(金) 22:42:24.13 ID:TiZOMucx0.net
>>920
1台だけだろ。他のマシンが正常稼働していたから問題なかった。
使ってない時間帯なんだから表面化もしていなかった。

それに何時に異常発生したと思ってるんだよw
タクシーも捕まらねぇよ。

リモートで対応できる障害ならまだしも、
ハードウェア障害なんだから人が居ないと対応できない。

対応できる人(原因を調べられる技術者)を24時間ずっと
データセンターに張り付かせろってかw

925 :名無しさん@1周年:2016/04/01(金) 22:42:42.04 ID:uvlnrpt00.net
運用設計に問題があったようにはみえなくて、運用設計が前提としていた、正しく動くべき、
実績あるネットワーク切り替えの機能がまさかの不具合で動いてくれなくて、運用でカバー
できなかったんだと思う。

その「まさかの不具合」が起こったときにもなんとかできるようにするのが運用設計だろ!
と2ちゃんのおっちゃんたちや、お客様がおっしゃるのだけど、それも言われても仕方がない。

・電車が通るときは、踏切では必ず遮断機が下りる。
・交差点の直進の信号が青なら、横断の信号は必ず赤である。

というくらいの信頼感があるはずの機能に不具合があったようなレベルだと思う。
(リアルだと、踏切や信号の前では注意しないといけないんだけどね。)
そんな、ほぼありえない不具合の顕在化した場合も大丈夫なようなロジックを、すさまじい
コストをかけてまで提案・実装することができたかどうか?が賠償の争点になると思う。

926 :名無しさん@1周年:2016/04/01(金) 22:44:14.96 ID:w3E56Xyx0.net
>そんな、ほぼありえない不具合の顕在化した場合も大丈夫なようなロジックを、すさまじい
>コストをかけてまで提案・実装することができたかどうか

すさまじいコストが掛かることが前提の話にしたいの?

927 :名無しさん@1周年:2016/04/01(金) 22:44:41.86 ID:TiZOMucx0.net
>>2にしっかり書いてあるんだわ
残り3台で運用していたと。


> 今回のシステム障害が発生したのは、22日午前3時44分。4台あるDBサーバーのうち、1台が停止。
> 残り3台で運用していたが、午前8時22分に4台すべてが停止した。

状況から見れば、何かしらの理由で
データベースサーバーがシャットダウンした。
データベースサーバーに異常がでてるのか?

ハードウェアは壊れるもの
残り3台あるからこれは想定内。

928 :名無しさん@1周年:2016/04/01(金) 22:45:05.32 ID:uaeCFLh60.net
>>914
この手のシステムwww
ホントに1分止まって何億も損失でるなら、センター運用とは別に、専任のオペレータつけて運用するんだよww
金融系のシステムとかな。
旅客システムなんて、1分止まったところで、1分後に復旧したらニュースにもなってねえよ

929 :名無しさん@1周年:2016/04/01(金) 22:46:23.67 ID:Jx+wTXh30.net
>データセンターに張り付かせろってかw

VPNすら使えない零細企業の派遣君乙です

てゆうか、このレベルのシステムならNagiosなり何なりの見張りを受け取る係の人が
24時間365日常駐してるけどね。データセンターじゃないけど

930 :名無しさん@1周年:2016/04/01(金) 22:46:57.06 ID:TiZOMucx0.net
>>925
そうそう。想定外っていうのは想定できなかったから
想定外なんだよ。

例えば上でpingとか言ってるが、この間pingは通るが時間がかかる
ping以外の通信はできないって状況になったことがある。
これだとpingによる死活監視を行っていても
異常は見つけられないことになる。

931 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 22:47:26.02 ID:+mE2rLFL0.net
この案件、東京新橋の不動産開発にまで影響がいくかもしれない

ほんと頭痛いわ

932 :名無しさん@1周年:2016/04/01(金) 22:48:13.74 ID:uvlnrpt00.net
>>926
そうだね。
ANAもあんたに頼んでればよかったね。

933 :名無しさん@1周年:2016/04/01(金) 22:49:03.80 ID:+EqDlX260.net
>>917
CatalystとIntegrityとOracle RACだからそんな特別なことしてるとは思えないんだよね

934 :名無しさん@1周年:2016/04/01(金) 22:49:36.05 ID:TiZOMucx0.net
>>928
> ホントに1分止まって何億も損失でるなら、センター運用とは別に、専任のオペレータつけて運用するんだよww

この手のシステムを専任のオペレータがその場の判断で異常事態に対応することはしないだろw

まず関係者に連絡だな。深夜に。

だが3台で運用できていた。
運用できていた状態ならば問題は深刻ではない。

935 :名無しさん@1周年:2016/04/01(金) 22:52:26.81 ID:uaeCFLh60.net
>>922
??
同期がとれてないってわかってるのに何でネットワーク疑わねえんだよ。
同期してねえって分かってるなら、疎通ぐらい見るだろ

936 :名無しさん@1周年:2016/04/01(金) 22:52:36.53 ID:NaeOsjAu0.net
>>902
もっと小さい案件で
シャーシ内で二重化されてるのを二つ並べてるが…
多分全体では二桁以上予算違うはず

937 :名無しさん@1周年:2016/04/01(金) 22:53:10.55 ID:NkmcaRON0.net
うちにあるやつと同じの使ってんのね
俺ハードオフで1000円で買ったよこれ
スゲー掘り出し物だった

938 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 22:53:45.58 ID:+mE2rLFL0.net
>>935
そのシンクロに別の意味があるんだろう

939 :名無しさん@1周年:2016/04/01(金) 22:55:10.78 ID:w3E56Xyx0.net
>>932
なんだすさまじいコストが掛かるからできないっていうお話にしたいのかw

940 :名無しさん@1周年:2016/04/01(金) 22:59:59.18 ID:TiZOMucx0.net
>>935
> 同期がとれてないってわかってるのに何でネットワーク疑わねえんだよ。
> 同期してねえって分かってるなら、疎通ぐらい見るだろ

最初にわかったのはデータベースシステムがシャットダウンしたことだけだ。

次にわかったことが、同期部分に問題があるのではないか?だ。

http://japan.zdnet.com/article/35079982/
> ANAは、原因について「IT部門と外部の専門企業とともに調査中」としているが、
>データベース間の同期にかかわる部分に障害が起きたのではないか、との見通しを示している。

いきなり同期部分に問題があるってわかったわけじゃない。
1台は復旧できたが、もう1台を立ち上げると、復旧したはずのサーバーがダウンするという状況
(ここまでわかるまでにも時間はかかる)

これをみて同期部分ではないか?と推測した。

この後だろ。ネットワークを疑うのは。

941 :名無しさん@1周年:2016/04/01(金) 23:00:15.92 ID:uvlnrpt00.net
>>935
「後知恵バイアス」ってググってみてください。

942 :名無しさん@1周年:2016/04/01(金) 23:00:57.72 ID:uaeCFLh60.net
>>934
深刻かどうかはオペレータ判断じゃない
db止まってても通報しなくてもいいことになってたなら、運用設計がザル

通報うけてて深刻じゃないってseが判断したんならseがザル

943 :名無しさん@1周年:2016/04/01(金) 23:01:07.86 ID:NaeOsjAu0.net
>>913
俺も絶対違うと思うw
link aggregationしててETH-AIS辺りじゃないのかねえ

944 :名無しさん@1周年:2016/04/01(金) 23:02:40.29 ID:FTYpwTjt0.net
>>924

おいおい1台目の障害検知から切り分けは開始するだろ
その間にスイッチの故障って切り分け出来てれば、こんな大騒ぎにはならなかったんだよ

>それに何時に異常発生したと思ってるんだよw
>タクシーも捕まらねぇよ。

知るか、客に「タクシーが捕まらなかったので長期化しました」とでも言うのかw

>対応できる人(原因を調べられる技術者)を24時間ずっと
>データセンターに張り付かせろってかw

切り分けはリモートでも出来るだろう
どんな故障か知らんがリモートでHW故障を検知できないのなら
そのシステムに問題がある。

945 :名無しさん@1周年:2016/04/01(金) 23:04:20.16 ID:NaeOsjAu0.net
>>940
同期が完全に行われないのではなく不調なのは
通信路の健全性が損なわれてるからだと
同期の状況を調べて分かったんだろうね

946 :名無しさん@1周年:2016/04/01(金) 23:04:54.30 ID:UPzB1AWT0.net
スイッチ故障なんて普通にあることなんで今時はスイッチで大きな障害なんて起こらない
それより冗長性がない状態に長期間気づかなかったのがひどい

947 :名無しさん@1周年:2016/04/01(金) 23:05:25.86 ID:TiZOMucx0.net
>>942
> db止まってても通報しなくてもいいことになってたなら、運用設計がザル

データベース1台が停止するのは想定内。
その為に複数台構成になってる。

本当にデータベースの不具合であれば、4台のうち1台が停止しても深刻ではない。
実際3台で運用していたと書いてある。

1台で動くと言うのなら、2台目、3台目が停止したあと、
残った1台で正常に稼働していたのかもしれないな。

そして2台目を復旧したとたん残った1台目の方が停止。
障害発生。ありえるシナリオだな。

948 :名無しさん@1周年:2016/04/01(金) 23:07:08.63 ID:TiZOMucx0.net
>>944
> おいおい1台目の障害検知から切り分けは開始するだろ

だから3台で運用していたんだろ。

いいか? 最後の1台が停止するまでは
システムは正常に運用できていたんだよ。

949 :名無しさん@1周年:2016/04/01(金) 23:08:15.96 ID:9bDh5H1T0.net
結局エレコムかサンワサプライの
安い方に落ち着く

950 :名無しさん@1周年:2016/04/01(金) 23:08:52.85 ID:uaeCFLh60.net
>>946
普通そう思うよなあ

でも、ここのスレだと、それ言うと叩かれる。
「後知恵バイアスでググってください」とかしたり顔でwww

951 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 23:08:57.01 ID:+mE2rLFL0.net
FBIはiPhoneのロック外すのにコピーに総当たりしてたが
その経緯も関係してるな

ハブはシステムの都合で2重化を受け持ってるが、それがコピーを受け付けなくなった

952 :名無しさん@1周年:2016/04/01(金) 23:09:23.41 ID:NaeOsjAu0.net
>>940
一応各レベルの技術者がそれぞれ規定時間内に対応出来るように待機してるでしょ
昔OracleのストレージやってるAuspexで
ランクの名前は忘れたが最高位の一つ手前の人が現地時間の朝方に出張ってきた事あったが
とてつもなく優秀な人で何事もなかったかのように復旧して去っていった
もちろんリモートで

953 :名無しさん@1周年:2016/04/01(金) 23:11:06.86 ID:TiZOMucx0.net
>>944
> 知るか、客に「タクシーが捕まらなかったので長期化しました」とでも言うのかw
別に言わなくていいだろw

分かってみれば今回は簡単な内容だったかもしれないが、
それは後から言えること。

大規模なデータ破損が起きることに備えて、
それをすぐに解決できる技術者(一人じゃ無理だぞw)を
ハードウェアがある場所に常に待機させることなんてできないぞ。


あんたが言ってるのは、例えて言うのなら、航空機が飛んでいるときに壊れる可能性があるから
すべての航空機に、エンジニアを搭乗させて修理器具を〜とか言ってるのと同じことだ。

954 :名無しさん@1周年:2016/04/01(金) 23:11:53.84 ID:uvlnrpt00.net
>>939
すさまじいコストがかからずとも、想定外の不具合をカバーできる実装ないしは考え方を、
ぜひとも伝授いただきたいものです。
あなたのお答えで、来週は大手SI屋の株価に大きな影響が出ると思われます。

955 :名無しさん@1周年:2016/04/01(金) 23:12:13.78 ID:uaeCFLh60.net
>>947
おいおい本気かよ
想定内じゃねえよ。基幹システムで異常が発生してて、「想定内です。キリッ」とか、どこの中小企業だよ。

956 :名無しさん@1周年:2016/04/01(金) 23:12:14.08 ID:PFBSuinA0.net
>>873
鯖間でのヘルスチェックパケットの正常性確認じゃないかな。
スイッチが腐ってたらパケロスとか化けとかで検知。

957 :名無しさん@1周年:2016/04/01(金) 23:12:44.12 ID:8bMyGzC10.net
うどんに影響出たんか?
応援しとるし頑張ってや

958 :名無しさん@1周年:2016/04/01(金) 23:13:31.59 ID:TiZOMucx0.net
>>955
基幹システムで異常が発生するのを
想定しないでシステムを作れと???

「異常は絶対に発生しません。キリッ」

959 :名無しさん@1周年:2016/04/01(金) 23:14:01.31 ID:f4Hr9OSg0.net
昨日の友は今日の敵。
損害賠償請求あなおそろしや。

960 :名無しさん@1周年:2016/04/01(金) 23:14:23.90 ID:NaeOsjAu0.net
>>946
こんなデカイ障害起こすくらいだから
あちこちおかしいんだろう
10年に2度もこんなすごい障害起こすんだから
ANAのシステム部も相当アレなことは確実
仕様や口出しがとてつもなくクソに間違いない

961 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 23:14:53.84 ID:+mE2rLFL0.net
>>957
これ相当影響あるわ、いろいろ確かめることは
ここでFBIの連中が言ってる嘘より沢山ある

962 :名無しさん@1周年:2016/04/01(金) 23:17:57.74 ID:uaeCFLh60.net
>>958
異常が発生しても、影響を及ぼさないようにするのと、影響がないから深刻じゃないと考えるのは同義じゃないだろwwww

おいおい、大丈夫かよ

963 :名無しさん@1周年:2016/04/01(金) 23:20:16.11 ID:TiZOMucx0.net
>>962
異常が発生しても影響を及ぼさない仕組みになっていたから
3台で運用できていた。

データベースシステムに問題があるだけだろう。

この時点ではシステムは問題ない状態だから、朝から復旧して十分間に合う。

964 :名無しさん@1周年:2016/04/01(金) 23:20:21.66 ID:FTYpwTjt0.net
>>948

お前さんは仮に原発に4台の電源があり、1台目の故障が発生しても
「3台で運用してるので大丈夫です。」

と判断されて詳細原因を切り分け出来ず、その後残り3台が全て落ちて、

「1台だと問題がない事を30分で切り分けました」
「原因不明なのでしばらく1台で運用します」

と発表されて納得するのかい?
普通になぜ1台目の障害で対処しなかったのかって疑問に思うだろ

965 :名無しさん@1周年:2016/04/01(金) 23:21:44.28 ID:w3E56Xyx0.net
>>954
対策コストの掛かるケースは想定外の不具合とすることで実装もテストも安く上げる工夫をしているので
SBO後に過酷事故した原発のように吹き飛ぶことは想定内での想定外なんですとぶっちゃけてしまえばいいでしょ
往生際悪杉w

966 :名無しさん@1周年:2016/04/01(金) 23:22:02.20 ID:mjsn1V7Z0.net
この分野はデルとかが凄い売り込んでるから
シスコもこんな単純ミスしてるようじゃ終わるな

967 :名無しさん@1周年:2016/04/01(金) 23:24:23.20 ID:uaeCFLh60.net
>>963
だからさあ、間に合ってねえじゃん

基幹システムなんだから、異常があったらそこから初動開始するだろ、普通。

対処しない判断したなら、担当seがクソなんだろ。

もしかして、ユニシスの中の人?

968 :名無しさん@1周年:2016/04/01(金) 23:26:05.94 ID:uvlnrpt00.net
>>965
苦し紛れにこの答えはひどい。。。
SIerの株価は安定し続けることがわかってよかった。。
まだ売らねー。

969 :名無しさん@1周年:2016/04/01(金) 23:26:56.69 ID:TiZOMucx0.net
>>964
> 普通になぜ1台目の障害で対処しなかったのかって疑問に思うだろ

なんで4台用意しているかわかるか?
それは壊れたときのためだよ。

1台目の障害で対処って壊れたハードウェアを修理するのかよ。その場で? おいおいw
すぐに修理できるなら4台も用意しないってw

人をすぐに呼んだとしても壊れた1台はすぐに直せるわけじゃない。
つまり3台で一定時間運用するのはあらかじめ想定された自体だ。

970 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 23:27:28.43 ID:+mE2rLFL0.net
ほかの板で書いたけど、本当の基幹だと系統は11系統ある
今回のはわりと単純なほう

971 :名無しさん@1周年:2016/04/01(金) 23:28:52.31 ID:uaeCFLh60.net
>>963
1台動いていない状態が問題ない状態ってどんな思考回路だよ。
即影響が出てないってだけで、問題アリアリだろwwwwwww

972 :名無しさん@1周年:2016/04/01(金) 23:29:03.32 ID:w3E56Xyx0.net
>>968
自称IT凍死家のポジショントークかよ
キモ杉w

973 :名無しさん@1周年:2016/04/01(金) 23:29:53.65 ID:TiZOMucx0.net
>>967
> だからさあ、間に合ってねえじゃん
後からならなんとでも言える。

ネットワークに問題があることは分かっていなかった。

データベースサーバーに障害が起きて仕様通り一台停止した。
壊れたならばすぐに修理できるわけじゃない。

だから壊れた一台を除いた三台で運用していた。
これは通常のデータベースサーバーの故障時のフロー。

974 :名無しさん@1周年:2016/04/01(金) 23:30:12.84 ID:NaeOsjAu0.net
>>967
シナリオなくて最初は完全復旧にこだわったんだろうな
性格に寄るよなシナリオないと

975 :名無しさん@1周年:2016/04/01(金) 23:30:52.31 ID:uvlnrpt00.net
>>972
遊んでくれてありがとう。

976 :名無しさん@1周年:2016/04/01(金) 23:32:00.66 ID:TiZOMucx0.net
>>971
> 1台動いていない状態が問題ない状態ってどんな思考回路だよ。

問題ある状態だってわかったからって
じゃあどうすれば良いんだよ?

その場で壊れた一台を修理するのか?
何時間かかると思ってるんだ。

故障を直すのには時間が掛かるから、あらかじめ4台も
用意しているわけで、直るまでは3台で運用するんだよ。

977 :名無しさん@1周年:2016/04/01(金) 23:33:28.26 ID:NaeOsjAu0.net
>>973
「3台にしたら動いた!」
「同期止まったサーバがおかしかったのかも」
「アレ?もう1台も…」

978 :名無しさん@1周年:2016/04/01(金) 23:34:29.19 ID:uaeCFLh60.net
>>974
その気持ち、すげーわかるわ。

シナリオつくってても、自分が対処するなら完全復旧したくなる
オペには、余計なことスンナって言うけどwww

979 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 23:35:01.77 ID:+mE2rLFL0.net
堀江は結局どっちの、味方か理解できん

まあ、頭部に関係するプリンターで株価操作狙ってるだけだろう

980 :名無しさん@1周年:2016/04/01(金) 23:39:07.16 ID:w3E56Xyx0.net
>>975
どこが手がけようと他社のシステムなんて他人事だよ
そも自社システムの可用性ためのハードウエア機能にカネを払う気もないのに
ヒコーキ飛ばすビジネスが社会的インフラだからITシステム側も自動的に素晴らしいシステムなのだろうと
ハリボテに変に期待させすぎたのが良くない

981 :名無しさん@1周年:2016/04/01(金) 23:39:57.06 ID:uvlnrpt00.net
後知恵が悪いんじゃない。実害を受けたユーザは後知恵で文句言って当たり前。
だって、航空券が取れなくて酷い目に遭ってるんだし、彼らそれぞれの業務に多大な影響を出しているから。
世界で例がないバグですから仕方ないでしょ、とエクスキューズしたところで、誰一人同情してくれない。
航空券を買うお金を出したお客さんがいちばん正しい。

でも、SIとしての物づくりのプロセスや実装に対して、どうしてこの問題が発生したのか?その原因は何で、
これから委託元も作り手も、どうリスクを管理すればいいのか?を考える場合は後知恵だとまったく意味が
ない。

前者と後者で、別々の嗜好の人たちが乱立してるから議論がかみあわないんだな。

982 :名無しさん@1周年:2016/04/01(金) 23:40:11.50 ID:uaeCFLh60.net
>>976
基幹系で異常がでてるなら、担当seにエスカレーションする運用設計にするだろ。
通報もらったseは、オペをリモートハンドにして即調査開始だろ。
故障対応だって、保守屋に24時間契約するんだよ

基幹系なら常識だが?

983 :名無しさん@1周年:2016/04/01(金) 23:45:46.45 ID:DQIBf9Tj0.net
一番最強なのは
全く同じ構成でホットスタンバイ
で、メインのケーブル手動で抜き差し
バカにはできんよ
一瞬で回復する

984 :名無しさん@1周年:2016/04/01(金) 23:45:48.51 ID:TiZOMucx0.net
>>981
お前「後知恵バイアス」の意味勘違いしてるぞw

後知恵バイアスっていうのはこの場合は、最初に分かっていなかったはずの
スイッチの障害を知ってることを前提にして、ああしていればよかったと言うことだ。
客のクレームとは全く関係ない話だ。

障害内容と異常検知情報から、誰もがデータベースサーバーの故障だと考えていたのだろう。
故障ならばすぐに現場に言った所ですぐに修理できるわけじゃない。

故障時の仕様通り、1台停止して3台で運用状態になったのだから
システムは想定通りの動作をしたと思っても仕方ない。

985 :名無しさん@1周年:2016/04/01(金) 23:48:19.18 ID:TiZOMucx0.net
>>982
> 故障対応だって、保守屋に24時間契約するんだよ

故障箇所も分かってない状態で、保守屋がわずか数時間で
ハードウェアの故障を直せるとでも?

いいか? 数時間程度じゃ直せないから、本来は2台で十分のところ
あらかじめ4台用意しているんだよ。
>>983が言っているホットスタンバイとはこれのことだ。

986 :名無しさん@1周年:2016/04/01(金) 23:48:30.05 ID:uvlnrpt00.net
>>983
一瞬で障害発生に気が付けばの話だけどね。

987 :名無しさん@1周年:2016/04/01(金) 23:51:32.34 ID:tJ4qH8Dw0.net
>>983
このクラスのシステムになると
ほんの少しでも通信してるケーブルを抜くと
演算処理でエラーでまくり復旧未定とかになりかねんぞ

988 :名無しさん@1周年:2016/04/01(金) 23:52:11.63 ID:w3E56Xyx0.net
故障したスイッチが経路をつかんだまま放さないw

989 :名無しさん@1周年:2016/04/01(金) 23:52:19.92 ID:uvlnrpt00.net
>>984
あ、言葉足らずだったかもしれないけど、マスコミの「スイッチ障害」を知ったANAの
お客さんが、なんでそんなアリガチな障害に対応できるようなモノづくりをしてなかっ
たんだ!アリガチな障害だからいかようにでもできたはずだろ!と怒り狂う状態を
想像していた。

990 :名無しさん@1周年:2016/04/01(金) 23:53:09.27 ID:uaeCFLh60.net
>>984
だからさあ、何で誰もがdbサーバの故障だと思っていたとか適当なこと言うんだよ

Oracleが上がんねえ時に同期エラーがでてたんだったら、疎通確認するだろが

dbサーバの故障だと思ってるんなら、エラーメッセージも見てねえって事じゃねえか

991 :大島栄城 ◆n3rBZgRz6w :2016/04/01(金) 23:54:13.59 ID:+mE2rLFL0.net
いまも作業して、株価が変動してるけど、作業経過ではRACのバグだった可能性もたかい

992 :名無しさん@1周年:2016/04/01(金) 23:54:17.35 ID:w3E56Xyx0.net
>>987
コミットできなければロールバックするでしょ…

993 :名無しさん@1周年:2016/04/01(金) 23:55:36.17 ID:uaeCFLh60.net
>>985
ちげえよ、発生した時点で調査初動を開始しなくていいってことがオカシイっていってんの。

994 :名無しさん@1周年:2016/04/01(金) 23:56:13.04 ID:TiZOMucx0.net
>>990
> Oracleが上がんねえ時に同期エラーがでてたんだったら、疎通確認するだろが

だから落ちたデータベースを再起動して、もう一台が落ちる状況になったから
同期エラーだと推測して、そこから調査してスイッチの故障だって原因が判明したんだろうが?

時系列が逆だぞ。

いきなりスイッチの故障だってわかったわけじゃない。
最初のわかったのはデータベースがダウンしたって事実だ。

995 :名無しさん@1周年:2016/04/01(金) 23:57:44.08 ID:DQIBf9Tj0.net
>>987
そうでも無い
俺の知っている超有名通販サイトはこの運営
ツーか提案したの俺
これでなんども修羅場を乗り越えてる
エラーが出た演算処理に関しては、もう顧客に謝るだけwwww
ただし、オラクルとLINUX系DB限定
MSSQLはそもそも俺は担当じゃ無いし
ウケケケケケ

996 :名無しさん@1周年:2016/04/01(金) 23:58:01.14 ID:uvlnrpt00.net
>>990
あんたの言いたいことは理解するけど、
>Oracleが上がんねえ時に同期エラーがでてたんだったら、疎通確認するだろが
というとこに飛躍はホントにないかな?
DBを起動したとき、同期エラーが出たらすぐにネットワーク疑うかな?
こればっかりは人によって違うかもしれないけど、おれがOracle担当のオペレータなら、
Oracleの正常性を確認してからエスカレして判断を仰ぐだろうな。
即座にNW障害を疑うことができないとは言わない。でも難しいんじゃないかなぁ。
俺がいけてないだけかもね。

997 :名無しさん@1周年:2016/04/01(金) 23:59:55.66 ID:TiZOMucx0.net
>>993
> ちげえよ、発生した時点で調査初動を開始しなくていいってことがオカシイっていってんの。

したんじゃねーの?

データベースサーバーが落ちました。落ちましたね。
同期は? そりゃデータベースサーバーが落ちたんだからエラー出るでしょ?
データベースサーバーの故障かな。可能性高いですね。
現在の状況は? 自動的に3台で正常に運用しています。
他に異常は?特にアラート出ていません。
ネットワーク関連は? 異常通知ありません。
じゃあ明日朝から、故障したサーバーの修理だね。

こんなところだろ。

998 :名無しさん@1周年:2016/04/02(土) 00:00:47.69 ID:3hWOeE6Y0.net
DBが悪いのか、SWが悪いのかなんてどうでもいいんだよ
復旧すりゃそれでいいんだよ
抜き差し最強
reboot最強
ロールバック最強

999 :名無しさん@1周年:2016/04/02(土) 00:01:10.79 ID:9qdtskdb0.net
>>987
はあ?

1000 :名無しさん@1周年:2016/04/02(土) 00:01:49.45 ID:T37nitOA0.net
>>998
>復旧すりゃそれでいいん
比較的同意

1001 :名無しさん@1周年:2016/04/02(土) 00:02:09.36 ID:jzq603ha0.net
>>998
あんたは神だよ。
抜き差しならない男だよ。
おやすみなさい。

1002 :名無しさん@1周年:2016/04/02(土) 00:02:47.90 ID:L7lq7XTu0.net
>>996
いやその通りだと思うよ
ネットワークは幾つかの想定原因のひとつだよね。

発生した直後からseつかまえて調査して、時間がかかったのなら仕方がない。
朝までほっといて、そこから調査でokとしたんなら、運用設計が杜撰って言ってるだけ

1003 :名無しさん@1周年:2016/04/02(土) 00:03:03.35 ID:VlrXkvI70.net
「後知恵バイアス」という言葉を知った。

無意味なスレじゃなかったなw

1004 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

総レス数 1004
252 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★