ABCIについて

運転状況 (FY18-FY23)

本ページは、2024年3月31日までのABCIの運転状況をアーカイブしたものです。現在の運転状況は以下でご確認ください。

過去の停止状況

開始日時 終了日時 過去の停止状況
2024/03/30 (土) 17:00 04/12 (金) 15:00 年度更新メンテナンスのため全ABCIサービス停止。
詳細は「システム更新履歴2024-04-12」をご覧ください。
2024/03/18 (月) 13:00 16:00 メンテナンスのため利用者ポータル停止。その他のサービスは利用可能。
2024/03/12 (火) 10:00 13:00 この時間帯に計画されていた利用者ポータルのメンテナンスは中止となりましたのでサービスは利用可能です。
次の利用者ポータルのメンテナンス予定が決まり次第、このページでお知らせします。
2024/01/31 (水) 10:00 02/14 (水) 13:00 ABCIグランドチャレンジ2023#4の実施に伴い、グランドチャレンジ参加者が計算ノード(V)136台を利用するため、参加者以外は計算ノード(V)の利用可能台数が少なくなります。
2024/02/09(金) 13:30 14:38 バッチジョブの実行が開始しない現象が発生していました。
2023/12/14(木) 10:00 2024/02/09(金) 22:30 第2回 大規模言語モデル構築支援プログラム」グループ#2 の実施予定に伴い、参加者以外は計算ノード(A)の利用を制限します。他のノードは利用可。
2024/01/09 (火) 10:00 11:20 計算ノード(V)利用促進プログラム」終了のため、この期間、計算ノード(V)のバッチジョブ(SPOT)の実行ができませんが、バッチジョブの投入は可能です。
2023/12/10 (日) 09:00 2024/01/09 (火) 11:20 計算ノード(V)利用促進プログラム」終了のため、2024/01/09 10:00以降の計算ノード(V)の予約 (Reserved) 受付を中止します。予約受付の再開は、1/9 (火) 12:00の予定です。他のABCI機能はサービス提供中
2023/12/14 (木) 13:35 18:36 ネットワーク通信遅延が発生していました。
2023/12/12 (火) 18:20 12/13 (水) 16:00 ファイルシステム/homeで遅延が発生していました。
2023/12/08 (金) 13:00 12/12 (火) 17:00 停電・断水・水冷設備のメンテナンスのため、全ABCIサービス停止。
この間にシステムが更新されました。詳細は「システム更新履歴」をご覧ください。
2023/12/06 (水) 10:00 12/08 (金) 13:00 ABCIグランドチャレンジ2023#3の実施に伴い、グランドチャレンジ参加者が計算ノード(V)512台を利用するため、参加者以外は計算ノード(V)の利用可能台数が少なくなります。他のノードは利用可。
2023/10/05 (木) 10:00 12/04 (月) 12:00 第2回 大規模言語モデル構築支援プログラム」グループ#1 の実施に伴い、参加者以外は計算ノード(A)の利用を制限します。他のノードは利用可。
2023/11/14 (火) 10:00 11:00 ABCIのバッチジョブの qsub/qdel コマンドに新オプションが追加されます。
• 利用者に影響はありません。
• 新オプションの機能:
 ⇒ 新オプション を指定してqsubによりジョブを投入すると、同ABCIグループの他メンバは、そのジョブをqdelにより削除可能となる。
 ⇒ 新オプション を指定してqsubによりジョブを投入すると、同ABCIグループの他メンバは、そのジョブに割り当てられた計算ノードへssh可能になる。
• 新オプションの詳細は「ユーザーガイド」の「システム更新履歴 2023-11-14」をご覧ください。
2023/10/27 (金) 15:00 - メモリインテンシブノード上で提供している計算資源タイプ(rt_M.large, rt_M.small) は、サービス提供を終了の予定です。
詳細は 「ABCIサービス料金表 (2023年度)(※1)(※2)」 を参照ください。
2023/10/25 (水) 21:05 10/26(木)16:40 予定外の停電が発生したため、ABCIは全サービスを停止。
2023/10/18 (水) 10:00 10/19 (木) 12:00 ABCIグランドチャレンジ2023#2の実施に伴い、グランドチャレンジ参加者が計算ノード(V)512台を利用するため、参加者以外は計算ノード(V)の利用可能台数が少なくなります。他のノードは利用可。
2023/10/07 (土) 00:00 03:00 通信回線工事のため、ABCIと外部との通信が停止。
・この期間に、1時間程度の通信断が1回発生。
・下記にアクセス不可となります。
 ・ABCIインタラクティブノード・クラウドストレージ・利用者ポータル
・ABCI内通信のみ実施しているバッチジョブには影響ありません。
・外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブは、影響を受けます。
2023/10/02 (月) 10:00 12:00 計算ノード(V)利用促進プログラム」のため、この期間、計算ノード(V)のバッチジョブ(SPOT)の実行ができませんが、バッチジョブの投入は可能です。
2023/09/01 (金) 09:00 10/02 (月) 12:00 計算ノード(V)利用促進プログラム」のため、10/02 10:00以降の計算ノード(V)の予約 (Reserved) 受付を中止しています。予約受付の再開は、10/2 (月) 12:00の予定です。
2023/08/01 (火) 09/30 (土) 第1回 大規模言語モデル構築支援プログラム」の実施に伴い、参加者以外は計算ノード(A)の利用を制限します。また、計算ノード(A) のシステムあたりの最大同時予約可能ノード数を50から30に縮小いたします。他のノードは利用可。
2023/09/05 (火) 00:00 02:00 ABCIの外部通信に関わるネットワークメンテナンス
※この期間内で瞬断が複数回発生する場合がございます。
2023/08/23 (水) 00:00 02:00 ネットワーク機器の緊急メンテナンス
※この期間内で瞬断が複数回発生する場合がございます。
2023/06/26 (月) 03:30 06:00 通信回線工事のため、ABCIと外部との通信が停止。
・この期間に、15分程度の通信断が2回発生。
・下記にアクセス不可となります。
 ・ABCIインタラクティブノード・クラウドストレージ・利用者ポータル
・ABCI内通信のみ実施しているバッチジョブには影響ありません。
・外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブは、影響を受けます。
2023/06/12 (月) 17:00 19:32 Singularity End Point に障害発生。
2023/06/12 (月) 17:00 19:10 特定グループ領域のストレージ (/projects) に障害発生。
2023/06/09 (金) 13:00 06/12 (月) 17:00 水冷設備のメンテナンスのため、全ABCIサービス停止。
今回のメンテナンスで、「システム更新2023-06-12」が行われるため、メンテナンス明けに同じジョブを再投入しても今までと挙動が異なる可能性があります。
2023/05/16 (火) 10:00 05/30 (火) 13:00 ABCIグランドチャレンジ2023#1の実施に伴い、グランドチャレンジ参加者が計算ノード(V)136台を利用するため、参加者以外は計算ノード(V)の利用可能台数が少なくなります。
2023/05/16 (火) 08:30 09:45 ABCI利用者ポータルにログインできない障害が発生していました。
2023/04/07 (金) 17:00 17:52 ABCI利用者ポータルの障害により、特定類型該当性の申告ができないという障害が発生していました。
2023/04/07 (金) 17:00 - 4/1~4/7のメンテナンスにより、インタラクティブノード(V)、計算ノード(V)の OS が変更されます。
    変更前:CentOS 7
    変更後:Rocky Linux 8
・OSの変更に伴い、プログラムの再コンパイルやPython仮想環境の再構築が必要になります。
2023/04/01 (土) 0:00 04/07 (金) 17:00 年度更新メンテナンスのため全ABCIサービス停止。
・ABCI利用者ポータルも停止します。
qa@abci.ai の質問対応は通常より遅くなりますので、ご了承ください。
・実行中のジョブは強制的に停止されます。
・ABCIグループ領域のinode個数に上限値、2億個が設定されます。inode使用個数2億個超過のABCIグループ利用責任者・管理者は、3/17 17:00までに下記の手順に従って増量申請してください。
https://abci.ai/ja/how_to_use/quota.html
・今回のメンテナンスで、「システム更新 2023-04-07」が行われるため、メンテナンス明けに同じジョブを再投入しても今までと挙動が異なる可能性があります。
2023/03/15 (水) 10:00 15:00 ABCI利用者ポータルはメンテナンスのため利用できません。
2023/02/06 (月) 14:00 16:00 Intel oneAPI の脆弱性対応のため、脆弱性のあるライブラリを格納しているディレクトリの実行権限削除しました。
詳細は「システム更新履歴(2023-02-03)」および「既知の問題」を参照してください。
この更新はシステムの停止を伴いません。
2023/01/31 (火) 18:00 02/03 (金) 11:00 Intel oneAPI の脆弱性が下記のとおり公開されました。
https://www.intel.com/content/www/us/en/security-center/advisory/intel-sa-00773.html
脆弱性があるため、コマンドicpx, icpcは、2023/01/31 18:00 に利用不可に設定されました。
脆弱性対応された新しいコマンドicpx, icpcおよびモジュールは、2023/02/03 11:00 に利用可能に設定されました。
詳細は「システム更新履歴(2023-02-03)」を参照してください。
その後、02/06に脆弱性を含むintel/2022.0.2以前のIntel oneAPIモジュールは公開を停止しました。脆弱性が修正されたintel/2022.2.1モジュールをご利用ください。詳細は「既知の問題」の「2023/01/31」を参照してください。
この更新はシステムの停止を伴いません。
2023/01/27 (金) 00:00 03:00 通信回線工事が予定されていますが、今回の工事はABCIのご利用には影響はありません。
2023/01/25 (水) 19:00 23:00 通信回線工事のため、ABCIと外部との通信が停止。
・この期間に、10分程度の通信断が2回発生。
・下記にアクセス不可となります。
 ・ABCIインタラクティブノード・クラウドストレージ・利用者ポータル
・ABCI内通信のみ実施しているバッチジョブには影響ありません。
・外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブは、影響を受けます。
2023/01/05 (木) 10:00 11:00 ABCI メンテナンス (上記問題への対策) のため Singularity PRO 利用不可。メンテナンス中に Singularity を利用すると予期せぬエラーが発生する可能性があります。詳細は「既知の問題」をご参照ください。その他のサービスは利用可。
2022/12/13 (火) 17:00 2023/01/05 (木) 11:00 Singularity End Point の pull および Remote Build の機能に障害が発生中。詳細は「既知の問題」をご参照ください。その他のサービスは、Singularity PROを含め利用可。
2022/12/27 (火) 11:00 12:00 ABCI利用者ポータルのメンテナンスのため、数分間ご利用いただけなくなります。
2022/12/14 (水) 23:00 12/19 (月) 22:35 ABCIとインターネット間のネットワークで障害発生中です。不定期に数秒~1分程度の通信切断が発生しています。
2022/12/19 (月) 18:00 22:35 ネットワーク設備の緊急メンテナンスのため、ABCIと外部との通信が停止します。この間に、20分程度の通信切断が数回、数分間の切断が複数回発生します。
影響:
· インタラクティブノード、ABCI利用者ポータルへの接続ができなくなります。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについては影響を受けます。
2022/12/19 (月) 11:00 12:00 ネットワーク設備の緊急メンテナンスのため、ABCIと外部との通信が停止します。この間に、1分程度の通信切断が複数回発生します。
影響:
· インタラクティブノード、ABCI利用者ポータルへの接続ができなくなります。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについては影響を受けます。
2022/12/16 (金) 19:00 24:00 ネットワーク設備の緊急メンテナンスのため、ABCIと外部との通信が停止します。この間に、数分~10分程度の通信切断が複数回発生します。
影響:
· インタラクティブノード、ABCI利用者ポータルへの接続ができなくなります。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについては影響を受けます。
2022/12/16 (金) 15:50 16:40 ネットワーク設備の緊急メンテナンスのため、ABCIと外部との通信が停止します。この間に、5分程度の通信切断が2回、10分程度の通信切断が1回、数分間の切断が複数回発生します。
影響:
· インタラクティブノード、ABCI利用者ポータルへの接続ができなくなります。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについては影響を受けます。
2022/12/15 (木) 18:00 23:00 ネットワーク設備の緊急メンテナンスのため、ABCIと外部との通信が停止します。この間に、5分程度の通信切断が数回、数分間の切断が複数回発生します。
影響:
· インタラクティブノード、ABCI利用者ポータルへの接続ができなくなります。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについては影響を受けます。
2022/12/14 (水) 19:30 23:00 通信回線工事のため、ABCIと外部との通信が停止します。
· 19:30~21:30 この期間に、インタラクティブノード、ABCI利用者ポータルへの接続が1.5時間程度停止します。
· 21:30~23:00 この期間に、30秒程度の通信断が複数回発生します。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについてはご注意ください。
2022/12/09 (金) 13:00 12/13 (火) 17:00 水冷設備のメンテナンスのため、全ABCIサービス停止。
2022/12/07 (水) 10:00 12/09 (金) 13:00 ABCIグランドチャレンジ2022#3の実施に伴い、参加者以外は計算ノード(A)は利用不可。他のノードは利用可。
2022/10/20 (木) 11:00 10/21 (金) 13:00 ABCIグランドチャレンジ2022#2の実施に伴い、参加者以外は計算ノード(A)は利用不可。他のノードは利用可。
2022/10/19 (水) 10:00 10/20 (木) 12:00 ABCIグランドチャレンジ2022#2の実施に伴い、参加者以外は計算ノード(V)は利用不可。他のノードは利用可。
2022/10/03 (月) 17:30 18:00 ABCI利用者ポータルがこの時間帯の間に10秒程停止します。
2022/07/15 (金) 19:00 10/03 (月) 17:00 経済産業省 資源エネルギー庁からの 「7/1~9/30 節電要請」に基づき、計算ノード(V) を272ノード停止して退縮運転中です。退縮運転は 10/03 に終了し、順次全ノード (1088台、障害ノードを除く) 運転を再開していく予定です。Spotサービスにおけるrt_Fの同時利用可能ノード数の最大は512(利用の手引きに記載の値)です。
計算ノード(A)は全120ノード (障害ノードを除く) 既に稼働中です。
複数ノードジョブ投入の際は、待ち時間の短縮のため、USE_EXTRA_NETWORK (異なるラックのノード割当を許容) のオプションをご検討ください。
2022/08/25 (木) 10:00 16:45 ABCI緊急メンテナンスのため、一部のサービスが停止。
• /groups, /bb へアクセス不可。/home, /projects, /scratch, ABCIクラウドストレージはアクセス可。
• 全ての計算ノードは利用不可。ジョブの実行不可。メンテナンス開始時に実行中のジョブは全て管理者により削除されるため再投入・再実行をお願いします。予約の作成とジョブの投入は可ですが、メンテナンス中に不可の時間帯が発生する可能性があります。
• ABCI利用者ポータルにアクセスできません。
• インタラクティブノード利用可(/groups, /bb は利用不可)。メンテナンス開始時(10:00~11:00頃)に再起動 (利用不可) の可能性があります。
2022/08/18 (木) 9:40 11:30 /groups以下のファイルの一部(OSS06配下のファイル)へのアクセス不可障害が発生。現在は復旧済み。
この時間帯のジョブに影響があった場合、qa@abci.ai へご連絡ください。ポイント返却いたします。
2022/08/14 (日) 23:00 08/18 (木) 11:30 インタラクティブノード(A) の一部に障害発生中。es-a2 の運用を停止して調査中。es-a1 およびインタラクティブノード(V) は正常に稼働しています。
2022/08/13 (土) 0:00 1:30 通信設備の緊急メンテナンスのため、ABCIと外部との通信が停止します。
· インタラクティブノード、ABCI利用者ポータルへの接続が遮断されます。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについてはご注意ください。
2022/08/04 (木) 0:00 1:00 通信設備の緊急メンテナンスのため、ABCIと外部との通信が停止します。
· インタラクティブノード、ABCI利用者ポータルへの接続が遮断されます。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについてはご注意ください。
2022/07/21 (木) 17:00 18:15 ABCIに障害発生。影響範囲は以下の通り:
• 計算ノード(V) 81台
• 計算ノード(A) 1台
• 何台かの仮想環境
現在復旧作業中。原因は調査中。
2022/07/20 (水) 16:10 17:00 ABCIに障害発生
• 新規ジョブが開始できない。
• 実行中のジョブの終了時に課金まわりの処理に失敗し、エラー発生。
• show_quotaにエラー発生。
現在は、上記現象は発生しない状況となっています。原因調査中。
2022/07/08 (金) 16:30 07/15 (金) 19:00 経済産業省 資源エネルギー庁からの 「7/1~9/30 節電要請」に基づき、計算ノード(V) を544ノード停止して退縮運転中です。停止ノード数は前回の689から544に変更になりました。
計算ノード(A)は全120ノード稼働予定で、前回109ノード起動で11ノード停止していましたが、2ノード起動、全体で111ノード起動しました。残りの9ノードについて順次電源投入中です。
計算ノード(V) 利用可能台数が408に変更されたため、Spotサービスにおけるrt_Fの同時利用可能ノード数の最大を263から408に変更しました。
稼働ノード数の減少により、複数ノードジョブの待ち時間が長くなっています。待ち時間の短縮のため、USE_EXTRA_NETWORK (異なるラックのノード割当を許容) のオプションをご検討ください。
2022/07/07 (木) 16:30 07/08 (金) 16:30 経済産業省 資源エネルギー庁からの 「7/1~9/30 節電要請」に基づき、計算ノード(V) を689ノード停止して退縮運転中です。停止ノード数は前回の700から689に変更になりました。
計算ノード(A)は全120ノード稼働予定で、前回停止していた54ノードのうち43ノード起動し、全体で109ノード起動しました。残りの11ノードについて順次電源投入中です。
計算ノード(V) 利用可能台数が263に変更されたため、Spotサービスにおけるrt_Fの同時利用可能ノード数の最大を252から263に変更しました。
2022/06/30 (木) 16:30 07/07 (木) 16:30 経済産業省からの「節電要請」に基づき、計算ノード(V) を700ノード、計算ノード(A) を54ノード、それぞれ停止して退縮運転中です。
計算ノード(V) 利用可能台数が252に減ったため、Spotサービスにおけるrt_Fの同時利用可能ノード数の最大を512から252に変更しました。
2022/06/29 (水) 16:30 06/30 (木) 16:30 経済産業省からの「節電要請」に基づき、計算ノード(V) を577ノード、計算ノード(A) を43ノード、それぞれ停止して退縮運転中です。
計算ノード(V) 利用可能台数が375に減ったため、Spotサービスにおけるrt_Fの同時利用可能ノード数の最大を512から375に変更しました。
2022/06/27 (月) 14:00 06/29 (水) 16:30 経済産業省からの「節電要請」に基づき、計算ノード(V) を476ノード停止して退縮運転中です。
2022/06/15 (水) 13:30 06/21 (火) 13:00 水冷設備および ABCIメンテナンスのため、全ABCIサービス停止。ABCI利用者ポータルも利用できません。

 ・qa@abci.ai の質問対応は通常より遅くなりますので、ご了承ください。
 ・実行中のジョブは強制的に停止されます。
 ・予約および待ち状態のジョブは引き継がれません。ジョブの再投入・予約の再作成をメンテナンス後に実施お願いします。
 ・今回の修正で解消される「既知の問題」があります。
 ・今回のメンテナンスで「ソフトウェアの更新」が行われるため、メンテナンス明けに同じジョブを再投入しても今までと挙動が異なる可能性があります。
2022/06/11 (土) 21:00 06/13 (月) 09:48 計算ノード(A)(V)に下記の障害が発生しました。
 ・バッチジョブ新規実行不可
 ・すべての予約が消滅
既知の問題についてはこちらを参照ください 。
2022/06/06 (月) 13:30 14:39 ホーム領域で障害発生。
2022/05/24 (火) 13:00 14:20 ホーム領域で障害発生。
2022/05/18 (水) 11:00 05/19 (木) 11:00 ABCIグランドチャレンジ2022#1の実施に伴い、参加者以外は計算ノード(A)は利用不可。他のノードは利用可。
2022/05/19 (木) 12:00 05/20 (金) 12:00 ABCIグランドチャレンジ2022#1の実施に伴い、参加者以外は計算ノード(V)は利用不可。他のノードは利用可。
2022/05/12 (木) 17:40 18:57 ホーム領域で障害発生。
2022/05/12 (木) 10:15 11:05 ホーム領域で障害発生。
2022/05/11 (水) 15:06 17:08 ホーム領域で障害発生。
2022/05/10 (火) 19:00 05/11 (水) 0:05 ホーム領域で障害発生。
2022/05/09 (月) 18:50 23:45 ホーム領域で障害発生。
2022/04/21 (木) 11:00 04/22 (金) 10:00 ABCI利用者ポータルのメンテナンス実施中。
2022/04/06 (水) 17:00 04/11 (月) 14:35 Singularity エンドポイントのリモートビルド機能に障害発生中。
代替手段を「ユーザーガイド」に掲載しました。
2022/04/06 (水) 17:00 04/09 (土) 21:30 ABCI Cloud Storage で一部の利用者に障害発生中。一部の利用者がアクセスできない状況です。
Note: 復旧方法について利用者へメールでお知らせしました。
2022/04/06 (水) 17:00 04/07 (木) 13:30 ABCI利用者ポータルで障害発生中。申請は可能ですが、承認処理に遅延が発生中。
2022/04/01 (金) 0:00 04/06 (水) 17:00 年度更新メンテナンスのため全ABCIサービス停止。
- ABCI利用者ポータルも停止します。
- qa@abci.ai の質問対応は通常より遅くなりますので、ご了承ください。
- 実行中のジョブは強制的に停止されます。
- 今回のメンテナンスで「ソフトウェアの更新」が行われるため、メンテナンス明けに同じジョブを再投入しても今までと挙動が異なる可能性があります。
2022/03/30 (水) 17:00 03/31 (木) 17:00 計算ノード(V) 520ノードがメンテナンスのため利用不可。他の計算ノード(V)および(A)は利用可能。
2022/03/19 (土) 10:00 18:30 通信回線工事のため、ABCIと外部との通信が複数回停止。通信断の影響は下記のとおり。
· インタラクティブノード、ABCI利用者ポータルへの接続が遮断されます。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについてはご注意ください。
2022/03/17 (木) 9:00 13:40 ABCI利用者ポータル停止 (その他のABCIサービスは利用可能)。
2022/03/16 (水) 0:00 6:00 通信回線工事のため、ABCIと外部との通信が複数回停止。通信断の影響は下記のとおり。
· インタラクティブノード、ABCI利用者ポータルへの接続が遮断されます。
· ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについてはご注意ください。
2022/03/01 (火) 8:30 03/03 (木) 17:00 水冷設備のメンテナンスおよびシステム更新のため、全ABCIサービス停止。
ABCI利用者ポータルも停止。qa@abci.ai の質問対応は通常より遅くなりますので、ご了承ください。
今回のメンテナンスで更新される機能は、[
システム更新予定」を参照。    
2022/01/11 (火) 0:00 1:00 通信回線工事のため、ABCIと外部との通信が停止。
インタラクティブノード、ABCI利用者ポータルへログインできません。
ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部(ライセンスサーバー、ABCIクラウドストレージ等)との通信を実施しているバッチジョブについてはご注意ください。
2021/12/27 (月) 20:10 12/30 (木) 11:39 ストレージの /projects 領域で障害発生中。
12/28 14:00から umount 実施、復旧には数日かかる見込み。
2021/12/10 (金) 13:00 12/15 (水) 17:00 停電・断水・水冷設備のメンテナンスのため、全ABCIサービス停止。
今回のメンテナンスで更新された機能は「システム更新履歴」を参照。
2021/12/08 (水) 10:00 12/10 (金) 13:00 ABCIグランドチャレンジ2021#1の実施に伴い、参加者以外は計算ノード(A)は利用不可。他のノードは利用可。
2021/09/14 (火) 11:00 09/22 (水) 11:00 ABCIグランドチャレンジ2021#2の実施に伴い、参加者以外は計算ノード(V)が440ノードに制限される。計算ノード(A)とメモリインテンシブノードは利用可。
2021/08/11 (水) 10:00 08/12 (木) 15:00 メンテナンスのため、全ABCIサービス停止。この間メールサーバーも停止するため qa@abci.ai へのお問い合わせも休止。
以後 /groups1/ と /fs3/ は読み取り専用に設定。
2021/07/06 (火) 17:00 07/19 (月) 11:00 SingularityPRO でリモートビルド不可の障害発生。
2021/07/02 (金) 13:00 07/06 (火) 17:00 水冷設備のメンテナンスのため、全ABCIサービス停止。
2021/06/17 (木) 13:00 06/18 (金) 13:00 ABCIグランドチャレンジ2021#1の実施に伴い、参加者以外は計算ノード(A)は利用不可。他のノードは利用可。
2021/06/16 (水) 12:00 06/17 (木) 12:00 ABCIグランドチャレンジ2021#1の実施に伴い、参加者以外は計算ノード(V)が440ノードに制限される。計算ノード(A)とメモリインテンシブノードは利用可。
2021/05/08 (土) 0:00 1:30 SINET5メンテナンスのため、ABCIと外部(SINET5)との通信が停止します。インタラクティブノード、ABCI利用者ポータル、qa@abci.ai の問い合わせが利用できません。
ABCI内通信のみ実施しているバッチジョブには影響ありませんが、外部との通信を実施しているバッチジョブについてはご注意ください。
2021/04/01 (木) 0:00 04/07 (水) 10:00 メンテナンスのため全ABCIサービス停止。
ABCI利用者ポータル、qa@abci.aiの質問対応も停止。
2021年3月末にSingularity 2.6のサービス提供を終了します。
メンテナンスまでに、SingularityPRO 3.5へ移行ください。
2021/03/12 (金) 8:00 03/13 (土) 15:00 メンテナンスのため全ABCIサービス停止。
ABCI利用者ポータル、qa@abci.aiの質問対応も停止。
ABCIインタラクティブノードesの台数を4台から2台に変更。es3とes4はサービス提供を終了、メンテナンス後は利用できません。
2021/03/05 (金) 8:00 03/08 (月) 9:00 メンテナンスのため計算ノード部分停止 (利用可能な計算ノードは374台程度)。
その他のサービスは利用可能。
2021/03/03 (水) 14:30 17:15 内部DNSサーバーが応答していませんでした。
2021/02/26 (金) 8:00 03/01 (月) 9:00 メンテナンスのため計算ノード部分停止 (利用可能な計算ノードは544台程度)。
その他のサービスは利用可能。
2021/01/27 (水) 15:10 16:20 ジョブ実行サービスが利用できませんでした。
2021/01/05 (火) 10:30 16:30 ジョブ実行サービスが利用できませんでした。
2020/12/11 (金) 13:00 12/15 (火) 17:00 停電・断水・メンテナンスに伴い、全ABCIサービス停止。
2020/12/10 (木) 12:30 12/11 (金) 13:00 ABCIグランドチャレンジ2020#3の実施に伴い、参加者以外は計算ノードおよびメモリインテンシブノード利用不可、その他のサービスは利用可能。
グランドチャレンジ実施中はストレージへの頻繁なアクセスはご遠慮ください。
2020/11/30 (月) 3:00 4:00 ネットワークメンテナンスのため、最大60分ABCIとインターネット間が通信不可。利用者ポータル利用不可、外部からインタラクティブノードへのアクセス不可。
ABCI内部のネットワーク通信利用は可能のため、ABCIバッチジョブは継続利用可能。
2020/11/25 (水) 20:15 23:40 GPFS 領域(fs1, bb) と UGE復旧のための緊急メンテナンスによりABCI全体停止。
2020/11/25 (水) 10:45 20:15 GPFS 領域(fs1, bb) と UGE へのアクセス障害が発生。
2020/11/25 (水) 10:45 11:25 インタラクティブノードにログインできませんでした。
2020/10/9 (金) 9:00 14:30 SingularityPRO 3.5-4アップデート。
SingularityPROのみ利用不可。その他のサービスは通常通り利用可能。
2020/9/08 (火) 12:35 21:49 GPFS 領域へのアクセス障害が発生( fs1, fs2, fs3, bb )。
2020/8/28 (金) 13:00 21:30 メンテナンスの為、全ABCIサービス停止。
2020/8/26 (水) 12:00 8/28 (金) 12:00 ABCIグランドチャレンジ2020#2 の実施に伴い、参加者以外は計算ノード(メモリリッチな計算資源を含む)利用不可。他のサービスは利用可能。
2020/8/25 (火) 12:00 8/26 (水) 12:00 ABCIグランドチャレンジ2020#2 の実施に伴い、計算サーバ522台が利用不可。混雑状況によりジョブ実行開始が遅れることがあります。
2020/6/2 (火) 0:00 14:00 内部DNSの障害のため ABCI内部からABCIクラウドストレージへ接続できません。
2020/6/1 (月) 13:00 21:30 OpenSSLの問題により aws-cli/1.16.194 および aws-cli/1.18 によるクラウドストレージの利用ができません。aws-cli/2.0 では利用可能です。
2020/5/29 (金) 13:00 6/1 (月) 13:00 ABCI水冷設備メンテナンスに伴いABCI全体停止
2020/5/28 (木) 12:00 5/29 (金) 13:00 ABCIグランドチャレンジ2020#1 の実施に伴い、計算サーバ522台が利用不可。混雑状況によりジョブ実行開始が遅れることがあります。
2020/5/28 (木) 6/1 (月) 10:50 ABCI利用者ポータルでユーザー登録システムに障害発生。ユーザー/グループや公開鍵の登録に支障が出ていました。
2020/5/2 (土) 16:20 5/3 (日) 19:53 障害により、計算ノードでジョブ実行不可。
2020/4/1 (水) 09:00 4/3 (金) 20:00 メンテナンスのためABCI全サービス停止(利用者ポータルも、qa@abci.aiの運用サポート窓口も利用不可)。
2020/4/1 (水) 00:00 4/3 (金) 20:00 メンテナンスのため、計算ノード停止(ジョブは実行されません)。利用者ポータル停止。
2020/3/10 (火) 15:50 18:42 ストレージ障害のため、/homeアクセス不可。
2020/2/29 (土) 09:00 20:00 ネットワークメンテナンス(ABCIとインターネット間の瞬断が発生)。
2020/2/28 (金) 10:00 14:00 メンテナンスのため、ABCI利用者ポータル停止。 他のサービスは利用可能。
2020/2/21 (金) 20:50 22:03 ストレージ障害のため、一時的にログイン不可、一部のジョブが異常終了。
2020/2/13(木) 13:55 2/17(月) 15:30 水冷設備の障害のため、計算ノード34台(g0851-g0884)停止。
2020/1/22 (水) 13:00 18:00 ABCIクラウドストレージ・ABCI利用者ポータルがメンテナンスにより停止。ABCIインタラクティブノード・ホーム領域・グループ領域・計算ノードの利用・qa@abci.aiの質問対応等の、他のABCIサービスには影響ありません。
2019/12/24 (火) 13:03 14:06 障害のため、/homeアクセス不可。
2019/12/20 (金) 22:38 12/22 (月) 11:56 障害のため、/homeアクセス不可。
2019/12/19 (木) 12:59 14:44 障害のため、/homeアクセス不可。
2019/12/13 (金) 13:00 12/17 (火) 13:00 柏サイト停電に伴い、ABCIサービス利用停止。
2019/12/13 (金) 09:00 12/17 (火) 13:00 メンテナンスに伴い、ABCIクラウドストレージサービス利用停止。
2019/12/10(火) 11:00 12/13 (金) 13:00 ABCIグランドチャレンジ2019#3実施に伴い、ABCIグランドチャレンジ2019#3参加者以外のジョブは実行されません。インタラクティブノード、利用者ポータル及び qa@abci.aiメールサービスは利用可能です。
2019/12/6 (金) 12:30 18:30 ABCIグランドチャレンジ2019#3 の実施に伴い、計算サーバ266台が利用不可。混雑状況によりジョブ実行開始が遅れることがあります。
2019/12/03 (火) 00:00 12/4 (水) 12:30 ABCIグランドチャレンジ2019#3 の実施に伴い、計算サーバ522台が利用不可。混雑状況によりジョブ実行開始が遅れることがあります。
2019/11/19 (火) 00:08 00:09 ネットワーク機器緊急保守のため、ABCIのインターネット接続が停止。
2019/11/17 (日) 20:39 20:43 ABCIのインターネット接続が機器故障により停止。
2019/11/17 (日) 04:03 04:06 ABCIのインターネット接続が機器故障により停止。
2019/11/12 (火) 10:47 13:40 es3 にてメモリ枯渇により障害発生。
2019/11/1 (金) 9:00 12:00 メンテナンスのため利用者ポータル利用停止。
2019/10/9 (水) 12:00 10/10 (木) 12:30 ABCIグランドチャレンジ2019#2 の実施に伴い、計算サーバ522台が利用不可。混雑状況により、ジョブの実行開始が遅れることがあります。
2019/10/3 12:30 10/4 17:00 ABCIのメンテナンスのためにABCI全ノード停止、利用者ポータル停止、qa@abci.aiメールサービス停止。未実行のジョブ及び予約はキャンセルされます。
2019/10/1 11:00 10/3 12:30 ABCIグランドチャレンジ2019#2実施に伴い、ABCIサービス利用停止。ABCIグランドチャレンジ2019#2参加者以外の方は、ABCIインタラクティブノードにログイン不可。注:利用者ポータルとqa@abci.aiメールサービスは利用可能。
2019/9/30 12:00 10/1 11:00 ABCIグランドチャレンジ2019#2 の実施に伴い、計算サーバ522台が利用不可。混雑状況により、一般ユーザのジョブ実行開始が遅れることがあります。
2019/9/25 18:00 9/25 18:40 DNSの問題のため、as.abci.ai などを含め abci.ai ドメインの名前解決ができなくなっていました。
2019/9/25 12:00 9/27 11:30 ABCIグランドチャレンジ2019#2 のリハーサル実施に伴い、計算サーバ522台が利用不可。混雑状況により、一般ユーザのジョブ実行開始が遅れることがあります。
2019/8/24 15:00 8/24 21:11 /fs1, /bbにアクセスできなくなっていました。
2019/8/15 04:38 8/15 11:08 /fs1 にアクセスできなくなっていました。復旧作業に伴い、9:30以降ジョブの投入が制限されていました。
2019/7/16 20:10 7/16 20:40 /fs3 にアクセスできなくなっていました。
2019/7/11 15:30 7/11 16:50 /groups2 にアクセスできなくなっていました。
2019/7/3 10:00 7/3 13:20 ABCI利用者ポータルへのログインURL通知メールが届かなくなっている事象について、原因を究明し解決しました。現在、ログインURL通知メールは発信されるようになっています。
ただし、設定が反映されるタイミングは受信側メールサーバにより異なります。メールが到着しない場合、時間をおいてから再度試行して下さい。明日(7/4)になっても解決しない場合は問い合わせをお願いします。
2019/6/27 12:30 6/28 21:00 水冷設備とABCIのメンテナンスのためにABCI全ノード停止、
利用者ポータル停止、qa@abci.aiメールサービス停止。
2019/6/24 11:00 6/27 12:30 ABCIグランドチャレンジ2019#1実施に伴い、ABCIサービス利用停止。
ABCIグランドチャレンジ2019#1参加者以外の方は、
ABCIインタラクティブノードにログイン不可。
注:利用者ポータルとqa@abci.aiメールサービスは利用可能。
2019/5/20 13:51 5/20 19:00 ABCIシステムのジョブサービス(SPOT, ON-DEMAND, RESERVED)
とABCI group領域とインタラクティブノード(es)に
障害発生、利用不可
2019/5/10 11:06 5/10 18:00 ABCIシステムのジョブサービス(SPOT, ON-DEMAND, RESERVED)
とABCI group領域に障害発生、利用不可
2019/4/3 13:00 4/5 14:00 メンテナンスのためにABCI全ノード停止、
qa@abci.aiメールサービス停止。
利用者ポータルは稼働。
2019/4/1 09:00 4/3 13:00 メンテナンスのためにABCI全ノード停止、
qa@abci.aiメールサービス停止、利用者ポータル停止。
2019/3/15 17:00 3/18 17:00 ABCI利用者ポータルはメンテナンスのためサービス停止。
2019/1/28 11:00 1/31 13:00 ABCIグランドチャレンジ#3実施に伴い、ABCIサービス利用停止。
ABCIグランドチャレンジ#3参加者以外の方は、
ABCIインタラクティブノードにログイン不可。
注:利用者ポータルとqa@abci.aiメールサービスは利用可能。
2019/1/18 12:00 1/18 13:00 AIST柏地区のネットワークメンテナンス。
ABCIとインターネット(SINET5)と通信について
最大10分程度の通信断が複数回発生。
インタラクティブノードと利用者ポータルのセッション切れ
qa@abci.aiメールサービスの一時的な停止等が発生。
2018/12/14 15:00 12/17 21:00 停電に伴うメンテナンスのためにABCI全ノード停止、
利用者ポータル停止、qa@abci.aiメールサービス停止
2018/11/29 18:00 11/30 11:00 ラック工事に伴いABCI計算ノード一部停止。
停止ノード:g0885-0918
2018/11/26 09:00 11/29 18:00 ラック工事に伴いABCI計算ノード一部停止。
停止ノード:g0545-1088
2018/11/19 09:00 11/26 09:30 ラック工事に伴いABCI計算ノード一部停止。
停止ノード:g0001-0544
2018/11/02 15:00 11/05 15:00 ラック工事に伴うメンテナンスのためにABCI全ノード停止、
利用者ポータル停止、qa@abci.aiメールサービス停止
2018/10/26 15:00 10/29 17:00 停電に伴うメンテナンスのためにABCI全ノード停止、
利用者ポータル停止、qa@abci.aiメールサービス停止
2018/10/23 09:00 10/26 10:00 ABCIグランドチャレンジ#2実施に伴い、ABCIサービス利用停止。
ABCIグランドチャレンジ#2参加者以外の方は、
ABCIインタラクティブノードにログイン不可。
注:利用者ポータルとqa@abci.aiメールサービスは利用可能。
2018/10/17 09:15 10/17 14:15 障害により利用者ポータル停止
2018/9/21 13:00 9/26 17:00 停電に伴うメンテナンスのためにABCI全ノード停止、
利用者ポータル停止、qa@abci.aiメールサービス停止
2018/7/27 14:00 8/1 10:00 メンテナンスのために利用者ポータル停止