絞り込み検索
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トレンドで探す
キーワードで探す
カテゴリで探す
サービスで探す
業種で探す
トレンドで探す
2021.8.10技術ブログ

運用のニューノーマル対応:人にやさしく、でも安全/効率的に

NTTデータではシステム運用現場において自動化による生産性向上/安定運用の取り組みを進め、働き方変革を目指している。その事例として、社内クラウド運用業務の監視/キャパシティ管理/申請業務を改善した取り組みについて紹介する。

目次

1. システム運用現場における課題は「負担感が大きいこと」

一般的なシステム運用現場では、トラブルを発生させない安定運用に向けて、日々、さまざまな業務を実施する必要があります。監視や定期的な運用報告・監査対応等の定期作業に加えて、その他の不定期作業も多々あり、恒常的に忙しくなりがちです。また、システムによっては24時間365日の運用が求められるため、不規則な勤務(深夜勤務/土日祝日勤務)も必要となる場合もあります。そして、もしトラブルが発生した場合、原因解析やバグ改修、それに伴う変更/リリース作業等の対応を急ぎで実施しなければなりません。これらの対応はあらかじめ計画された作業ではないため、割り込みでの緊急対応となり心身ともに負担が大きくなります。さらに時期によって仕事量のばらつきも多く、仕事量の平均値にあわせて運用者の人数を確保した場合、仕事量が多い時期の一時的な負担が大きくなります。(図1)
このように、負担感の大きい仕事が多くなると、新しい視点で物事を考え、新しい技術/仕組みを取り入れることを検討するためのまとまった時間も確保できなくなります。結果として安定運用に向けた改善活動があまり進まなくなり、モチベーションが上がらない状況に陥ってしまいます。

図1:システム運用現場における課題

図1:システム運用現場における課題

2. 課題解決(負担軽減)に向けたNTTデータでの取り組み

同様の課題はNTTデータにおいても存在していました。そのため、課題解決につながる対策の中で、すぐに対応ができ、かつ効果が高いものについて検討を進めました。

(1)不規則な勤務(深夜勤務/土日祝日勤務)への対策

深夜/土日祝日勤務が恒常的に必要となる要因は、監視およびそれに伴うトラブル対応となります。そこで、監視および暫定的なトラブル対応を自動化することで、深夜/土日祝日勤務状況を改善できると考えました。もちろん、トラブル対応は内容によっては人の判断が必要になるケースもあります。しかし、スマートフォンで対応できるようにすることで、外出先でも簡易に、かつ必要最低限の時間だけで対応できるようになります。

(2)「安定運用のために実施している定常業務」の削減

定常業務の中での削減効果の大きさは、「1回当たりの時間数」×「発生頻度」で判断できます。キャパシティ管理の運用報告作業は、「1回当たりの時間数」はそれほど大きくないですが(システム規模等によっては大きくなるが)「発生頻度」は多い(日次/週次/月次、等の各タイミングで報告が必要となる)ため、削減効果が大きくなります。そこでキャパシティ管理の運用報告のプロセスの自動化と見直しを行い、定型・定例の報告作業から担当者(報告書を作成する人)と管理者(報告を受ける人)を解放することで、定常業務の中の一定量の作業時間を削減できると考えました。

(3)「時期によって作業量のばらつきの多い業務」の削減

作業量のばらつきが発生する業務は多数ありますが、その中でも計画が立てにくい業務として、利用者からの申請対応があります。利用者からいつ、どれくらいの申請が発生するかは、運用者側ではコントロールすることはできず、かつ申請が発生してからの対応期限はSLO/SLA等で規定され、先送りできない場合が多いです。そこで、申請対応の自動化を実施することで、不定期に発生する申請対応から運用者を解放し、作業量の平準化(と作業量の削減)ができると考えました。

3. 課題解決に向けた取り組みの実現方法

NTTデータでは、ServiceNow社が提供するクラウドプラットフォーム「ServiceNow(※1)」を活用することで運用現場の改善活動を加速できると考えています。そこで、社内クラウド(統合開発クラウド)(※2)におけるシステム運用で効果を検証しました。

「2.」で記載した(1)~(3)の各対応で、以下のメリットが得られましたので、こちらご紹介します。

(1)他システム連携が容易

NTTデータ先端技術社が提供する監視ツール「Hinemos(※3)」との連携が強化されており、監視ツールとしてHinemosを利用している場合、監視自動化対応が進めやすくなっています。また、スマートフォンにも対応しており、監視における暫定的なトラブル対応の自動化も可能となっています。

(2)分析に必要なグラフ化が簡易に設定可能

各種グラフ化のテンプレートも多数、用意されており、キャパシティ管理の運用報告のように視覚的にグラフを多用すべき業務においては効果的となっています。

(3)自動化フローが簡易に実現可能

処理フローの設定をノーコード/ローコード(プログラミング無し、もしくは軽微なプログラミング)で実現できるため、申請業務のような複雑な処理フロー(申請受け付け、申請対応、申請後のユーザ連絡、等)に対しても簡易に対応が可能となっています。

(※1) ServiceNow

https://www.servicenow.co.jp/

(※2) NTTデータグループ全社の開発環境を「統合開発クラウド」で集約

https://www.nttdata.com/jp/ja/news/release/2017/012500/

(※3) Hinemos

https://www.hinemos.info/

4. 自動化により負担軽減を実現

社内クラウド(統合開発クラウド)でのシステム運用で、課題解決に向けた3つの取り組みに対する実施結果を以下に示します。

(1)監視および暫定的なトラブル対応の自動化

「複数人×複数チーム」で監視の24時間365日の対応を実施していましたが、自動化することで監視無人化(常駐者0人での監視)を実現しました。これにより、深夜/土日祝日勤務が恒常的に発生することは無くなりました。また、自動化することで、監視アラートの見落とし/見間違い、暫定的なトラブル対応における作業ミス(手順/確認誤り)等が発生するリスクも排除し、確実な作業実施により安定運用にも寄与することができました。

(2)キャパシティ管理の運用報告作業の自動化

報告資料作成者、報告を受ける管理者、の定期報告対応(日次/週次/月次、等)を報告準備の半自動化を実施した上で、週に1回の簡易報告のみに変更しました。報告準備の半自動化により、作業ミス(集計誤り/報告書記載誤り等)が発生するリスクも排除し、安定運用にも寄与することができました。また、その作業に割り当てていた時間を安定運用に向けた改善活動にシフトすることができ、さらなる安定運用につなげることができました。

(3)申請の自動化

申請自動化により、不定期に発生する申請対応から運用者を解放し、作業量が平準化(および作業量が削減)されました。また、申請対応を手作業で実施した場合の作業ミス(申請対応の手順誤り、利用者への連絡漏れ等)のリスク回避や、申請対応の迅速化によるサービスレベル向上により、安定運用にも寄与することができました。

図2:課題対応の実施結果

図2:課題対応の実施結果

5. 最後に

NTTデータではシステム運用現場において自動化による生産性向上/安定運用の取り組みを進め、働き方変革をめざしています。その事例として、社内クラウド運用業務の監視/キャパシティ管理/申請業務を改善した取り組みについて紹介しました。今後もこの取り組みを加速し、「運用者の負担軽減」と「システムの安定運用/効率化による生産性向上」の両立をめざしていきます。

- NTTデータは、「これから」を描き、その実現に向け進み続けます -
お問い合わせ