SPONSORED LINK

KDDIのMOCが紹介されていたのでITの運用の話を解説する

TIME & SPACEは、KDDIがお届けするデジカル系情報マガジンです。

KDDIのモバイルオペレーションセンター(監視センター)の紹介がされていました。
筆者もキャリアの最初の頃は保守、監視オペレーターから開始したので懐かしいですね。

同期に近い人はその後保守一筋を貫いている人もいます。
筆者は結局、その後公共や医療、金融など複数の業界で色んな工程を齧りまくった結果、サーバー系メインのSEに落ち着きました。

ただ、今はどちらかというと何でも屋に近くなっていて、「ちょっと別システムの要員足りないからそっちで設計書書いてもらえる?」「分かりました!」とか「手がけた製品紹介を企業のWEBで載せるから業者に出すCSSの指定やっといてくれません?」「やります!」とかそういう付随的な仕事もよくあります。
自分でも何が専門なのか段々分からなくなってくることがあります。
サーバーを作るという部分のメインであろう仕事についても、「客側から仮想化でこういう仕組みで導入したいけど前例がないからまずは検証環境作って動作検証お願いします」といわれて検証環境を作ることが直近では多かったです。

それはさておき、オペレーションセンターの紹介記事とかは、センターの内容とか情報は守秘義務やセキュリティに直結してくるので通常中々出てこないのですが、こうしてKDDIが情報を出してくれているのは同業者としてうれしいですね。
IT事業者というのは社会的には企業が野球球団を運営したりして地位向上を図っていますが、現場ではIT担当者の地位は低く、客先でも出入りの業者としか思われていないことが多いです。
最近でも大阪市がプログラミングの実習環境の事業協力を巡り費用を事業者負担で行う無償で協力する事業者を募集したことから批判されていました。

   大阪市が「プログラミング教育推進」プロジェクトの一環で公開した、事業者募集の要項が「炎上」している。

これには既に担当業者は内定していて表向きはこういう公募になっているだけという見方の向きも一部ではありましたが、やはり社会の根底でITへの軽視というのが事実としてあると思います。

直近ではAIやVR、AR、自動運転などが次世代の技術としてもてはやされていますが、現在の社会のインフラを支えているのはもっと地味な技術の積み重ねです。
現場で技術者が試行錯誤してきて何とか今のインフラの仕組みを動かしています。
筆者も社員時代や個人事業者になって手がけたシステムで簡単なものは一つもありませんでした。
が、検証環境にしろ本番環境にしろそれらが今誰かのために動いているのでその時苦労して作った意味があったのだと思います。
こういうIT現場で働く作業者の環境については、もっとニュースになって、技術者の社会的地位向上につながって欲しいと思います。

SPONSORED LINK

ITの運用の話

多くの人には馴染みがないであろうオペレーションルームですが、筆者たちSEにはお馴染みの風景です。
大抵のSIerやシステム事業者のビルに行くと必ずこうしたセンターやNOCが規模の違いはあれど設置されています。
KDDIのモバイルオペレーションセンターについては基地局数10万箇所全てを監視しているということでかなり広いですね。
KDDIのイメージ通り部屋はとても明るくきれいです。
また、壁かけスクリーン、天井に設置されたディスプレイと所せましとディスプレイが置いてあり、監視対象の広さも感じさせます。
担当者は制服を着ていて近未来的な感じです。
多くの監視センターでは担当者はスーツで働いているので、制服があるのは自分から見ると珍しいほうだと思います。

オペレーションルームでは通常、私語が許されず、ディスプレイを注視し、監視の鳴動、発報に警戒しているため、緊迫した雰囲気になっています。
また、指揮命令系統が確立していて、席を外すときも席を外す旨を上長やマネジャーに言ってから外すなど、普通の会社のオフィスに比べるとかなり異質な雰囲気だと思います。
これは要員をその時間何名でという確保をしているので、誰がどこにいるのかについても上長、マネジャーは把握しておく必要があるためです。
また、働く場所がこのように気が抜けない状況なので、ITの事業所では喫煙者が多い印象があります。喫煙場などで一息入れないと中々気を抜く場所がないというのはあると思います。
筆者も喫煙を始めたのが運用の業務に入ってからでした。今は禁煙していますがITの事業所だとやはり回りに喫煙者が多いイメージです。

自分たちSEは通常は各々自分の作業の計画に必要なペースで作業しているので、ここまで厳しくはありません。
というより、スケジュール感を分かっているのが自分しかいないので自分で作業管理するしかないという部分はあります。
ただ、一度障害が起きてその解析の担当になった場合は、担当者全員で頭を付き合わせて作業するという感じになります。

ローテーションシフトの話

24時間365日を8人で回すというのはシステム規模や作業難度にもよりますが、かなり大変です。
自分も、4人体制で一日実質16時間拘束の8時間勤務などをやったことがありますが、昼夜逆転して体調に不調を感じました。
17時に出社したとすると社内で仮眠を挟んで翌朝9時に帰宅し、家に帰ってもまた17時出社なので5時間くらい寝て食事を食べてまた出勤するという生活がローテーションに入っている間続きます。
その代わり、この部署ではローテーに入っている間、作業がなければ自由に勉強することが推奨されていて、長い時間社内にいるので、色んな資料を読んだり、構築や開発の一部を担当させてもらったり、検証系のシステムを組んでそこでコマンドの勉強をしたりと、急速にスキルが付いた時期でもあります。

3ローテーだと0時出社-9時退社、9時出社-18時退社、15時出社-24時退社のような感じだと思いますが、ずっとこれだと昼夜逆転の生活になるので、普通は少しずつずらしていきます。
9時出社のシフトを3日勤務、休みを挟んで15時出社のシフトを3日勤務、休みをはさんで0時出社シフトを3日勤務して2日休み、のように3勤1休、3勤2休のようなローテーションで全員の時間帯を少しずつずらしていきます。

そして0時出社組と9時出社組では時間帯でやることも変わるので、ローテーがずれることで別ローテーの作業も覚えていくという意味合いもあります。
例えば金融のシステムでは夜間作業者はバッチ処理が稼動したかどうかのメッセージを複数人が目視で確認するというのも重要な作業です。
バッチ処理が成功したメッセージはログに出していますが、それを更にオペレーターが目視で確認してOKということを確認してバッチ処理を継続していきます。
金融では失敗が許されないミッションクリティカルなシステムなので、「目視してメッセージのOKを見る」でも重要な作業です。

一方で昼間の担当者にはシステムのメンテナンスなどの仕事が入ることがあります。
予め「この月のこの日はメンテナンスで再起動しますので数時間のシステムダウンが発生します」と運用計画に定めておき、客に了承をもらい、その時間帯に各種システムを再起動したり、ログの取得をしたり、ミドルウェアをバージョンアップしたりプログラムを入れ替えたりします。

メンテナンスは金融のように昼間落とせないため夜間にやるシステムも多いですが、必ずしも夜間にやる必要があるというわけではなく、客先の要望やシステムの種類により適宜実施時間を設定します。
メンテナンスが昼間の作業に当たっていると、普段夜間の監視業務が主体のオペレーター担当者でもメンテナンスの作業に入らないといけません。
リモートでシステムに入り、末端の機器やサーバーから停止させていき、Pingを確認しながら停止起動を行い、というのはマニュアルを見ながら直ぐに出来るという人は中々おらず、熟練者の指導を受けながら自分で実践してようやく知識になるものです。
自分たちSEも現場で使われる運用マニュアルや障害マニュアルは成果物の中でも特に分かりやすく作る努力をしていますが、それは現場の運用がマニュアルの品質に大きく左右されることを分かっているというか、自分たちも苦労してきているからですね。

運用管理のマネジャーの場合、こうしたローテー計画も重要なので、日々要員の体調やスキルの習熟度合い、個人の予定などもヒアリングしながら計画を策定していく必要があります。

監視システムの話

監視システムは会社毎に大体違っていて、あるオペレーションセンターで監視に慣れていても別の拠点だと別のシステムを使っているというのはITではよくある話です。
例えばTivoliを使っている会社、JP1を使っている会社、OpenViewの会社、或いはZabbixやNagiosを使っていた会社もあります。
監視システムでは、システムにアラートとして知らせるのをどの辺りに設定するかというパラメーターの閾値の話も絡んできます。
冒頭にも書きましたが、センターの話しというのは中々表に出てこず、各社の監視システムについても情報として取り上げられる機会は少ないので、こうしたITインフラの監視や運用についてをメイントピックとして取り上げた書籍が出たのは珍しかった記憶があります。(ZabbixやNagiosといった個別の監視システムの本は出ていましたが。)

ソフトウェアエンジニアのための ITインフラ監視[実践]入門
技術評論社 (2016-01-16)
売り上げランキング: 30,739

監視ルーム、オペレーションルームには、ITを志し入社してオペレーターとして経験を積みながら構築SEのキャリアを目指す人もいれば、逆にシニア世代やシルバーエイジでパソコンやネットワークの知識を生かしてオペレーターとして新たにセカンドキャリアを始める50代、60代の方もいます。
まだ数は少ないですが、オペレーションルームで活躍している若い女性もいます。
オペレーターといっても、年齢層や、キャリア、スキルは様々です。

キャリアの話

今の若い人がどう感じているかは分かりませんが運用、保守、オペレーターで日々の業務から経験を積みながら構築SEのキャリアを目指すというのは、自分たちの間では普通の感覚でした。
オペレーションに用いるシステムはWindowsサーバー系やRHEL(Linux)系で、業務で使うコマンドを覚えていくと構築で使うコマンドも理解出来るようになってきます。
ネットワークの障害切り分けも、サーバーやルーターのコマンドを組み合わせたものなので、そうしたコマンドを覚えていくと機器の設定についても徐々に出来るようになっていきます。そしてログを出したり監視のために簡単なシェルを作ってスクリプトやLinuxに習熟していき、いずれコマンドで操作するのが当たり前になってくるとサーバーの設定や構築も苦ではなくなってきます。
キャリアアップというと大げさですが、現場では日々の業務の延長線上に次のキャリアが見えているので、自分としては仲間と切磋琢磨しやすかったということがあります。

SPONSORED LINK

シェアする

  • このエントリーをはてなブックマークに追加

フォローする