参考書を読んだメモ : 1冊ですべてわかるネットワーク運用・保守の基本 1章

1冊ですべてわかるネットワーク運用・保守の基本

ネットワーク運用・保守の全体像

現場の運用・保守業務とは

  • 運用業務はネットワークを正常稼働する状態を維持すること
  • 保守業務はネットワーク障害に対する現状復旧が目的

運用保守の登場人物

  • 運用保守は目に見えないものを売る仕事。つまりサービス業である
  • 運用保守の登場人物
    • お客様(サービス利用側
    • 運用保守会社(サービス提供側

お客様

運用保守会社

  • ネットワーク管理要員
    • お客様のネットワークを24時間365日体制で安定稼働させるサービスを提供する
  • 保守員(非常勤
    • 実際の現場へ駆けつけて対応するエンジニア
    • 障害対応だけでなく定期点検など
  • 常駐保守員
    • 運用保守会社から派遣されてお客様の現場に常駐し、ネットワークやシステム運用管理の代行業務を行う

一般的な障害対応の流れ

障害検知受付

  • 障害が起きたことはどうやってわかるのか
    • 運用保守会社が障害を検知する
    • お客様(エンドユーザー)自身が障害に気づく

原因解析

  • 情報収集
    • ポイント
      • 誰が使えないのか
        • 全員?、個人だけ?
      • 誰宛に使えないのか
        • 特定の相手先?、全ての相手先?
      • いつから
        • 今日?、以前から?
      • どの場所で
        • 自分の場所?、他の場所?
      • どのように
        • 常にダメなのか?、たまになのか?
    • 今も影響が出ているのか?何かネットワーク環境で変化があったかを聞く
    • 基本的には外的要因による障害が多い

原因を特定する

  • 収集した情報をもとに絞り込む

復旧作業

  • 一番厄介なのは自然に復旧していた時
    • ログ情報や設定情報を収集して持ち帰る
  • ネットワークが使えるようになることが最優先

構成管理

  • 現状のネットワークがどのように管理されているのか、どのような資産を管理しているのか知る必要がある
  • 管理対象はハードウェア、ソフトウェア、ドキュメントなど多岐にわたる
  • 常に最新の情報を把握していなければならない

構成管理をする上で必要アイテム

  • ハードウェア情報
    • ネットワーク機器やサーバー、PCなどの製品名、製造番号、シリアル番号情報
  • ソフトウェア情報
    • ネットワーク機器やサーバー、PCなどのOS、アプリケーションのバージョンやライセンス情報
  • ドキュメント管理情報
    • 契約書関連、運用保守体制図、関係者連絡先一覧、社内組織図、機器構成、手順書、運用・保守対応フロー
  • 影響範囲を把握しておくことが重要

IPアドレス管理表

  • IPアドレスがどの部署で管理されていて現在の設定はどうなのかを可視化し、アドレスの割り当てを行ったり、アドレスの重複を回避したりするためのもの
  • 主な項目
    • 拠点
      • どこで利用しているか
    • セグメントアドレス
      • アドレスの重複利用を避け運用するため
    • 管理拠点
      • どの部署で管理されているか
    • 利用形態
      • このアドレス帯が何に接続されるか
    • 依頼元
      • 依頼元を把握するため
    • 登録日
      • 利用開始日を把握する
    • 廃止日
      • 現在、未使用であることを把握する

機器管理表

  • ネットワーク機器がいつからどこに設置されていて、現在の状態はどうなのか可視化
  • 主な項目
    • 資産番号
    • 機種名
    • 機能
    • ホスト名
    • 使用用途
    • 製造番号
    • 手配日
    • 設置日
    • 設置場所
    • 管理有無
      • 管理対象かどうか
    • ソフトバージョン
    • 保守ベンダー
    • 保守契約形態

一般的な性能管理

  • ネットワークの現状のパフォーマンスを定量的に測定・収集して性能を分析するプロセスを、定常業務として行うこと
  • 目標となるしきい値を設定し比べることが必要
  • どのプロトコルがいつ、どこ宛に、どれくらいの頻度で流れているか分析することが重要
  • ネットワークの性能管理
    • あらかじめ設定したしきい値に対し、ネットワーク全体としての性能が十分発揮できているか監視・測定する
  • 個々の製品の性能管理
    • CPUやメモリなど