电信网管系统的功能设计与实施步骤 ------------------------------------------------------- |
|
|
|
当前,数据通信网络正处于全面、高速的发展阶段,网络结构和应用需求日趋复杂。如果在设计与实施网络管理系统(以下简称网管系统)的过程中未做全面周到的考虑,必将制约网络的迅速发展。因此,网管系统的建设至关重要,电信网管系统就是其中的典型应用。
功能设计 ●电信网管系统的管理需求分析 电信网络管理应实现故障管理、配置管理、性能管理、计费管理和安全管理等功能,能及时反映网络中各个应用软件的运行情况,包括数据库、Radius进程、各服务器进程等;能实时统计数据流,以判断网络的瓶颈,为今后的扩容提供依据;能管理网络中各个设备的密码及配置文件,以便在密码丢失或配置改变后进行恢复;能设置各个设备的不同访问权限;能跟踪某个拨号用户所访问的IP地址内容;能提供强大的安全管理和监控措施以防止黑客入侵。以上是电信网管系统所应具备的主要功能,是提高电信管理效益的基础。 ●网络与系统管理的总体考虑 综上所述,一个全面的电信级网络与系统管理软件应该做到: 能够覆盖电信企业在IT环境中的所有管理对象。 系统管理软件能够端对端地管理桌面机、工作站和NT/Unix服务器,如Sun或HP的小型机;能够管理TCP/IP、IPX/SPX等网络协议,支持企业中所使用的DDN、X.25、FrameRelay等广域通信协议和ATM网络技术;支持HP(HP-UX)、SUX(Solaris)、IBM(AIX)、INTEL(NT/SCOUnix)、COMPAQ(Digital-Unix/Alpha NT)、SGI(IPIX)等服务器/客户机平台;支持目前流行的关系数据库系统,如Oracle等;支持LotusNotes、NetscapeWebServer、MicrosoftIIS和Exchange等应用系统。 能够提供电信企业所需要的管理功能。 从网络管理的角度看。电信管理软件必须能够提供网络性能管理、网络设备配置及与第三方网络设备管理软件的集成等管理功能;能够提供电信企业中IT系统的综合故障处理能力,包括对在整个分布式计算机系统中所发生的网络SNMP事件、系统事件、数据库事件、应用事件的收集与自动响应能力,以及对在整个电信企业中所发生的故障类型的判断、处理人员的指定、处理过程的记录和解决方案知识库的生成等能力,为电信企业提供一套完善的故障分析、处理及查询系统。 从安全管理的角度看。电信管理软件应该提供一套安全的用户管理系统,如各网段之间及与外部网络之间的防火墙,以及从应用的角度提供对各服务器访问的单一登录机制并对全网的PC机提供完善的病毒防护及杀毒功能等。业务运行数据是电信企业的重要数据源,建立一套与电信业务运行相一致的数据备份/归档系统和数据灾难恢复系统,是保证整个电信业务正常运作的重要组成部分。 从系统管理的角度看。电信管理软件应该对全网的PC及服务器资源进行集中监控管理,支持对关键应用及数据库服务器的端对端的性能监控分析,帮助精确定位业务系统运行时的瓶颈所在,及时做出调整业务运行的策略;应提供跨网段的应用软件的分发及企业运行过程中所必需的业务工作流的定义、调度及企业内作业负载的平衡等能力,使企业内部完全由人或制度控制的业务运行规则自动化。 数据是整个电信业务运行的核心内容,企业级的系统管理软件应该对数据库系统的可用性,数据库文件系统,数据库存储空间、事务日志、连接情况、死锁情况等进行严格监控。 能够为电信企业提供切实可行的管理解决方案。 在管理软件中建立的符合电信企业实际环境的IT模型,将大大简化用户对负载及资源环境的管理,更好地从业务运行的角度来管理和监控IT资源。例如,管理模型能够自动发现全国或区域内的网络拓扑结构,精确定位网络中的每一个节点,进一步自动发现并定位企业网中的详细资源,建立各种资源之间的连接关系,并按照电信企业的实际环境,利用对象技术,形成对所有管理资源及管理功能的单一管理模型,实现资源的集中和集成管理。 能够提供标准的和开放的应用接口及开发工具,符合IT技术未来的发展方向,保护用户的投资。 由于电信企业是一个具有多系统、多数据库应用平台、多厂商网络及系统设备、多业务应用和多网络技术的复杂的管理环境,管理软件必须提供标准的和开放的应用接口及丰富的开发工具,以便集成电信企业现有的及将来的管理软件,保证电信系统管理软件的顺利实施和对投资的保护。 能够将电信企业的IT资源管理和业务相结合。 电信管理软件不仅要管理电信企业网中复杂的计算环境,更重要的是帮助用户从业务的角度管理IT环境。如在管理过程中,管理软件通过构造与业务相关的观察视图或报告,分析计算机资源的使用情况,及时反映影响业务正常运行的故障,提供真正面向业务管理的解决方案。 实施步骤 第一,明确每一个被管理对象可以收集到的信息。例如,收集的数据元素是实际值与平均值的比值、计数器值、自然整数还是文本信息等。 第二,将这些信息递交给各个被管理对象的支撑部门,由他们决定哪些信息与其业务相关,将注意力集中在与业务相关的信息将使工作更加快捷高效。 第三,明确被管理对象的报告策略。一是确定与告警报告相关的信息元素,如阀值、端值、告警的优先级以及使告警优先级变化的阀值、可行的轮询间隔时间(每5分钟、10分钟或1小时等),还可以建立一些自动运行的诊断进程或帮助系统等。二是确定与每月报表有关的信息元素,如设备与服务的可用性、使用率和负载情况等。三是确定与网络组件和功能的变化趋势及性能相关的信息元素,如考虑怎样对数据元素组合或计算而使其更好地用于支撑部门。 第四,和管理人员交流,以确保所有业务单元都已由网管系统管理起来。一是解释网管系统的任务和目标,如提高所有支撑部门的生产能力、减少故障修复所需平均时间、提供一种预先检测和隔离故障的方法、使不同支撑部门及不同地域之间的合作和信息流通成为可能等。二是收集对业务单元管理功能的要求,如果管理设备需要智能功能,建议将设备升级后再进行管理。 第五,在集成整个系统时,应注意实现所有的功能要求。 第六,在所有的功能模块都实现后,通知各个被管理对象和系统相应的支撑与管理部门,开始进行监控。 第七,在第一次出报告、报表期间,向提出功能要求的支撑与管理部门询问反馈意见,包括如有必要重新明确功能需求、仔细考虑对支撑部门的工作有很大影响的报告和数据类型等。 在实施网管系统时,桌面帮助系统的告警信息应引起注意。这是MIS系统的最前端,完善的故障告警信息是网管系统成功的重要因素。有效地训练桌面帮助系统,将故障处理程序加入到相应的故障诊断列表中。这些故障可以是任何用户在应用中出现的问题,此帮助系统能够向最终用户提供最合适的服务。告警和诊断处理步骤的试运行能够快速有效地解决可能存在的问题。所有相关的支撑部门都应参与网管系统的实施过程,这样才可以有效地鉴定所有诊断步骤。 网管建设是一个非常复杂的系统工程,尤其是网管策略的制定,需要相关的技术和管理人员投入大量精力,共同协商确定,以真正实现网管系统的设计目标和功能。电信网络建设的不断发展,对电信网管系统提出了更高的要求,今后,电信网管系统将会在高效和完善等方面迈出更大的步伐。
|
如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐
jill.jiang@amteam.org | 021-51096826-112 |
在线联系