论文摘要及翻译

摘 要

近年来,计算机网络的迅速发展给全球的各个方面都带来了巨大的变化。其中,基于IP网络的语音通信方式为人们的远距离交流提供了一种价格低廉的途径,结束了传统电信领域中电路交换方式一统天下的局面。本文介绍了在分组交换网上构建多媒体通信系统的标准—H.323协议,H.323协议经过不断的完善和改进,目前己经成为了IP电话体系中应用最广也最成熟的标准,文中对IP电话的技术特点和系统构成进行了研究。IP电话与传统电话的根本区别在于它们采用了不同的交换技术,本文在此基础上分析了IP电话的优势及存在的问题,并对其中的关键技术及相关协议作了阐述和比较,从而实现了企业级IP电话系统。

关键词: IP电话; H.323;分组交换网络;网络通讯

Abstract

In recent years, Computer network's rapidly expand has brought the huge change for global each aspect. And, has provided one kind of low in price based on the IP network's voice communication way for people's long-distance range exchange way. Has ended the aspect which in the traditional telecommunication domain the circuit switching way monopolizes., This article introduced in the packet switching on-line construction multimedia communications system's standard - H.323 agreement, the H.323 agreement undergoes the unceasing consummation and improves. At present oneself passed through into the IP telephone system to apply the broadest also maturest standard, In the article carried on to the IP telephone's technical characteristic and the system constitution has studied. The IP telephone and the traditional telephone's basic difference lay in them to use different exchange technology, This article has based on this analyzed the IP telephone's superiority and the existence question And has made the elaboration and the comparison to key technologies and the related agreement, thus has realized the enterprise IP telephone system.

Keywords: Enterprise IP telephone; H.323; PBN; Network communication.

引 言

目前国内企业的长话方案大多采用长话直拨或IP电话两种模式,企业分公司之间的语音通信,企业人员外出与各分公司的语音通信占据了企业总话费开支的绝大部分。对于已经建立了企业内部网络的企业来说,如果可以利用内部网络实现语音通信,无疑可以节省一大笔费用。多数已经接人到Internet的企业有可靠的带宽保障,为实现因特网的语音技术VoIP方案提供了基础。把企业所有分支机构的PSTN网与企业内部LAN连接起来,由于Internet费用与地域无关,网络费用总支出固定不变,利用VoIP实现语音通信,节省了原来需要通过PSTN网的电话费用。多数的IP呼叫都通过PSTN接入IP电话网,这是目前各IP电话运营商共有的业务模式,他们必须租用PSTN公中继线才能开展业务。目前在固定和卡类用户趋于稳定的情况下,企业IP电话又表现出巨大的市场潜力。

第一章 绪 论

1.1 课题背景

近年来,基于TCP/IP协议簇的因特网在高速发展,它将丰富的讯息带入了人们的生产生活中,也推动了IP网络的大规模建设和发展。随着其覆盖范围的不断扩大,网络性能的不断提高,IP网络已经在全球范围内构筑起了一个可以实现信息互通的统一平台。它不仅可以承载数据业务,也将语音、视频等多媒体信息一步步地融入其中。可以说,IP网络电话的诞生是以IP为标志的网络分组化和以多媒体为目标的网络业务综合化两大主流技术相融合的结果。

目前,在构建IP电话系统时应用最为广泛也是最为成熟的标准是H.323协议.它与相关的支持协议一起,为多媒体信息的编码、通信过程中呼叫和媒体信道的控制以及媒体流的传输方式等内容制定了统一的规范,适用于构建任意规模的IP电话系统。事实上,国际上几乎所有的商业性IP电话网都是以H.323为基础的。在我国,信息产业部为开放IP电话业务正式颁布的《IP电话砖真业务总体技术要求》等标准规范中也明确指出,选择H.323为我国VoIP体制的基础。

1.1.1 研究目的及意义

众所周知,当前全球Internet己经成为仅次于传统公用电话交换网的第二大通信网络。由于Internet本身的技术先进性、网络容量的高利用率和极强的可扩展性,使其较PSTN更加具有发展潜力。自从1995年年初,以色列VocalTec公司研制出可以通过Internet打长途电话的软件产品“Internet Phone”以来,IP电话就受到了各方面的重视,之所以受到重视正是因为IP网固有的优点也就是我们研究它的意义:

(1)价格低廉

这是IP电话进入市场的首要因素,IP电话均采用压缩话音编码和分组统计复用技术,带宽利用率高。运营商都是采用租线方式运营,其成本核算和计费方法与传统电信运营商不同。

(2)可以灵活的提供各种增值业务

价格优势是IP网络电话进入市场的原始推动力,而增值业务才是IP电话的发展的真正动力。IP电话都是智能终端,IP网络是开放式网络,其固有的分布式计算机网络环境很容易快速的推出新业务。而传统的电话网想推出一项增值业务则往往比较困难,甚至无法推出某些业务。

IP电话增值业务非常多和灵活,H.323系统补充业务由H.450系列建议定义。其中,H.450.1定义了适用于各种补充业务控制的通用功能协议,目前共定义了7种补充业务:呼叫转交,呼叫转移,呼叫保持,呼叫迁移和代答,呼叫等待,报文等待指示,名字标识等[1]。

(3)有利于企业建立高效综合服务内部网

IP网路电话引入企业网后,可以将数据网和电话网合一,可以很容易的在以有的数据平台上加入话音信箱,交互式语音提示,自动话务员等功能,构筑计算机电话集成系统,这些仅需加入相应的软件便可应用。

(4)有利于运营商开拓新的市场

随着Internet的发展,许多Internet服务提供商应运而生,但他们仅是提供接入服务,没有提供实质性的业务,多处于亏损状态。IP电话推出后,他们可以很方便的将网络电话业务与接入服务结合起来,增加运营收入。

(5)有助于核心技术的融合,促进网络技术的发展

IP电话系统广泛的采用了语音编码压缩技术,使用算法很多。可以达到PCM 编码的1/10,可使长途干线不增加设备而能力增加10倍。还有目前正大力开发的宽带接入技术,如电缆调制解调器和高速数字用户线技术(xDSL),为IP电话的推广开创了很好的技术条件。

(6)可以使我国通信技术缩短与世界先进水平的距离

由于历史的原因,我国的通信技术相与世界的先进水平一直存在距离,我国电信市场长期被外国企业占去大半,而IP电话是世界范围的一个新热点,由于近些年我国通信技术也已有了很多积累,已具备了一定的开发和竞争能力,在IP电话技术上与国外的起点和差距不是很大,信息产业化是我国“九五”计划的重点,我们可以抓住机遇同步的发展。

1.2 IP电话的发展现状

IP网络电话技术经过这几年的迅猛发展,已经取得了很大的成功,包括我国在内的许多国家都相继建立了实验网,并投入了运营,基本取得了预想的效果。因此网络设备和通信设备制造商、通信业务运营商以及ISP都渴望在IP电话市场中取得立足之地。各制造商的IP电话产品纷纷进入市场,各运营商也纷纷开展了IP电话业务。但是目前已存在的IP网络电话系统一般都只提供最基本的Phone to Phone的通话能力,这远远没有把IP网络电话的潜在优势发挥出来。从技术角度来说,虽然H.323、SIP等相关协议己经发布,但IP网络电话技术并不完善,有待研究的问题还很多,例如基于H.323/SIP协议的网络体系结构方案问题、各协议间的互通问题、网络运营问题、安全问题、网络管理问题、服务质量问题、三网融合问题、增值业务实现问题等等。因此目前的IP网络电话只不过是它迈出的第一步,最终的目标是完全融合各类网络,建立集成的服务网络[2]。

第二章 IP电话的原理技术

2.1 IP电话的基本原理

IP电话又称网络电话(VoIP)和Internet电话.是利用Internet作为传输载体实现通话的一种先进手段IP电话是指利用数据网络(例如Internet),通过IP协议来传递语音的一种通信方式。与IP电话有关的硬件设备主要是配置有语音压缩卡和接口卡的网关(Gateway),网关同时连入PSTN(公用电话交换网)和数据网,网关可以存储用户管理信息以及路由信息。也可以将这些信息单独存储在关守(Gatekeeper)中,关守与网关同时连人数据网,这样关守与网关可以通过具体的通信协议(例如H.323)进行信息交互。网关主要实现语音数据与IP数据包的互换.而关守是用来验证用户身份以及进行路由寻径。即用户首先通过普通电话网拨打设在本地或某一特定地点的IP电话网关.网关将用户送来的话音经压缩编码,打成一定长度的IP包后经过与关守的交互。来完成用户身份验证和路由寻径.然后将IP包通过数据网传送到被叫用户所在地的网关被叫用户所在地网关经过解压缩等相反的过程,将数据包还原成话音信号送到市话网,拨通被叫用户。

H.323协议为该系统定义了四个主要组成部分:终端(Ter_mina1)、网关(Gateway)、关守(Gatekeeper)和多点控制单元(MCU)(含多点控制器(MC)、多点处理器(MP))。

(1)终端:是指IP电话的客户终端。是系统中能提供实时双向通信的节点设备,它必须支持H.245标准,对控制信道和呼叫信道提供可靠的端到端服务。同时对音频信道和用于传递登记、许可、带宽变化及状态信息的RAS信道提供不可靠的端到端服务。

(2)网关:是通过IP网络提供电话到电话、PC到电话的话音通信关键设备.是IP网络与PSTN/PBX网络之间的接口设备。网关主要用来在不同的ITU标准之间进行协议翻译、语音信号处理(编码/解码.压缩/解压缩等)、传输控制(RTP/RTCP)和系统控制,建立网络连接并完成语音信息传输。

(3)关守:又称作网络管理者或关闸,为了保证在网络上可靠地传送语音信息,设置的独立功能模块,它是IP电话系统中的逻辑交换机,IP电话系统中所有的接点设备都要在关守上登记注册,并且以它作为所有语音信息流和控制流的中介点,以实现运输层地址翻译、用户接入认证、安全管理、呼叫控制与管理、带宽控制与管理、区域管理和计费管理等。

(4)多点控制单元:它在两个用户进行通信时,完成用户数据流的连接和语音信息流的混合。它通常由一个多点控制器(MC)和几个多点处理器(MP)组成。MC处理终端之间的H.245控制信息,进行终端对音频和视频处理能力的管理。MP处理来自终端的多媒体信息流。对音频视频或数据信息流进行混合、切换和处理。

IP电话的主要技术

在普通电话之间进行IP语音通信,必须通过在PBX之问架构网关来实现。IP电话网关采用了分层模块化结构,可以分为硬件层、软件模块层、维护管理层、控制接口层几个部分。软件模块层又包括语音信号处理、PSTN呼号控制、IP呼叫管理、IP呼叫控制、数据传输、DSP管理软件包

等。其中语音信号处理包含了语音编解码、回波抵消和DTMF检测功能[3]。

(1)语音压缩技术IP电话技术的基础是语音压缩技术。1.TU(国际电联)批准了一个语音压缩G.729标准,G.729标准采用的算法,可以仅用8kbps传输话音,话音质量与32kbpsAD—PCM(差分脉冲编码调制)(G.724)相同。现在G.729标准是最重要的话音压缩标准.目前G.723/G.723.1标准使用也比较广泛。

(2)静音抑制技术静音抑制技术能够保证语音质量并节省带宽。在一段对话中,约60%是字和句子之问的停顿。除去这些停顿.只保留语言部分。能够大量节省宝贵的带宽。

(3)话音抖动处理技术IP网络的一个特征就是网络延时与网络抖动,这将导致IP电话音质下降。网络延时是指一个IP包在网络上传输时间的长短变化。为了防止抖动,目前主要采用抖动缓冲技术。即在接受方设定一个缓冲池,话音包到达时首先进入缓冲池暂存.系统以稳定平滑的速度将话音包从缓冲池中取出、解压、播放给受话者。在一定程度上有效处理话音抖动、并提高音质。

(4)话音优先技术话音通信实时性要求较高。为了保证提高音质的IP电话通信,在广域网带宽不足的IP网络上,一般需要话音优先技术在IP网络路由器中设定话音包的优先级为最高。这样路由器一旦发现话音包,就会将他们插入到IP包队列的最前面优先发送,目前几乎所有品牌的路由器均支持这一优先级技术。这样。网络的延时与抖动情况对话音通信的影响均得到改善今天的技术可达到:每天平均每条话音中继线的通信量仅占1kbps至2kbps为64kbps广域网带宽的3%。

(5)VoIP前向纠错技术(Forward Error Correction,FEC)公共Internet网络往往有较高的丢失包率,这不足以维持高质量的话音通信。FEC技术就能发挥重要作用。FEC技术有两级,第一级是在同一包内加冗余数据。以便接收方纠错、恢复、还原话音数据。保证音质:第二级是在第一个话音包中存放后续包冗余数据。以便接收方从已经接收到的包中恢复出错或丢失的话音包。

2.3 IP电话的有关标准

标准是任何一项新技术与新业务的广泛推广与使用的重要基础。H.323协议是最早被采纳的VoIP标准,H.323协议已经在网上得到广泛应用。国际上如ITXC和AT&T,国内如中国电信、中国联通等均采用H.323的体系结构组建IP电话运营网[4]。

(1)在H.323终端上的音频编码/解码器必须能够具有G.711标准所规定的语音信号编码/解码能力。也可以符合G.722、G.723.1、G.728、G. .729和MPEG1等音频信号处理标准。即系统中的终端、网关和MCU必须支持G.711标准,其余任选。并可以通过能力协商而采用其它编码形式H.323终端的编码,解码能力可以是非对称的。如允许以G.711处理发送,以G.729处理接收。

(2)H.323协议的系统控制包括:H.245控制、Q.931呼叫信号控制和RAS控制。H.245控制信道是一个可信通道.用来承载控制信息用以对H.323实体的操作。这些控制包括:性能交换、打开或关闭逻辑通道、优先级请求、流程控制信息以及基本的命令的指示等呼叫信号通道利用Q.931在两个终端间建立连接。RAS规定了在两个H.323组件之间(如终端和关闸之间)建立RAS信号通道,完成注册、访问权限、带宽改变及状态更新所需要的信号。

(3)实时传输协议(RTP)声音、视频及数据的实时传输协议,RTP作用于IP的上层。它对于每一个音频或视频的UDP报文分组前加上一个包含时标和序号的报文头。若在接收端设置适当的缓冲,则可实现利用时标和序号信息按优先级复原报文分组、记录失序报文分组和同步语音数据,使得音频和视频的实时传送及同步得到保证。

(4)实时控制协议(RTCP)RTCP用于对RTP的控制,它监视语音报文分组的传输服务质量和网上的信息,定期把包含服务质量信息的控制信息报文分组发送给网络上的各个结点。

(5)支持带宽预留协议(RSVP)在IP网上为一个音频传输呼叫保留足够的带宽是很困难的。RSVP提供按需分配的预留带宽,它允许接收端为某个音频信息流申请一定数量的带宽,并给出传输路径上个网络设备对于申请的确认。RSVP不是H.323建议的正式组成部分,但是要求IP电话产品必须支持它。RSVP的实现需要得到终端、网关、多点处理单元以及IP网络中所有路由器和交换机的支持。

第三章 协议与标准

目前,VoIP方面的主要协议有:H.323、SIP(Session Initiation Protocol,会话发起协议)、MGCP(Media Gateway Control Protocol,媒体网关控制协议)、H.248(H.GCP)。H.323和SIP是两大电话体系,二者是完全平行的,它们能实现的信令功能基本相同,也都利用RTP(Real Time Protocol)作为媒体传输的协议,但两者的设计风格截然不同,因此也不可能相互兼容。

3.1 H.323协议

H.323是ITU—T的多媒体通信协议系列中的一个,它提供了基于分组网络传送音频、视频和数据的基本标准。其结构如图3.1所示。H.323支持点对点通信及在MCU支持下的点对多点通信,作为一个协议框架,H.323提供了系统及组成部分描述、呼叫方式描述及呼叫信令程序。H.323的协议包括H.261、H.263视频编码标准、C.711、C.722、C.723音频编码标准、T.120多点数据会议系列标准、H.225.0分组和同步标准、H.245系统控制标准等。H.323提供设备之问、高层应用之问和提供商之间的互操作性。它不依赖于网络结构,独立于操作系统和硬件平台,支持多点功能、组播和带宽管理。H.323具备相当的灵活性,支持包含不同功能的节点之问的会议和不同网络之问的会议。H.323建议的多媒体会议系统中的信息流包括音频、视频、数据和控制信息。信息流采用H.225.0建议方式来打包和传送[5]。

图3.1 H.323协议框架

3.2 SIP协议

SIP是由IETF提出的VoIP信令协议。SIP用于发起会话,它能控制多个参与者参加的多媒体会话的建立和终结,并能动态调整和修改会话属性,如会话带宽要求、传输的媒体类型(语音、视频和数据等)、媒体的编解码格式、对组播和单播的支持等。

SIP在设计上充分考虑了对其他协议的扩展适应性。它支持许多种地址描述和寻址,包括:用户名@主机地址、被叫号码@PSTN网关地址和普通电话号码(如Tel:010—62281234)的描述等。这样,SIP主叫按照被叫地址,就可以识别出被叫是否在传统电话网上,然后通过一个与传统电话网相连的网关向被叫发起并建立呼叫。

SIP的最强大之处就是用户定位功能。SIP本身含有向注册服务器注册的功能,也可以利用其他定位服务器如DNS、LDAP等提供的定位服务器来增强其定位功能[6]。

3.3 MGCP与H.248/MEGACO协议

MGCP与H.323和SIP并不属于同一层面。MGCP不涉及IP电话的体系结构,只涉及网关分解问题,因而它不仅可以用于H.323 IP电话系统,也可以用于SIP的IP电话系统。其次,在网关分解方

面,IETF和ITU—T配合得很好。在两大组织直辖下,目前一个正式标准已经完成,这就是H.248建议/MACOGO。H.248将MGCP大大推进了一步。应该说H.248建议已经取代了MGCP,成为MGC与MG之问的协议标准了,只不过商业化的实现还很少。

3.4 IP电话协议比较

由于H.323推出较早,协议发展得比较成熟,且采用了电信网的呼叫信令和信道控制的概念,因此成为目前商用IP电话系统,特别是骨干IP电话系统的主流技术。H.323建议的缺点是过于复杂,从而造成基于H.323建议的IP电话系统也过于复杂。

SIP的部分优点包括:该协议具有可扩展特性,可以轻松定义并迅速实现新功能。可以简单易行地嵌入廉价终端用户设备。该协议可确保互操作能力,并使不同的设备进行通信。

SIP的缺点包括:SIP问世不久,因此大多数应用尚处于原型阶段。该协议单独应用的范围较窄。但与其他协议协同使用时,具有较强的灵活性。SIP只是完整解决方案的一小部分,还需要许多其他的软件来构建完整的IP电话产品。

我国选择H.323作为构建商用IP电话网的基础。即选择H.323作为VoIP体制的基础标准,并跨过MGCP,直接采用H.248作为网关设备标准,事实上,H.323+H.248是构建电信级VoIP的最快的策略。所以,本文也选择H.323作为企业级IP电话网的基础。

第四章 系统设计与实现

4.1系统概述

基于实验和研究的目的,本文实现了一个在局域网环境下PC到PC的IP电话软件系统。该系统基于H.323协议,主要实现了信令呼叫,媒体信道控制,及语音压缩、编码、传输等功能,语音编码采用G723.1标准。系统的开发环境为Windows2000平台.开发工具采用Visual C++6.0。实现后的系统可与符合H.323标准的其他IP电话软件(如微软的Netmeeting)进行互联通话。

4.2系统架构

本系统结构如图4.1所示:

图4.1系统结构图

本系统分为上层和底层两大部分[7]。

上层主要完成如下功能:

(I)参数设置:可以设定连接的IP地址.最大呼叫次数,语音采集与回放参数。

(2)操作控制:进行启动连接(停止连接)、开始语音回放(停止回放)、开始语音采集发送(停止采集发送)以及静音的操作。

(3)状态显示:在系统运行界面上显示当前通话连接状态,包传输速率等。系统的主要功能是在底层实现的。底层由如下4个模块组成。

4.2.1 呼叫连接控制模块

H.225.0和H.245是H.323系统的核心协议.前者主要用于呼叫控制,后者用于媒体信道控制。在H.323中.呼叫指的是两个端点之间的一种点到点的联系。在任何呼叫开始之前,首先必须在

端点之间建立呼叫联系,同时建立H.245控制信道,这就是H.225呼叫信令协议的主要功能。一个最简单的基本呼叫建立信令过程如图3所示。端点1(主叫端点)首先根据端点2的IP地址和呼叫信令信道公认TCP端口号(1720)建立至端点2的TCP连接,即建立起可靠的呼叫信令通道,然后在此信道上发送Setup消息,其后端点2回应Call proceeding表示呼叫号码已全,呼叫过程启动,然后是Alerting表示正在提醒被叫用户(响铃),等待用户应答。在最后的Connect消息的UUIE中,端点2回送H.245控制信道的TCP端口号,建立起H.245控制信道。

图4.2 基本呼叫建立过程

在H.323多媒体通信系统中,控制信令和数据流的传送利用了面向连接的传输机制。在IP协议栈中,IP与TCP协作,共同完成面向连接的传输。可靠的传输保证了数据包传输时的流量控制、连续性以及正确性,但也可能引起传输时延以及占用网络带宽[8]。

4.2.2 语音采集模块

该模块用来采集语音数据,将模拟语音信号转换为数字信号,在程序中为了减少通话的延迟时间,直接分配内存块,将采集的数据放在内存块中,以便压缩或传输。对语音的采集是通过调用声卡的API函数来完成。在本系统中语音的采样格式为WAVE—FORMAT_PCM,单声道,采样率为8K。样本量化率为16位,即每秒的语音数据有16K字节。然后再采用G.723.1标准对声音进行压缩编码,并将编码后的数据写入发送缓存区,由网络发送模块分割、封装打包,发送到网络上。速率为5.3—6.4kbps[9]。

4.2.3 语音回放模块

该模块实现的功能有:

(1)语音包的接收和缓存:接收监听模块接受到通话对方发送来的语音数据包后,送缓冲区缓存。

(2)排序:数据包在缓冲区中将按RTP序号进行排序。

(3)解码:对压缩的数据包进行解码,

(4)放音:满足上层所设定的延迟时间的要求.同时满足双工要求。

4.2.4 底层网络连接模块

本系统采用开放的Openh323协议堆栈作为协议实现接口,该协议栈以Socket套接字实现底层的网络传输控制层协议,即通过TCP协议发起呼叫连接、进行媒体能力协商,并使用基于UDP的RTP协议实现语音数据的流媒体传输且通过不同的端口实现双向语音数据传输。

4.3 语音终端及其实现方案

语音终端(以下简称终端)由计算机构成。在本系统中,所采用的硬件平台:Pentium 350,128M RAM,全双工声卡,10M以太网卡。软件平台:Windows XP。

开发工具:Visua1 C++ 6.0和RAD vision H.323Stack。终端按其功能可分为3个模块:语音数

据的实时采集和播放模块; 语音数据的自适应压缩和解压模块;网络通信及压缩后的语音包在IP网络的实时传输模块。

其系统层次结构如图4.3所示。

图4.3 语音终端层次结构

4.3.1 语音数据的实时采集和播放模块

我们利用微软的多媒体系统库对wave2form语音进行了处理,通过低阶函数从全双工声卡实时采集和播放语音信号。语音格式为标准PCM格式,如表4.1所示。采样率为8kHz,采集成单通道16位数据,其PCM数据流格式为:对实时采样,使用了双缓冲区轮流采样技术。在当前缓冲区满时,启动另一缓冲区进行语音采集,使得应用程序处理当前语音数据时,驱动程序仍有缓冲区可用,语音采集过程不会产生间断。对实时播放,采用预存储技术解决抖动问题。设置一个预存储量,经解压后的语音包数目达到此数量时,才进行播放。这样可以使语音听起来更为连续和流畅。由于网络状况的限制,尽管我们使用RTP协议以及冗余发送技术,但语音包的丢失还是可能出现。这里我们采用静音填充的方法,用静音包代替丢失的语音数据包[10]。

4.3.2 语音数据的自适应压缩和解压模块

我们根据ITU-T G.723标准,将采样率为8kHz的16位线性PCM码流实时压缩成5.3kbps或6.3kbps的数据流。这两种速率相比,6.3kbps的数据流可提供的语音质量要好些,而5.3kbps的灵活性要强些。目前,基于IPv4、没有QoS(Quality of Service)保证的分组交换网中,网络的状态经常改变。因此,我们提出了语音数据的自适应压缩和解压,根据网络状态动态选择压缩速率。其主要思路是:启动一线程进行网络监测,一旦接收方或发送方发现当前的网络速度不能满足接收方的接收速率,发送方就降低语音的编码速率;一旦网络速率回升到一定程度,接收方将通知发送方增加语音的编码速率,提高其编码质量。解压过程则是根据压缩速率进行语音解压。考虑到本系统的通用性,我们仅是根据网络状态,在6.3kbps和5.3kbps这2个速率间进行动态切换。

4.3.3 网络通信及压缩后的语音包在IP网络的实时传输模块

此模块的建设遵循H.323标准,进行多媒体数据网络通信。现阶段,我们主要采用RADvision H.323 Stack提供的API和通信规程实现语音数据在网络的实时传输。

(1)RADvision H.323Stack简介RADvision H.323协议栈由一系列的API函数组成,用于实现ITU H.323标准。其核心是2个高层的API集,主要由2个相互独立的模块构成:

1)会议管理器(The Conference Manager)-用于实现H.323的核心部分。主要负责对呼叫和信道

的初始化、建立、管理和关闭。就目前而言,协议栈定义了超过300种函数调用,支持H.323中规定的各种基本或扩展的功能。

2)RTP/RTCP-用于实现RTP/RTCP协议的内容,负责语音、视频或其它数据在网络中的实时传输。H.323协议栈与外围的接口如图4.4所示。

图4.4 H.323协议接口

协议栈位于上层应用程序与下层操作系统之间。它通过会议管理器的API函数调用,从应用程序接受或向其发送信息;通过使用RTP/RTCP的API进行数据包在网络中的传输。在应用程序中创建一个H.323实体,需要先激活H.323协议栈的一个实例。在初始化协议栈实例时,协议栈会根据具体的设置对该实例作适当的分配。对象是协议栈的基本实体。具体可分为:协议栈实例(对象),呼叫(对象)和信道(对象)。对象是分级的。一个呼叫可对应一个或多个信道;一个协议栈实例可对应一个或多个呼叫;一个应用程序可以对应一个或多个协议栈实例。每个对象通过句柄来鉴别。

每当产生一个对象,协议栈和应用程序都会交换对象的句柄。这些句柄被用于和该对象有关的函数中。对象用完后,要对其进行消除,以便释放为其分配的内存。当对象被消除后,其对应的句柄也失去了意义。协议栈和应用程序之间的交互是双向的。应用程序通过调用函数与协议栈通信。而协议栈只有在有事件发生时,才通过回调函数向应用程序发送信息[11]。 (2)通信链路的建立及压缩后的语音包

在IP网络的实时传输用协议栈实现网络通信的具体步骤有:初始化;呼叫建立;信道和RTP会话的建立;媒体数据的实时传输;关闭信道和RTP会话;关闭呼叫;释放各对象结束程序。各步骤的主要流程分别如下图4.5。

应用程序

H.323 Stack

网络

开始在Q.931端口侦听TCP连接

设置各种事件句柄及其回调函数

图4.5 初始化流程图

呼叫建立的过程包括被呼叫和主呼叫,各自的主要流程分别如下图4.6和图 4.7

应用程序

H.323 STACK

网络

图4.6 被呼叫流程图

应用程序

H.323 STACK

网络

建立呼叫请求

图4.7 主呼叫流程图

(3)信道和RTP会话的建立呼叫建立完成后,才能建立信道,进行语音、视频或数据的传输。信道建立包括输入信道和输出信道的建立,其各自的主要流程分别如下图4.8和图4.9

应用程序

H.323 Stack

网络

图4.8 输入信道建立的主要流程

应用程序H.323 Stack

网络

图4.9 输出信道建立的主要流程 (4)媒体数据的实时传输

当呼叫、信道、会话都建立完后,网络通信链路就建立起来了。此时,可以开始利用RTP函数集进行媒体数据的实时传输。数据传输分为发送和接收2个同步过程。对于数据的发送首先要根据负载的类型建立RTP数据包,然后就可以进行数据传输,再传输完后还要向RTCP报告。对于数据的接收首先要确定负载数据包的包头格式,然后才进行数据接收。对于事件驱动系统如Windows XP,则是通过回调函数的形式对到来的数据包进行处理。接下来,和发送数据一样,要向RTCP报告。最后是对RTP数据的解包[12][13]。 (5)通话结束后的处理

包括关闭信道和RTP会话;关闭呼叫;释放各对象结束程序等。 4.3.4 语音终端的具体实现流程

综合上述的分析,我们对语音终端进行开发,下面谈谈其在软件上的具体实现方法。该软件从大的方面可分为2个主要的流程:主流程;实时通话过程。主流程图见图4.10,其中实时通话过程又

可分为2个独立的线程:

(1)语音采集、压缩、发送线程;见图4.11 (2)语音接收、解压、播放线程;见图4.12

上述的各个流程分别包括前面提及的一个或多个功能模块实时通话过程包括语音采集、压缩、发送线程和接收、解压、播放线程。

图4.10 主流程图

网络监测线程

图4.11 语音采集、压缩、发送线程

网 络监 测

线 程

图4.12 语音接收、解压、播放线程 4.4 系统运行预算结果

本系统设计运行测试硬件环境为:由两台PC机(Pentium4主频1.5G,内存256MB)所构建的一个通话系统。

网络环境:局域网(10M以太网)

软件环境:在Windows XP操作系统上运行程序,同时在局域网环境下使用以Microsoft NetMeeting(使用H.323协议)构造IP电话兼容平台,进行互联通话测试。

通话过程:分别在两台PC机上启动本系统,通过对方IP地址进行连接呼叫,连接成功后即可进行实时语音通话。运行结果:本系统可以实现基于IP地址的呼叫连接,连接成功率100%,连接成功后可以实现顺畅的语音通话,通话延迟小于200ms,且可以实现反复挂断连接通话。 结 论

基于对H.323协议的研究分析,本文所虚拟构建实现的原型系统在局域网环境下运行稳定、可靠,通话效果良好,并可以与Microsoft NetMeeting实现互联通信,达到了预期效果,从而可实现企业级IP电话系统。

随着科学技术的发展及IP业务的逐渐成熟,相信会有更多的人才会投入到IP电话类的研究当中。高质量,高速度,低成本,简单快捷是未来IP电话系统的趋向。企业IP电话的研究也将会随之进一步改善。

本文仍存在一些需改进的地方,比如可向实现经由网关和关守的多方通信,及实现视频通信功能方向扩展研究;其意义在于为今后对IP电话及多媒体会议通信系统进一步研究奠定了基础和创建了实验的平台。 参 考 文 献

[1] 糜正馄.IP网络电话技术[M].北京:人民邮电出版社.2000:11~13

[2] 苗兰波,冯志勇,吕廷杰.IP电话网络技术[M].北京:电子工业出版社.2001:58~67 [3] 左涛.关于VoIP的几项关键技术的探讨[J].山西电子技术.2000,9(6):15~30 [4] 刘小花,张凤.无线局域网安全技术分析[J].广西通信技术.2004,6 (4):65~66 [5] 刘建兴,王芙蓉.软交换中SIP与H.323电话网的互通实现[J].通信技术.2003,10(1):11~16

[6] 周雪莉.无线局域网上VoIP传输的性能分析与仿真研究[J].2004,6(11):23~25 [7] 吴乐南.PC平台新技术MMX开发编程指南[M].南京:东南大学出版社.2001:57~81 [8] 张登银,孙秸科.VoIP技术分析与系统设计[M].北京:人民邮电出版社.2003:115~121 [9] 王瑞刚,李燕.IP电话终端设备—原理、电路及应用[M].西安:西安电子科技大学出版社.2003:93~106

[10] 朱世华.程控数字交换原理及应用[M].西安:西安交通大学出版社.2004:101~125

[11] Ramamirtham J,Turner J,Friedman J.Design of wavelength converting switches for optical burst switching[J].Selected Areas in Communications IEEE.2003,21(7):122~153 [12] Andrew S.Tanenbaum.Computer Networks[M].Prentice Hall.2003:48~82 [13] Bellamy J.Digital Telephony[M].Chapman&Hall.2001:91~115

摘 要

近年来,计算机网络的迅速发展给全球的各个方面都带来了巨大的变化。其中,基于IP网络的语音通信方式为人们的远距离交流提供了一种价格低廉的途径,结束了传统电信领域中电路交换方式一统天下的局面。本文介绍了在分组交换网上构建多媒体通信系统的标准—H.323协议,H.323协议经过不断的完善和改进,目前己经成为了IP电话体系中应用最广也最成熟的标准,文中对IP电话的技术特点和系统构成进行了研究。IP电话与传统电话的根本区别在于它们采用了不同的交换技术,本文在此基础上分析了IP电话的优势及存在的问题,并对其中的关键技术及相关协议作了阐述和比较,从而实现了企业级IP电话系统。

关键词: IP电话; H.323;分组交换网络;网络通讯

Abstract

In recent years, Computer network's rapidly expand has brought the huge change for global each aspect. And, has provided one kind of low in price based on the IP network's voice communication way for people's long-distance range exchange way. Has ended the aspect which in the traditional telecommunication domain the circuit switching way monopolizes., This article introduced in the packet switching on-line construction multimedia communications system's standard - H.323 agreement, the H.323 agreement undergoes the unceasing consummation and improves. At present oneself passed through into the IP telephone system to apply the broadest also maturest standard, In the article carried on to the IP telephone's technical characteristic and the system constitution has studied. The IP telephone and the traditional telephone's basic difference lay in them to use different exchange technology, This article has based on this analyzed the IP telephone's superiority and the existence question And has made the elaboration and the comparison to key technologies and the related agreement, thus has realized the enterprise IP telephone system.

Keywords: Enterprise IP telephone; H.323; PBN; Network communication.

引 言

目前国内企业的长话方案大多采用长话直拨或IP电话两种模式,企业分公司之间的语音通信,企业人员外出与各分公司的语音通信占据了企业总话费开支的绝大部分。对于已经建立了企业内部网络的企业来说,如果可以利用内部网络实现语音通信,无疑可以节省一大笔费用。多数已经接人到Internet的企业有可靠的带宽保障,为实现因特网的语音技术VoIP方案提供了基础。把企业所有分支机构的PSTN网与企业内部LAN连接起来,由于Internet费用与地域无关,网络费用总支出固定不变,利用VoIP实现语音通信,节省了原来需要通过PSTN网的电话费用。多数的IP呼叫都通过PSTN接入IP电话网,这是目前各IP电话运营商共有的业务模式,他们必须租用PSTN公中继线才能开展业务。目前在固定和卡类用户趋于稳定的情况下,企业IP电话又表现出巨大的市场潜力。

第一章 绪 论

1.1 课题背景

近年来,基于TCP/IP协议簇的因特网在高速发展,它将丰富的讯息带入了人们的生产生活中,也推动了IP网络的大规模建设和发展。随着其覆盖范围的不断扩大,网络性能的不断提高,IP网络已经在全球范围内构筑起了一个可以实现信息互通的统一平台。它不仅可以承载数据业务,也将语音、视频等多媒体信息一步步地融入其中。可以说,IP网络电话的诞生是以IP为标志的网络分组化和以多媒体为目标的网络业务综合化两大主流技术相融合的结果。

目前,在构建IP电话系统时应用最为广泛也是最为成熟的标准是H.323协议.它与相关的支持协议一起,为多媒体信息的编码、通信过程中呼叫和媒体信道的控制以及媒体流的传输方式等内容制定了统一的规范,适用于构建任意规模的IP电话系统。事实上,国际上几乎所有的商业性IP电话网都是以H.323为基础的。在我国,信息产业部为开放IP电话业务正式颁布的《IP电话砖真业务总体技术要求》等标准规范中也明确指出,选择H.323为我国VoIP体制的基础。

1.1.1 研究目的及意义

众所周知,当前全球Internet己经成为仅次于传统公用电话交换网的第二大通信网络。由于Internet本身的技术先进性、网络容量的高利用率和极强的可扩展性,使其较PSTN更加具有发展潜力。自从1995年年初,以色列VocalTec公司研制出可以通过Internet打长途电话的软件产品“Internet Phone”以来,IP电话就受到了各方面的重视,之所以受到重视正是因为IP网固有的优点也就是我们研究它的意义:

(1)价格低廉

这是IP电话进入市场的首要因素,IP电话均采用压缩话音编码和分组统计复用技术,带宽利用率高。运营商都是采用租线方式运营,其成本核算和计费方法与传统电信运营商不同。

(2)可以灵活的提供各种增值业务

价格优势是IP网络电话进入市场的原始推动力,而增值业务才是IP电话的发展的真正动力。IP电话都是智能终端,IP网络是开放式网络,其固有的分布式计算机网络环境很容易快速的推出新业务。而传统的电话网想推出一项增值业务则往往比较困难,甚至无法推出某些业务。

IP电话增值业务非常多和灵活,H.323系统补充业务由H.450系列建议定义。其中,H.450.1定义了适用于各种补充业务控制的通用功能协议,目前共定义了7种补充业务:呼叫转交,呼叫转移,呼叫保持,呼叫迁移和代答,呼叫等待,报文等待指示,名字标识等[1]。

(3)有利于企业建立高效综合服务内部网

IP网路电话引入企业网后,可以将数据网和电话网合一,可以很容易的在以有的数据平台上加入话音信箱,交互式语音提示,自动话务员等功能,构筑计算机电话集成系统,这些仅需加入相应的软件便可应用。

(4)有利于运营商开拓新的市场

随着Internet的发展,许多Internet服务提供商应运而生,但他们仅是提供接入服务,没有提供实质性的业务,多处于亏损状态。IP电话推出后,他们可以很方便的将网络电话业务与接入服务结合起来,增加运营收入。

(5)有助于核心技术的融合,促进网络技术的发展

IP电话系统广泛的采用了语音编码压缩技术,使用算法很多。可以达到PCM 编码的1/10,可使长途干线不增加设备而能力增加10倍。还有目前正大力开发的宽带接入技术,如电缆调制解调器和高速数字用户线技术(xDSL),为IP电话的推广开创了很好的技术条件。

(6)可以使我国通信技术缩短与世界先进水平的距离

由于历史的原因,我国的通信技术相与世界的先进水平一直存在距离,我国电信市场长期被外国企业占去大半,而IP电话是世界范围的一个新热点,由于近些年我国通信技术也已有了很多积累,已具备了一定的开发和竞争能力,在IP电话技术上与国外的起点和差距不是很大,信息产业化是我国“九五”计划的重点,我们可以抓住机遇同步的发展。

1.2 IP电话的发展现状

IP网络电话技术经过这几年的迅猛发展,已经取得了很大的成功,包括我国在内的许多国家都相继建立了实验网,并投入了运营,基本取得了预想的效果。因此网络设备和通信设备制造商、通信业务运营商以及ISP都渴望在IP电话市场中取得立足之地。各制造商的IP电话产品纷纷进入市场,各运营商也纷纷开展了IP电话业务。但是目前已存在的IP网络电话系统一般都只提供最基本的Phone to Phone的通话能力,这远远没有把IP网络电话的潜在优势发挥出来。从技术角度来说,虽然H.323、SIP等相关协议己经发布,但IP网络电话技术并不完善,有待研究的问题还很多,例如基于H.323/SIP协议的网络体系结构方案问题、各协议间的互通问题、网络运营问题、安全问题、网络管理问题、服务质量问题、三网融合问题、增值业务实现问题等等。因此目前的IP网络电话只不过是它迈出的第一步,最终的目标是完全融合各类网络,建立集成的服务网络[2]。

第二章 IP电话的原理技术

2.1 IP电话的基本原理

IP电话又称网络电话(VoIP)和Internet电话.是利用Internet作为传输载体实现通话的一种先进手段IP电话是指利用数据网络(例如Internet),通过IP协议来传递语音的一种通信方式。与IP电话有关的硬件设备主要是配置有语音压缩卡和接口卡的网关(Gateway),网关同时连入PSTN(公用电话交换网)和数据网,网关可以存储用户管理信息以及路由信息。也可以将这些信息单独存储在关守(Gatekeeper)中,关守与网关同时连人数据网,这样关守与网关可以通过具体的通信协议(例如H.323)进行信息交互。网关主要实现语音数据与IP数据包的互换.而关守是用来验证用户身份以及进行路由寻径。即用户首先通过普通电话网拨打设在本地或某一特定地点的IP电话网关.网关将用户送来的话音经压缩编码,打成一定长度的IP包后经过与关守的交互。来完成用户身份验证和路由寻径.然后将IP包通过数据网传送到被叫用户所在地的网关被叫用户所在地网关经过解压缩等相反的过程,将数据包还原成话音信号送到市话网,拨通被叫用户。

H.323协议为该系统定义了四个主要组成部分:终端(Ter_mina1)、网关(Gateway)、关守(Gatekeeper)和多点控制单元(MCU)(含多点控制器(MC)、多点处理器(MP))。

(1)终端:是指IP电话的客户终端。是系统中能提供实时双向通信的节点设备,它必须支持H.245标准,对控制信道和呼叫信道提供可靠的端到端服务。同时对音频信道和用于传递登记、许可、带宽变化及状态信息的RAS信道提供不可靠的端到端服务。

(2)网关:是通过IP网络提供电话到电话、PC到电话的话音通信关键设备.是IP网络与PSTN/PBX网络之间的接口设备。网关主要用来在不同的ITU标准之间进行协议翻译、语音信号处理(编码/解码.压缩/解压缩等)、传输控制(RTP/RTCP)和系统控制,建立网络连接并完成语音信息传输。

(3)关守:又称作网络管理者或关闸,为了保证在网络上可靠地传送语音信息,设置的独立功能模块,它是IP电话系统中的逻辑交换机,IP电话系统中所有的接点设备都要在关守上登记注册,并且以它作为所有语音信息流和控制流的中介点,以实现运输层地址翻译、用户接入认证、安全管理、呼叫控制与管理、带宽控制与管理、区域管理和计费管理等。

(4)多点控制单元:它在两个用户进行通信时,完成用户数据流的连接和语音信息流的混合。它通常由一个多点控制器(MC)和几个多点处理器(MP)组成。MC处理终端之间的H.245控制信息,进行终端对音频和视频处理能力的管理。MP处理来自终端的多媒体信息流。对音频视频或数据信息流进行混合、切换和处理。

IP电话的主要技术

在普通电话之间进行IP语音通信,必须通过在PBX之问架构网关来实现。IP电话网关采用了分层模块化结构,可以分为硬件层、软件模块层、维护管理层、控制接口层几个部分。软件模块层又包括语音信号处理、PSTN呼号控制、IP呼叫管理、IP呼叫控制、数据传输、DSP管理软件包

等。其中语音信号处理包含了语音编解码、回波抵消和DTMF检测功能[3]。

(1)语音压缩技术IP电话技术的基础是语音压缩技术。1.TU(国际电联)批准了一个语音压缩G.729标准,G.729标准采用的算法,可以仅用8kbps传输话音,话音质量与32kbpsAD—PCM(差分脉冲编码调制)(G.724)相同。现在G.729标准是最重要的话音压缩标准.目前G.723/G.723.1标准使用也比较广泛。

(2)静音抑制技术静音抑制技术能够保证语音质量并节省带宽。在一段对话中,约60%是字和句子之问的停顿。除去这些停顿.只保留语言部分。能够大量节省宝贵的带宽。

(3)话音抖动处理技术IP网络的一个特征就是网络延时与网络抖动,这将导致IP电话音质下降。网络延时是指一个IP包在网络上传输时间的长短变化。为了防止抖动,目前主要采用抖动缓冲技术。即在接受方设定一个缓冲池,话音包到达时首先进入缓冲池暂存.系统以稳定平滑的速度将话音包从缓冲池中取出、解压、播放给受话者。在一定程度上有效处理话音抖动、并提高音质。

(4)话音优先技术话音通信实时性要求较高。为了保证提高音质的IP电话通信,在广域网带宽不足的IP网络上,一般需要话音优先技术在IP网络路由器中设定话音包的优先级为最高。这样路由器一旦发现话音包,就会将他们插入到IP包队列的最前面优先发送,目前几乎所有品牌的路由器均支持这一优先级技术。这样。网络的延时与抖动情况对话音通信的影响均得到改善今天的技术可达到:每天平均每条话音中继线的通信量仅占1kbps至2kbps为64kbps广域网带宽的3%。

(5)VoIP前向纠错技术(Forward Error Correction,FEC)公共Internet网络往往有较高的丢失包率,这不足以维持高质量的话音通信。FEC技术就能发挥重要作用。FEC技术有两级,第一级是在同一包内加冗余数据。以便接收方纠错、恢复、还原话音数据。保证音质:第二级是在第一个话音包中存放后续包冗余数据。以便接收方从已经接收到的包中恢复出错或丢失的话音包。

2.3 IP电话的有关标准

标准是任何一项新技术与新业务的广泛推广与使用的重要基础。H.323协议是最早被采纳的VoIP标准,H.323协议已经在网上得到广泛应用。国际上如ITXC和AT&T,国内如中国电信、中国联通等均采用H.323的体系结构组建IP电话运营网[4]。

(1)在H.323终端上的音频编码/解码器必须能够具有G.711标准所规定的语音信号编码/解码能力。也可以符合G.722、G.723.1、G.728、G. .729和MPEG1等音频信号处理标准。即系统中的终端、网关和MCU必须支持G.711标准,其余任选。并可以通过能力协商而采用其它编码形式H.323终端的编码,解码能力可以是非对称的。如允许以G.711处理发送,以G.729处理接收。

(2)H.323协议的系统控制包括:H.245控制、Q.931呼叫信号控制和RAS控制。H.245控制信道是一个可信通道.用来承载控制信息用以对H.323实体的操作。这些控制包括:性能交换、打开或关闭逻辑通道、优先级请求、流程控制信息以及基本的命令的指示等呼叫信号通道利用Q.931在两个终端间建立连接。RAS规定了在两个H.323组件之间(如终端和关闸之间)建立RAS信号通道,完成注册、访问权限、带宽改变及状态更新所需要的信号。

(3)实时传输协议(RTP)声音、视频及数据的实时传输协议,RTP作用于IP的上层。它对于每一个音频或视频的UDP报文分组前加上一个包含时标和序号的报文头。若在接收端设置适当的缓冲,则可实现利用时标和序号信息按优先级复原报文分组、记录失序报文分组和同步语音数据,使得音频和视频的实时传送及同步得到保证。

(4)实时控制协议(RTCP)RTCP用于对RTP的控制,它监视语音报文分组的传输服务质量和网上的信息,定期把包含服务质量信息的控制信息报文分组发送给网络上的各个结点。

(5)支持带宽预留协议(RSVP)在IP网上为一个音频传输呼叫保留足够的带宽是很困难的。RSVP提供按需分配的预留带宽,它允许接收端为某个音频信息流申请一定数量的带宽,并给出传输路径上个网络设备对于申请的确认。RSVP不是H.323建议的正式组成部分,但是要求IP电话产品必须支持它。RSVP的实现需要得到终端、网关、多点处理单元以及IP网络中所有路由器和交换机的支持。

第三章 协议与标准

目前,VoIP方面的主要协议有:H.323、SIP(Session Initiation Protocol,会话发起协议)、MGCP(Media Gateway Control Protocol,媒体网关控制协议)、H.248(H.GCP)。H.323和SIP是两大电话体系,二者是完全平行的,它们能实现的信令功能基本相同,也都利用RTP(Real Time Protocol)作为媒体传输的协议,但两者的设计风格截然不同,因此也不可能相互兼容。

3.1 H.323协议

H.323是ITU—T的多媒体通信协议系列中的一个,它提供了基于分组网络传送音频、视频和数据的基本标准。其结构如图3.1所示。H.323支持点对点通信及在MCU支持下的点对多点通信,作为一个协议框架,H.323提供了系统及组成部分描述、呼叫方式描述及呼叫信令程序。H.323的协议包括H.261、H.263视频编码标准、C.711、C.722、C.723音频编码标准、T.120多点数据会议系列标准、H.225.0分组和同步标准、H.245系统控制标准等。H.323提供设备之问、高层应用之问和提供商之间的互操作性。它不依赖于网络结构,独立于操作系统和硬件平台,支持多点功能、组播和带宽管理。H.323具备相当的灵活性,支持包含不同功能的节点之问的会议和不同网络之问的会议。H.323建议的多媒体会议系统中的信息流包括音频、视频、数据和控制信息。信息流采用H.225.0建议方式来打包和传送[5]。

图3.1 H.323协议框架

3.2 SIP协议

SIP是由IETF提出的VoIP信令协议。SIP用于发起会话,它能控制多个参与者参加的多媒体会话的建立和终结,并能动态调整和修改会话属性,如会话带宽要求、传输的媒体类型(语音、视频和数据等)、媒体的编解码格式、对组播和单播的支持等。

SIP在设计上充分考虑了对其他协议的扩展适应性。它支持许多种地址描述和寻址,包括:用户名@主机地址、被叫号码@PSTN网关地址和普通电话号码(如Tel:010—62281234)的描述等。这样,SIP主叫按照被叫地址,就可以识别出被叫是否在传统电话网上,然后通过一个与传统电话网相连的网关向被叫发起并建立呼叫。

SIP的最强大之处就是用户定位功能。SIP本身含有向注册服务器注册的功能,也可以利用其他定位服务器如DNS、LDAP等提供的定位服务器来增强其定位功能[6]。

3.3 MGCP与H.248/MEGACO协议

MGCP与H.323和SIP并不属于同一层面。MGCP不涉及IP电话的体系结构,只涉及网关分解问题,因而它不仅可以用于H.323 IP电话系统,也可以用于SIP的IP电话系统。其次,在网关分解方

面,IETF和ITU—T配合得很好。在两大组织直辖下,目前一个正式标准已经完成,这就是H.248建议/MACOGO。H.248将MGCP大大推进了一步。应该说H.248建议已经取代了MGCP,成为MGC与MG之问的协议标准了,只不过商业化的实现还很少。

3.4 IP电话协议比较

由于H.323推出较早,协议发展得比较成熟,且采用了电信网的呼叫信令和信道控制的概念,因此成为目前商用IP电话系统,特别是骨干IP电话系统的主流技术。H.323建议的缺点是过于复杂,从而造成基于H.323建议的IP电话系统也过于复杂。

SIP的部分优点包括:该协议具有可扩展特性,可以轻松定义并迅速实现新功能。可以简单易行地嵌入廉价终端用户设备。该协议可确保互操作能力,并使不同的设备进行通信。

SIP的缺点包括:SIP问世不久,因此大多数应用尚处于原型阶段。该协议单独应用的范围较窄。但与其他协议协同使用时,具有较强的灵活性。SIP只是完整解决方案的一小部分,还需要许多其他的软件来构建完整的IP电话产品。

我国选择H.323作为构建商用IP电话网的基础。即选择H.323作为VoIP体制的基础标准,并跨过MGCP,直接采用H.248作为网关设备标准,事实上,H.323+H.248是构建电信级VoIP的最快的策略。所以,本文也选择H.323作为企业级IP电话网的基础。

第四章 系统设计与实现

4.1系统概述

基于实验和研究的目的,本文实现了一个在局域网环境下PC到PC的IP电话软件系统。该系统基于H.323协议,主要实现了信令呼叫,媒体信道控制,及语音压缩、编码、传输等功能,语音编码采用G723.1标准。系统的开发环境为Windows2000平台.开发工具采用Visual C++6.0。实现后的系统可与符合H.323标准的其他IP电话软件(如微软的Netmeeting)进行互联通话。

4.2系统架构

本系统结构如图4.1所示:

图4.1系统结构图

本系统分为上层和底层两大部分[7]。

上层主要完成如下功能:

(I)参数设置:可以设定连接的IP地址.最大呼叫次数,语音采集与回放参数。

(2)操作控制:进行启动连接(停止连接)、开始语音回放(停止回放)、开始语音采集发送(停止采集发送)以及静音的操作。

(3)状态显示:在系统运行界面上显示当前通话连接状态,包传输速率等。系统的主要功能是在底层实现的。底层由如下4个模块组成。

4.2.1 呼叫连接控制模块

H.225.0和H.245是H.323系统的核心协议.前者主要用于呼叫控制,后者用于媒体信道控制。在H.323中.呼叫指的是两个端点之间的一种点到点的联系。在任何呼叫开始之前,首先必须在

端点之间建立呼叫联系,同时建立H.245控制信道,这就是H.225呼叫信令协议的主要功能。一个最简单的基本呼叫建立信令过程如图3所示。端点1(主叫端点)首先根据端点2的IP地址和呼叫信令信道公认TCP端口号(1720)建立至端点2的TCP连接,即建立起可靠的呼叫信令通道,然后在此信道上发送Setup消息,其后端点2回应Call proceeding表示呼叫号码已全,呼叫过程启动,然后是Alerting表示正在提醒被叫用户(响铃),等待用户应答。在最后的Connect消息的UUIE中,端点2回送H.245控制信道的TCP端口号,建立起H.245控制信道。

图4.2 基本呼叫建立过程

在H.323多媒体通信系统中,控制信令和数据流的传送利用了面向连接的传输机制。在IP协议栈中,IP与TCP协作,共同完成面向连接的传输。可靠的传输保证了数据包传输时的流量控制、连续性以及正确性,但也可能引起传输时延以及占用网络带宽[8]。

4.2.2 语音采集模块

该模块用来采集语音数据,将模拟语音信号转换为数字信号,在程序中为了减少通话的延迟时间,直接分配内存块,将采集的数据放在内存块中,以便压缩或传输。对语音的采集是通过调用声卡的API函数来完成。在本系统中语音的采样格式为WAVE—FORMAT_PCM,单声道,采样率为8K。样本量化率为16位,即每秒的语音数据有16K字节。然后再采用G.723.1标准对声音进行压缩编码,并将编码后的数据写入发送缓存区,由网络发送模块分割、封装打包,发送到网络上。速率为5.3—6.4kbps[9]。

4.2.3 语音回放模块

该模块实现的功能有:

(1)语音包的接收和缓存:接收监听模块接受到通话对方发送来的语音数据包后,送缓冲区缓存。

(2)排序:数据包在缓冲区中将按RTP序号进行排序。

(3)解码:对压缩的数据包进行解码,

(4)放音:满足上层所设定的延迟时间的要求.同时满足双工要求。

4.2.4 底层网络连接模块

本系统采用开放的Openh323协议堆栈作为协议实现接口,该协议栈以Socket套接字实现底层的网络传输控制层协议,即通过TCP协议发起呼叫连接、进行媒体能力协商,并使用基于UDP的RTP协议实现语音数据的流媒体传输且通过不同的端口实现双向语音数据传输。

4.3 语音终端及其实现方案

语音终端(以下简称终端)由计算机构成。在本系统中,所采用的硬件平台:Pentium 350,128M RAM,全双工声卡,10M以太网卡。软件平台:Windows XP。

开发工具:Visua1 C++ 6.0和RAD vision H.323Stack。终端按其功能可分为3个模块:语音数

据的实时采集和播放模块; 语音数据的自适应压缩和解压模块;网络通信及压缩后的语音包在IP网络的实时传输模块。

其系统层次结构如图4.3所示。

图4.3 语音终端层次结构

4.3.1 语音数据的实时采集和播放模块

我们利用微软的多媒体系统库对wave2form语音进行了处理,通过低阶函数从全双工声卡实时采集和播放语音信号。语音格式为标准PCM格式,如表4.1所示。采样率为8kHz,采集成单通道16位数据,其PCM数据流格式为:对实时采样,使用了双缓冲区轮流采样技术。在当前缓冲区满时,启动另一缓冲区进行语音采集,使得应用程序处理当前语音数据时,驱动程序仍有缓冲区可用,语音采集过程不会产生间断。对实时播放,采用预存储技术解决抖动问题。设置一个预存储量,经解压后的语音包数目达到此数量时,才进行播放。这样可以使语音听起来更为连续和流畅。由于网络状况的限制,尽管我们使用RTP协议以及冗余发送技术,但语音包的丢失还是可能出现。这里我们采用静音填充的方法,用静音包代替丢失的语音数据包[10]。

4.3.2 语音数据的自适应压缩和解压模块

我们根据ITU-T G.723标准,将采样率为8kHz的16位线性PCM码流实时压缩成5.3kbps或6.3kbps的数据流。这两种速率相比,6.3kbps的数据流可提供的语音质量要好些,而5.3kbps的灵活性要强些。目前,基于IPv4、没有QoS(Quality of Service)保证的分组交换网中,网络的状态经常改变。因此,我们提出了语音数据的自适应压缩和解压,根据网络状态动态选择压缩速率。其主要思路是:启动一线程进行网络监测,一旦接收方或发送方发现当前的网络速度不能满足接收方的接收速率,发送方就降低语音的编码速率;一旦网络速率回升到一定程度,接收方将通知发送方增加语音的编码速率,提高其编码质量。解压过程则是根据压缩速率进行语音解压。考虑到本系统的通用性,我们仅是根据网络状态,在6.3kbps和5.3kbps这2个速率间进行动态切换。

4.3.3 网络通信及压缩后的语音包在IP网络的实时传输模块

此模块的建设遵循H.323标准,进行多媒体数据网络通信。现阶段,我们主要采用RADvision H.323 Stack提供的API和通信规程实现语音数据在网络的实时传输。

(1)RADvision H.323Stack简介RADvision H.323协议栈由一系列的API函数组成,用于实现ITU H.323标准。其核心是2个高层的API集,主要由2个相互独立的模块构成:

1)会议管理器(The Conference Manager)-用于实现H.323的核心部分。主要负责对呼叫和信道

的初始化、建立、管理和关闭。就目前而言,协议栈定义了超过300种函数调用,支持H.323中规定的各种基本或扩展的功能。

2)RTP/RTCP-用于实现RTP/RTCP协议的内容,负责语音、视频或其它数据在网络中的实时传输。H.323协议栈与外围的接口如图4.4所示。

图4.4 H.323协议接口

协议栈位于上层应用程序与下层操作系统之间。它通过会议管理器的API函数调用,从应用程序接受或向其发送信息;通过使用RTP/RTCP的API进行数据包在网络中的传输。在应用程序中创建一个H.323实体,需要先激活H.323协议栈的一个实例。在初始化协议栈实例时,协议栈会根据具体的设置对该实例作适当的分配。对象是协议栈的基本实体。具体可分为:协议栈实例(对象),呼叫(对象)和信道(对象)。对象是分级的。一个呼叫可对应一个或多个信道;一个协议栈实例可对应一个或多个呼叫;一个应用程序可以对应一个或多个协议栈实例。每个对象通过句柄来鉴别。

每当产生一个对象,协议栈和应用程序都会交换对象的句柄。这些句柄被用于和该对象有关的函数中。对象用完后,要对其进行消除,以便释放为其分配的内存。当对象被消除后,其对应的句柄也失去了意义。协议栈和应用程序之间的交互是双向的。应用程序通过调用函数与协议栈通信。而协议栈只有在有事件发生时,才通过回调函数向应用程序发送信息[11]。 (2)通信链路的建立及压缩后的语音包

在IP网络的实时传输用协议栈实现网络通信的具体步骤有:初始化;呼叫建立;信道和RTP会话的建立;媒体数据的实时传输;关闭信道和RTP会话;关闭呼叫;释放各对象结束程序。各步骤的主要流程分别如下图4.5。

应用程序

H.323 Stack

网络

开始在Q.931端口侦听TCP连接

设置各种事件句柄及其回调函数

图4.5 初始化流程图

呼叫建立的过程包括被呼叫和主呼叫,各自的主要流程分别如下图4.6和图 4.7

应用程序

H.323 STACK

网络

图4.6 被呼叫流程图

应用程序

H.323 STACK

网络

建立呼叫请求

图4.7 主呼叫流程图

(3)信道和RTP会话的建立呼叫建立完成后,才能建立信道,进行语音、视频或数据的传输。信道建立包括输入信道和输出信道的建立,其各自的主要流程分别如下图4.8和图4.9

应用程序

H.323 Stack

网络

图4.8 输入信道建立的主要流程

应用程序H.323 Stack

网络

图4.9 输出信道建立的主要流程 (4)媒体数据的实时传输

当呼叫、信道、会话都建立完后,网络通信链路就建立起来了。此时,可以开始利用RTP函数集进行媒体数据的实时传输。数据传输分为发送和接收2个同步过程。对于数据的发送首先要根据负载的类型建立RTP数据包,然后就可以进行数据传输,再传输完后还要向RTCP报告。对于数据的接收首先要确定负载数据包的包头格式,然后才进行数据接收。对于事件驱动系统如Windows XP,则是通过回调函数的形式对到来的数据包进行处理。接下来,和发送数据一样,要向RTCP报告。最后是对RTP数据的解包[12][13]。 (5)通话结束后的处理

包括关闭信道和RTP会话;关闭呼叫;释放各对象结束程序等。 4.3.4 语音终端的具体实现流程

综合上述的分析,我们对语音终端进行开发,下面谈谈其在软件上的具体实现方法。该软件从大的方面可分为2个主要的流程:主流程;实时通话过程。主流程图见图4.10,其中实时通话过程又

可分为2个独立的线程:

(1)语音采集、压缩、发送线程;见图4.11 (2)语音接收、解压、播放线程;见图4.12

上述的各个流程分别包括前面提及的一个或多个功能模块实时通话过程包括语音采集、压缩、发送线程和接收、解压、播放线程。

图4.10 主流程图

网络监测线程

图4.11 语音采集、压缩、发送线程

网 络监 测

线 程

图4.12 语音接收、解压、播放线程 4.4 系统运行预算结果

本系统设计运行测试硬件环境为:由两台PC机(Pentium4主频1.5G,内存256MB)所构建的一个通话系统。

网络环境:局域网(10M以太网)

软件环境:在Windows XP操作系统上运行程序,同时在局域网环境下使用以Microsoft NetMeeting(使用H.323协议)构造IP电话兼容平台,进行互联通话测试。

通话过程:分别在两台PC机上启动本系统,通过对方IP地址进行连接呼叫,连接成功后即可进行实时语音通话。运行结果:本系统可以实现基于IP地址的呼叫连接,连接成功率100%,连接成功后可以实现顺畅的语音通话,通话延迟小于200ms,且可以实现反复挂断连接通话。 结 论

基于对H.323协议的研究分析,本文所虚拟构建实现的原型系统在局域网环境下运行稳定、可靠,通话效果良好,并可以与Microsoft NetMeeting实现互联通信,达到了预期效果,从而可实现企业级IP电话系统。

随着科学技术的发展及IP业务的逐渐成熟,相信会有更多的人才会投入到IP电话类的研究当中。高质量,高速度,低成本,简单快捷是未来IP电话系统的趋向。企业IP电话的研究也将会随之进一步改善。

本文仍存在一些需改进的地方,比如可向实现经由网关和关守的多方通信,及实现视频通信功能方向扩展研究;其意义在于为今后对IP电话及多媒体会议通信系统进一步研究奠定了基础和创建了实验的平台。 参 考 文 献

[1] 糜正馄.IP网络电话技术[M].北京:人民邮电出版社.2000:11~13

[2] 苗兰波,冯志勇,吕廷杰.IP电话网络技术[M].北京:电子工业出版社.2001:58~67 [3] 左涛.关于VoIP的几项关键技术的探讨[J].山西电子技术.2000,9(6):15~30 [4] 刘小花,张凤.无线局域网安全技术分析[J].广西通信技术.2004,6 (4):65~66 [5] 刘建兴,王芙蓉.软交换中SIP与H.323电话网的互通实现[J].通信技术.2003,10(1):11~16

[6] 周雪莉.无线局域网上VoIP传输的性能分析与仿真研究[J].2004,6(11):23~25 [7] 吴乐南.PC平台新技术MMX开发编程指南[M].南京:东南大学出版社.2001:57~81 [8] 张登银,孙秸科.VoIP技术分析与系统设计[M].北京:人民邮电出版社.2003:115~121 [9] 王瑞刚,李燕.IP电话终端设备—原理、电路及应用[M].西安:西安电子科技大学出版社.2003:93~106

[10] 朱世华.程控数字交换原理及应用[M].西安:西安交通大学出版社.2004:101~125

[11] Ramamirtham J,Turner J,Friedman J.Design of wavelength converting switches for optical burst switching[J].Selected Areas in Communications IEEE.2003,21(7):122~153 [12] Andrew S.Tanenbaum.Computer Networks[M].Prentice Hall.2003:48~82 [13] Bellamy J.Digital Telephony[M].Chapman&Hall.2001:91~115


相关内容

  • 大学毕业论文医学论文英语摘要的写作及难句翻译
  • [摘要]根据自己在编审医学论文英文摘要工作中的实际经验,总结和归纳在翻译医学论文摘要时应注意的问题及使用的方法.策略,重点论述医学论文英文摘要的写作格式.文章标题的表达方式.语态和时态的使用.长难句翻译等. [关键词]医学论文:英语摘要:写作:翻译 为繁荣医学教育,提高医疗水平,传播医学知识,促进同 ...

  • 学年论文要求(财务软件)
  • 学年论文 一. 实训.实习的目的和任务 学年论文是在学完专业基础课和部分专业课的基础上,运用所学的理论知识并与社会实践初步结合而撰写的.撰写学年论文,不仅可以巩固和深化已学的专业知识,总结和检查三年来的学习成果,而且还有助于学生了解学术动态,拓宽知识领域,培养学生阅读文献.独立思考.独立工作,以及分 ...

  • 4-科技论文摘要翻译%20-%20学生
  • 科技论文摘要翻译 一.教学目的:使学生掌握科技论文摘要翻译的基本方法. 二.教学重点:重点讲解科技论文摘要翻译的词法方面和句法方面. 三.教学程序:教师先做讲解后跟学生一起讨论,再安排学生做课堂练习,之后与学生一起 对其课堂练习分析评论. 四.授课时间:2课时 五.教学内容: 科技论文摘要是根据论文 ...

  • 网络工程专业毕业设计(论文)撰写及排版规范
  • 长春工业大学计算机科学与工程学院 网络工程专业毕业设计(论文)撰写及排版规范 (2013.6.3修订讨论稿) 大学本科学位论文集中反映了学生在学期间的主要研究成果和学术水平,是学校授予学位的重要依据.为了提高网络工程专业本科学位论文撰写质量,依据长春工业大学毕业设计(论文)规范化要求,特整理形成网络 ...

  • 本科毕业论文(设计)学生手册及格式规范
  • 本科毕业论文(设计)学生手册 目录 本科毕业论文(设计)学生守则 „„„„„„„„„„„„„„„„„„„„„„„„„„„„1 本科毕业论文(设计)工作程序 „„„„„„„„„„„„„„„„„„„„„„„„„„„„2 本科毕业论文(设计)撰写规范 „„„„„„„„„„„„„„„„„„„„„„„„„„„ ...

  • 毕业论文(设计)容易出现的问题
  • 毕业论文易出现的问题 (数学.信本专业) 1. 各种文件装订顺序较乱,要求按学校统一的顺序装订. 2. 部分论文(设计)评阅与答辩时间在同一天(欠妥). 3. 指导教师的信息没有填写完整.或者填写错误. 4. 答辩委员会主任没有签字. 5. 答辩记录写得太简单,无实质内容. 6. 摘要与关键词的字体 ...

  • 本科毕业论文参考文献外文翻译格式要求
  • 本科毕业论文(设计)文献综述和外文翻译撰写要求与格式规范 (2007年5月修订) 一.毕业论文(设计)文献综述 (一)毕业论文(设计)文献综述的内容要求 1.封面:由学校统一设计,普通A4纸打印即可. 2.正文 综述正文部分需要阐述所选课题在相应学科领域中的发展进程和研究方向,特别是近年来的发展趋势 ...

  • 江苏大学毕业设计(论文)内容要求2016
  • 毕业设计(论文) (Graduation Project (Thesis)) 课程编号:03360070 学 分:12 学 时:12周 先修课程:所有课程 适用专业:机械设计制造及其自动化专业 教 材:各课题.指导老师指导的参考文献.英文文献(翻译) 开课学院:机械工程学院 一.毕业设计(论文)目的 ...

  • 加拿大期刊介绍表_1_
  • 加拿大学术期刊 出版者: 1.Canadian Academy of Oriental and Occidental Culture (CAOOC) 加拿大东西方文化交流学院 2.Canadian Research & Development Center of Sciences and C ...

  • 毕业论文(设计)基本要求
  • 毕业论文(设计)基本要求 (2004年10月修订) 一. 毕业论文(设计)资料装订要求 一套完整的毕业论文(设计)资料包括从选题到答辩结束的所有物化的材料,主要由外文翻译.文献综述.开题报告.毕业论文(设计)四部分组成,并按统一格式编写. 每份毕业论文(设计)资料单独成袋.文献综述.译文及原件复印件 ...