档案信息化工作相关术语
电子政务(Electronic Government)
是指政府运用信息技术打破政府部门之间的界限,开发应用信息资源,调动人力资源信息潜能,建立与之相适应的组织模式、管理方式和工作流程,推进政务管理现代化建设,并为公众提供贴近式优质服务的过程。据此构建一个全面电子化的虚拟政府,既可以使公民、法人从电子化的渠道最大限度地获得政府的信息与服务;又 可以借助互联网强大的信息收集和传递能力大大增强政府收集信息、传递政策信息的能力,从而有助于政府协调和控制各种社会活动的职能,使政府行政信息化、规范化、网络化,最终实现行政自动化、政务公开化、管理一体化和决策科学化。
电子商务(Electronic Business)
电子商务就是指利用电子计算机及计算机网络进行的商务活动。包括市场调查与分析、客户联系、资金流动、物资管理与流动等。严格的定义是:电子商务是通过数字通信进行商品和服务的买卖以及资金的转账,还包括公司间和公司内可实现的商务活动使用以及利用E-MAIL、EDI、文件传送、传真、电视会议、工作流 或与远程计算机(包括WWW)进行交互的全部功能(如市场营销,金融,制造销售以及商务谈判)。
按其交易主体的不同,电子商务的经营模式可分为:顾客对顾客的电子商务(CtoC或C2C)、企业对企业的电子商务(B2B或B2B,Business to Business E-commerce)、企业对顾客的电子商务(B2C或B2C)以及企业对政府的电子商务(BtoG或B2G)等,其中,B2B和B2C是两种主要的模式。按其产品的广度和深度的不同,电子商务的商业模式又可以分为垂直型(Vertical)、水平型(Horizontal)、专卖店 (Boutique)以及公司网站(Company Site)等
ERP(Enterprise Resource Planning)
ERP可以从管理思想、软件产品、管理系统三个层次给出它的定义:1)是由美国著名的计算机技术咨询和评估集团Garter Group Inc.提出了一整套企业管理系统体系标准,其实质是在MRPII(Manufacturing Resources Planning,“制造资源计划”)基础上进一步发展而成的面向供应链(Supply Chain)的管理思想;2)是综合应用了客户机/服务器体系、关系数据库结构、面向对象技术、图形用户界面、第四代语言(4GL)、网络通讯等信息产业成果,以ERP管理思想为 灵魂的软件产品;3)是整合了企业管理理念、业务流程、基础数据、人力物力、计算机硬件和软件于一体的企业资源管理系统。
办公自动化(Office Automation=OA)
是指一个单位的工作通过计算机网络及应用软件来进行流程化、程序化管理,为工作的人性化提供智能支持。即利用先进的科学技术,不断使人的办公业务活动物化于人以外的各种设备中,并由这些设备与办公室人员构成服务于某种目标的人―机信息处理系统。其目的是尽可能充分地利用信息资源,提高工作效率和质量、辅助决策、求取更好的效果以达到既定(即经济、政治、军事或其它方面的)目标。一个比较完整的办公自动化系统应包括信息采集、信息加工、信息传输、信息保存 (档案管理)四个基本环节。核心任务是为各领域各层次的办公人员提供所需运用的信息。
计算机病毒( computer viruses)
破坏计算机系统或正常工作程序的程序,具有自我复制功能的一组计算机指令代码。它具有攻击性、传播性、扩散性,又同时具有较强的移动针对性和隐蔽性及可激发性。
病毒防护技术(anti_virus technology)
为保障系统扩内部信息安全采用的将预防病毒、检测病毒和杀毒等组合在一起的技术。国产主要产品有瑞星、金山;国外产品主要是诺顿等。
命令文件(Command file)
亦称计算机程序(Program)。是指为处理各种事务,用计算机语言编写的程序,是一种计算机软件。它的形成过程一般是由程序员编写“源程序”输入计算机,通过相应的编译程序编译后执行,有些还要经过连接程序才能执行。
JAVA技术
由Sun公司开发的新一代面向对象的网络编程语言,可以交叉支持不同的技术平台。JAVA是一种动态语言。动态特性是面向对象特性的一个延伸,它使得程序 能够适应不断变化的执行环境。JAVA具有面向对象的、分布式的、解释执行的,健壮的,安全的,结构中立的,可移植的,高效的,多线程的特性。
ASP技术(Active Server Pages)
活动服务器网页。ASP是一种脚本程序,嵌套在网页中由信息服务器负责指令解释。
软件生命周期
是软件工程中的一个重要概念,软件产品从形成概念开始,经过开发、使用和不断增补修订,直到最后被淘汰的整个过程,称为软件生命周期。
档案信息化(Archival Information)
就是在国家档案行政管理部门的统一规划和组织下,在档案管理活动中全面应用现代信息技术,对档案信息处置、管理和提供利用。是以档案信息资源建设为核心, 以现代信息技术为基础,以社会充分利用档案信息资源为目标,使档案信息资源实现数字化、标准化、系统化、网络化的过程。包含信息基础设施、信息资源、信息技术与应用、信息产业、信息化法规与信息科技人才六个要素。
数字档案馆(Digital Archives)
是在信息化建设,尤其是电子政务建设中,政府信息资源的数据中心和数据交换站,是集中存储和管理各类有保存价值的综合电子信息的基地。它是建立在现代信息技术的普遍应用基础之上,利用数字手段,以高度有序的综合档案信息资源为处理核心,以高速宽带通信网络为技术设施的,超大规模、分布式数字信息系统,属于 国家数字化信息基础工程,也是档案馆作为社会文化设施延伸为信息服务业的实现形式。
文档一体化
是从文书和档案工作全局出发,实现从文件生成制发到归档管理的全过程控制。包括:文档实体生成一体化,文档管理一体化,文档信息利用一体化,文档规范一体化。
电子文件中心(Electronic Records Center)
在电子政务环境下,由档案部门通过归档管理平台建立的,与电子政务内网数据处理中心相配套的,以在线采集接收和发布电子文件为主要内容的虚拟机构,它是档案馆实现电子文件永久保存的入口,是为领导、政府各机构服务的窗口。把内网上可公开的电子文件上档案信息网而建立的网上电子文件中心,是配合政府实施“政 务公开”的窗口。
电子文件( electronic records )
指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理。并可在通信网络上传送的文件。
元数据( metadata )
描述电子文件数据属性的数据,包括文件的格式、编排结构、硬件和软件环境、文件处理软件、子处理和图形工具软件、字符集等数据。
逻辑归档( logical filing )
在计算机网络上进行,不改变原存储方式和位置而实现的将电子文件的管理权限向档案部门移交的过程。
物理归档( physical filing )
把电子文件集中下载到可脱机保存的载体上,向档案部门移交的过程。
档案管理软件(archival management software)
用于实现文档一体化的管理过程和档案馆(室)业务管理的应用型软件。一般包括文书档案管理、归档文件管理、科技档案管理、会计档案管理、声像档案管理、实物档案管理、档案室资料管理和专业档案管理。能够完成公文管理(收、发文和内部文件的登记处理)、立卷归档 (自动组卷、案卷著录、新老案卷的录入修改和自动编号)、 查询浏览案卷级和文件级的互访、浏览和查询统计)、 文档输出(案卷目录、专题目录、案卷卷面、卷内文件目录、全引目录、统计报表和工作流程的综合打印)、 案卷处理 (向档案馆移交案卷和案卷注销的处理)、数据设定(归档类目和主题词库的数据设定)、系统维护(数据备份、恢复、初始化和数据库的整理);编制件盒号 (编制件号、编制盒号、数据删除)、档案利用( 查询浏览、档案统计、专题输出);科研、基建、产品和设备档案的管理,会计报表、帐簿和凭证档案的管理,录音、录像、光盘、照片等归档磁、光学介质档案的管理;奖状、证书、礼品、锦旗、奖品、印章等归档实物的管理;各类参考资料的综合管理;档案库房温湿度管理、借阅管理、档案综合统计、档案利用效果统计, 档案移交登记和全宗档案目录登记等管理。有些档案管理软件的自定义版,用户可以根据某专业档案的情况自定义设置该档案所要管理的内容。
OCR光学字符识别
OCR(光学字符识别)的技术可以将纸介的图书资料转换为电子书,但单纯的OCR技术存在两个弱点阻碍了它在图书数字化方面的应用:一是识别率不高;二是 不能保留原书的版式。为了解决这两个问题,一些厂家开发了用于专业领域的OCR识别系统,将一些相关技术与OCR技术配合使用,达到满意的数字化效果。OCR识别书不仅可以实现完善的可定位到字的全文检索、页面批注、摘要、字体缩放等功能;文件所占的存储数据量相对于扫描书也大大降低。对于纸介书刊、资料的数字化,这是综合质量最高的一种技术。
国际互联网(Internet)
是世界上最大的计算机网络,它使用TCP/IP协议将遍布世界各地的计算机网络互联成一个超级计算机网络,连接上的每一台主机都有一个IP地址,IP地址 是用4个十进制数字来表示。一台主机只能有一个IP地址,但可以有多个用于不同目的的域名。INTERNET起源于美国国防部ARPANET计划,后与美 国国家科学基金会的科学教育网合并。据2002年7月统计,用户数已超过6。5亿。
万维网WWW(World Wide Web)
WWW是一个基于超文本(Hypertext)方式的信息检索服务工具。它是由欧洲粒子物理实验室(CERN)研制的。通过将位于全世界Internet网上不同地点的相关数据信息有机地编织在一起,WWW提供这样一种友好的信息查询接口:用户仅需提出查询要求,而到什么地方查询及如何查询则由WWW自动完成。
因此,WWW带来的是世界范围的超级文本服务,可以通过Internet从全世界任何地方调来你所希望得到的文本、图像(包括活动影像)和声音等信息。另外,WWW还可为你提供“传统的”Internet服务:Telnet、FTP、Gopher和Usenet News(Internet的电子公告板服务)。
WWW与传统的Internet信息查询工具Gopher、WAIS最大的区别是它展示给用户的是一篇篇文章,而不是那种令人时常费解的菜单说明。因此,用它查询信息具有很强的直观性。
WWW的成功在于它制定了一套标准的、 易为人们掌握的超文本开发语言HTML、信息资源的统一定位格式URL和超文本传送通信协议HTTP。
通用资源标志符(Uniform Resource Identifier,简称"URI")
是互联网的一个协议要素,用于定位Web上可用的每种资源,包括HTML文档、图像、视频片段、程序等。
URL(Uniform Resoure Locator:统一资源定位器)
URI的一个子集,主要表示Internet地址,它从左到右由下述部分组成:
·Internet资源类型(scheme):指出WWW客户程序用来操作的工具。如“http://”表示WWW服务器,“ftp://”表示FTP服务器,“gopher://”表示Gopher服务器,而“new:”表示Newgroup新闻组。
·服务器地址(host):指出WWW页所在的服务器域名。
·端口(port):有时(并非总是这样),对某些资源的访问来说,需给出相应的服务器提供端口号。
·路径(path):指明服务器上某资源的位置(其格式与DOS系统中的格式一样,通常有目录/子目录/文件名这样结构组成)。与端口一样,路径并非总是需要的。
URL地址格式排列为:scheme://host:port/path,例如http://www.sohu.com/domain/HXWZ就是一个典型的URL地址。
档案网站archives web
档案网站是档案机构在公共信息服务网络上建立的站点,它一般是以主页方式提供相关档案服务和开展档案宣传。档案网站建设是档案信息化建设的重要步骤,它是档案部门联系社会的重要窗口。最早于1995年在北美开始建设,至2002年,与联合国教科文组织档案门户网站实现链接的档案网站已达4000多个。主要 内容包括政务公开和档案信息网上查询。
域名
域名用来表示一个单位,机构或个人在Intenret上的一个确定的名称或位置。
一个单位、机构或人若想在Internet上有一个确定的名称或位置,需要进行域名登记。域名登记工作是由经过授权的注册中心进行的。国际域名的申请由InterNIC及其他由“Internet国际特别委员会”(IAHC)”授权的机构进行;国家二级域名的注册工作则由中国互联网络信息中心(CNNIC)负责进行。
域名分为国际域名及在国家顶级域名之下的二级域名(国内域名)。在一个确定的域名之下可以有不同的主机(服务器),如域名服务器、邮件服务器、WWW服务器等,每一个服务器都有一个特定的IP地址。如DNS为www.ebwh.cn,电子邮件服务器为mailserver.ebwh.cn。
如江苏省档案局网址是:http://www.dajs.gov,由省档案局统一注册的二级域名:
城 市域名
南 京 nj.dajs.gov.cn
徐 州 xz.dajs.gov.cn
苏 州 sz.dajs.gov.cn
常 州 cz.dajs.gov.cn
无 锡 wx.dajs.gov.cn
南 通 nt.dajs.gov.cn
扬 州 yz.dajs.gov.cn
镇 江 zj.dajs.gov.cn
盐 城 yc.dajs.gov.cn
淮 安 ha.dajs.gov.cn
泰 州 tz.dajs.gov.cn
宿 迁 sq.dajs.gov.cn
连云港 lyg.dajs.gov.cn
IP地址
每台电脑在因特网上都有一个或多个用于标志电脑位置的数字地址,称为IP地址。
域名解析
域名解析就是域名到IP地址的转换过程。IP地址是网路上标识您站点的数字地址,为了简单好记,采用域名来代替ip地址标识站点地址。域名的解析工作由DNS服务器完成。
公共密钥基础结构(Public Key Infrastructure)
PKI是一种遵循既定标准的密钥管理平台,可以为各种网络应用透明地提供采用加密和数字签名等密码服务所必需的密钥和证书管理,从而保证网上传递信息的安全、真实、完整和不可抵赖。完整的PKI系统有权威认证机构(CA)、数字证书库、密钥备份及恢复系统、证书撤消系统、应用接口(API)等基本构成部 分。
认证中心(CA)
是公开密钥基础设施的核心。认证中心的功能有:证书发放、证书更新、证书撤销和证书验证。CA的核心功能就是发放和管理数字证书,具体为接收验证最终用户 数字证书的申请;确定是否接受最终用户数字证书的申请-证书的审批;向申请者颁发、拒绝颁发数字证书-证书的发放;接收、处理最终用户的数字证书更新请求-证书的更新;接收最终用户数字证书的查询、撤销;产生和发布证书废止列表(CRL);数字证书的归档;密钥归档;历史数据归档。
认证中心为了实现其功能,主要由注册服务器、证书申请受理和审核机构、认证中心服务器组成。
电子公告牌(BBS)
全称是Bulletin Board System,是Internet最早的功能之一。顾名思义,其早期只是发表一些信息,如股票价格,商业信息等,并且只能是文本形式。而现在,BBS主要 是为用户提供一个交流意见的场所,能提供信件讨论,软件下载,在线游戏,在线聊天等多种服务,还出现了图形方式的BBS。
电子邮件( e-mail )
通过计算机和网络传递的信件称之为电子邮件。目前采用电子政务电子邮件交换平台、企业邮箱、免费邮箱。如同一般信件邮寄时需填写收件及寄件人地址,电子邮件亦需靠收件及寄件人电子邮件地址(E-mail Address)来收发电子邮件,以供邮件通讯协议辨识,将电子信件送至网络上正确地点。电子邮件地址包含两部份:邮递帐号及邮递主机名称,两者以@符号 连接,如E-mail地址为cas@js.gov.cn,我们可解读成,在js.gov.cn邮递主机上的cas帐号信箱。
多媒体常用格式
HTML(Hyper Markup Language)
超文本标记语言,属于一种特殊类型的SGML文档。HTML主要由头部(head)和主体(body)组成。除了头元素和主体元素外还有一种附加元素:序(Prologue)--这种元素可能在一般的文档中找不到。序就是HTML文档开头的一行文本,用来告知浏览器所遵循的HTML版本。现在一般的浏览器不要求含有序,而且不会处理序。因此该元素可以忽略。
在80年代早期,IBM提出在各文档之间共享一些相似的属性,诸如字体大小和版面并设计了一种文档系统,通过文档中辅加一种标签,从而可以标识文档中的每种元素。这样文档的显示和打印可能更少或更多地依赖特殊的硬件,不过这样的系统需要不同的计算机系统提供专门的软件来显示和打印文档。IBM把自己这种标 识语言称作通用标记语言(GeneraizedMarkupLanguage),即GML。但IBM没在GML上做太多工作,直到1986年国际标准化组 织(ISO)认为IBM提出的概念很好,并发布了为生成标准化文档而定义的标记语言标准(ISO8879),称为新的语言SGML,即标准通用标记语言。
XML(Extensible Markup Language)
是一种元语言,作为中国标准的可扩展置标语言,在数字档案馆的数据管理中占有重要位置,XML使计算机很简易地产生及读取资料,并确保数据结构精确。。是 一种用以描述文件结构和语意的标注语言,在其中能够创造出很多不同的置标语言,用来定义各种不同的文件类别。可以解决数字档案浏览、阅读和存储对原有软件、硬件的依赖性,可以简化档案管理系统与其他应用系统接口的复杂性,可以保持归档电子文件保存格式的多样性,可以基本解决数字档案的真实、完整和长期可 读等。
PDF格式
PDF(Portable Document Format)是由Adobe Systems创建的一种文件格式,允许在屏幕上查看电子文档。PDF文件还可被嵌入到Web的HTML文档中。目前国际上已规定PDF为标准格式。
EPS格式
EPS(Encapsulated PostScript)是我们处理图像工作中的最重要的格式,它在Mac和PC环境下的图形和版面设计中广泛使用,用在PostScript输出设备上打 印。几乎每个绘画程序及大多数页面布局程序都允许保存EPS文档。在Photoshop中,通过文件菜单的放置(Place)命令(注:Place命令仅 支持EPS插图)转换成EPS格式。
建议你将一幅图像装入到Adobe Illustrator、QuarkXPress等软件时,最好的选择是EPS。但是,由于EPS格式在保存过程中图像体积过大,因此,仅仅保存图像一般不使用EPS格式。将文件打印到无PostScript的打印机上,为避免打印问题,不要使用EPS格式,应采用TIFF或JPEG格式替代。
DCS格式
DCS是Quark开发的一个EPS格式的变种,称为Desk Color Separation(DCS)。在支持这种格式的QuarkXPress、PageMaker和其他应用软件上工作,DCS便于分色打印。而Photoshop在使用DCS格式时,必须转换成CMYK四色模式。
Filmstrip格式
Filmstrip是Adobe Premiere(Adobe公司的影片编辑应用软件)和Photoshop专有的文件转换格式。应当注意的是,Photoshop可以任意通过Filmstrip格式修改Premiere每一帧图像,但是不能改变Filmstrip文档的尺寸,否则,将不能存回Premiere中。同样,也不能把Photoshop创建的文件转换为Filmstrip格式。
TXT格式
这是一种纯本格式文件。TXT是最通用的文本文件格式,文件体积小,阅读不受限制,几乎所有的文字处理软件都能识别,在不同操作系统之间可以通用,兼容性强,不易被病毒感染。
矢量图形文件(Graphic)
根据一定算法绘制的图表、曲线图,包括几何图形和把物理量如应力、强度等用图标表示的图形等等。计算机辅助设计(CAD)或绘图中产生的文件,如设计模型、图纸、图画等即为图形文件。
栅格图像文件(Image)
使用数字设备采集或制作的画面,如用扫描仪扫描的各种原件画面,用数码相机拍摄的照片等。纸质文件、缩微胶片均可经过扫描转换成数字图像文件(如JEPG、BMP、TIFF等)。
GIF格式
GIF是输出图像到网页最常采用的格式。GIF采用LZW压缩,限定在256色以内的色彩。GIF格式以87a和89a两种代码表示。GIF87a严格支持不透明像素。而GIF89a可以控制那些区域透明,因此,更大地缩小了GIF的尺寸。如果要使用GIF格式,就必须转换成索引色模式 (Indexed Color),使色彩数目转为256或更少。在Photoshop中,利用“Save as”命令保存GIF87a;要想保存GIF89a,则必须使用“File”/“Export”/“GIF89a Export”。
PNG格式
PNG是专门为Web创造的。PNG格式是一种将图像压缩到Web上的文件格式,和GIF格式不同的是,PNG格式并不仅限于256色。
BMP格式
BMP(Windows Bitmap)是微软开发的Microsoft Pain的固有格式,这种格式被大多数软件所支持。BMP格式采用了一种叫RLE的无损压缩方式,对图像质量不会产生什么影响。
PICT格式
PICT是Mac上常见的数据文件格式之一。如果你要将图像保存成一种能够在Mac上打开的格式,选择PICT格式要比JPEG要好,因为它打开的速度相当快。另外,如果要在PC机上用Photoshop打开一幅Mac上的PICT文件,须在PC机上安装QuickTime。
Scitex CT格式
Scitex CT格式支持灰度级图像、RGB图像、CMYK图像。Photoshop可以打开诸如Scitex图像处理设备的数字化图像。
TGA格式
TrueVision的TGA(Targa)和NuVista视频板可将图像和动画转入电视中,PC机上的视频应用软件都广泛支持TGA格式。
PCX格式
PCX是DOS下的古老程序PC PaintBrush固有格式的扩展名,因此这个格式已不受欢迎。
Amiga IFF格式
Amiga是由Commodore开发的,由于该公司已退出计算机市场,因此,Amiga IFF格式也将渐渐地被废弃。
Photo CD YCC格式
Kodak的Photo CD和Pro Photo CD使用YCC色彩方式,打开Photo CD文件时,你可以将YCC图像转换成Photoshop的Lab色彩方式。但Photoshop不能以Photo CD格式来保存文件。
FlshPix格式
它是由Kodak、Live Picture和其他一些公司开发的,Photoshop能够用FlshPix格式打开和保存图像。
JPEG格式
JPEG(由Joint Photographic Experts Group“联合图形专家组”命名)是我们平时最常用的图像格式。它是一个最有效、最基本的有损压缩格式,被绝大多数的图形处理软件所支持。JPEG格式 的图像还广泛用于Web的制作。如果对图像质量要求不高,但又要求存储大量图片,使用JPEG无疑是一个好办法。但是,对于要求进行图像输出打印,最好不 使用JPEG格式,因为它是以损坏图像质量而提高压缩质量的。
TIFF格式
TIFF(Tag Image File Format有标签的图像文件格式)是Aldus在Mac初期开发的,目的是使扫描图像标准化。它是跨越Mac与PC平台最广泛的图像打印格式。TIFF使用LZW无损压缩,大大减少了图像体积。另外,TIFF格式最令人激动的功能是可以保存通道,这对于处理图像是非常有好处的。
声音文件(Audio)
用音频设备录入或编曲软件生成的文件(如MP3、WAV、MIDI等)。用音频设备录入并转换为数字形式的文件,采样频率是单位时间内的采样次数,采样频率和速率越高,音质越好,文件所占存储空间就越大。声音文件播放时需要使用相关设备和程序。
WAV
WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播。
MP3
MP3的全称是Moving Picture Experts Group Audio Layer III,是一种音频压缩技术和为压缩声音信号而设计的是一种新的音频信号压缩格式标准。MP3是利用MPEG Audio Layer 3的技术,将音乐以1:10甚至1:12的压缩率,压缩成容量较小的file,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。正是因为MP3体 积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。
MP3就是采用国际标准MPEG中的第三层音频压缩模式,对声音信号进行压缩的一种格式,中文也称“电脑网络音乐”。MPEG中的第三层音频压缩模式比第一层和第二层编码要复杂得多,但音质要比第一层和第二层高,甚至可与CD音质相比。CD唱片采样率频率为44.1MHz, 16Bits,数据量为1.4Mbps,而相应的MP3数据量仅为112kbps或128kbps,是原始数据量的1/12。也就是说传统的一张CD现在可以存放10倍 甚至更多容量的音乐,但是在人耳听起来,感受到的音乐效果却没有什么不同。
影像文件(Video)
使用视频捕获设备录入的数字影像或使用动画软件生成的二维、三维动画等各种动态画面,如数字影视片、动画片等。视频捕获设备可将模拟影像转 换成数字影像。影像文件需要较大存储空间,其分辨率与存储空间成正比。影像文件有不同的格式或标准,播放时需要使用相关的设备和程序(如MEPG、AVI等格式文件)。
MPEG
MPEG压缩格式是由运动图像专家组(Motion Picture Experts Group)制定的关于影像和声音的一组标准。MPEG的全称是运动图像专家组(Moving Picture Experts Group),是专门制定多媒体领域内的国际标准的一个组织,该组织成立于1988年,由全世界大约300名多媒体技术专家组成。MPEG同时又是针对运 动图像而设计的压缩标准,是多媒体数据压缩标准中采用较多的,包括MPEG视频、MPEG音频和MPEG系统(视音频同步)三个部分。基本方法是——在单 位时间内采集并保存第一帧信息,然后就只存储其余帧相对第一帧发生变化的部分,以达到压缩的目的。其平均压缩比可达50:1,压缩率比较高,且又有统一的 格式,兼容性好。
MPEG-1
MPEG-1(ISO/IEC 11172)是MPEG组织于1992年提出的第一个具有广泛影响的多媒体国际标准。正式名称为“基于数字存储媒体运动图像和声音的压缩标准”,着眼于解 决多媒体的存储问题。由于MPEG-1的成功制定,以VCD和MP3为代表的MPEG-1产品在世界范围内迅速普及。传输1.5Mbps数据传输率的数字 存储媒体运动图像及其伴音的编码,经过MPEG-1标准压缩后,视频数据压缩率为1/100-1/200,音频压缩率为1/6.5。MPEG-1提供每秒30帧352*240分辨率的图像,当使用合适的压缩技术时,具有接近家用视频制式(VHS)录像带的质量。MPEG-1允许超过70分钟的高质量的视频和音频存储在一张CD-ROM盘上。VCD采用的就是MPEG-1的标准,该标准是一个面向家庭电视质量级的 视频、音频压缩标准。
MPEG-2
是MPEG组织于1996年推出解决多媒体传输问题的标准,正式名称为“通用的图像和声音压缩标准”。MPEG-2标准最为引人注目的产品是数字电视机顶盒与DVD。此后,MPEG并没有停止前进的步伐,主要针对高清晰度电视(HDTV)的需要,传输速率为10Mbps,与MPEG-1兼 容,适用于1.5-60Mbps甚至更高的编码范围。MPEG-2有每秒30帧704*480的分辨率,是MPEG-1播放速度的四倍。它适用于高要求的广播和娱乐应用程序,如:DSS卫星广播和DVD,MPEG-2是家用视频制式(VHS)录像带分辨率的两倍。
MPEG-4
MPEG-4(视频和音频对象的压缩)的正式ISO命名为ISO/IEC14496,1999年公布为国际标准。是超低码率运动图像和语言的压缩标准,用于传输速率低于64Mbps的实时图像传输,它不仅可覆盖低频带,也向高频带发展。较之MPEG-1、MPEG-2两个标准而言,MPEG一4为多媒体数据压缩提供了—个更为广阔的平台。它更多定义的是一种格式、一种架构,而不是具体的算法。它可以将各种各样的多媒体技术充分用进来,包括压缩本身的一些工具、算法,也包括图像合成、语音合成等技术。MPEG-4的最大创新在于赋予用户针对应用建立系统的能力,而不是仅仅使用面向应用的固定标准。借助于MPEG-4,可以建立个性化的视听系统。
MPEG-7
2001年11月发布的“多媒体描述接口”,解决多媒体内容的检索问题。通过这个标准,用户可以方便地根据内容访问多媒体信息。比如,用户可以在众多的新闻节目中寻找自己关心的新闻,可以跳过不想看的内容而直接按自己的意愿收看精彩的射门集锦;在互联网上,用户键入若干关键词就可以在网上找到自己需要的克林顿的演讲、贝多芬的交 响乐等;甚至用户只需出示一张克林顿的照片或哼一首音乐的旋律,都可以找到自己所需要的多媒体材料。所有这些,都取决于MPEG-7中对各种多媒体内容的 描述。
AVI
AVI没有MPEG这么复杂,从WIN3.1时代,它就已经面世了。它最直接的优点就是兼容好、调用方便而且图像质量好,因此也常常与DVD相并称。但它的缺点也是十分明显的:体积大。也是因为这一点,我们才看到了MPEG-1和MPEG-4的诞生。2小时影像的AVI文件的体积与MPEG-2相差无计,不过这只是针对标准分辨率而言的:根据不同的应用要求,AVI的分辨率可以随意调。窗口越大,文件的数据量也就越大。降低分辨率可以大幅减低它的体积,但图像质量就必然受损。与MPEG-2格式文件体积差不多的情况下,AVI格式的视频质量相对而言要差不少,但制作起来对电脑的配置 要求不高,经常有人先录制好了AVI格式的视频,再转换为其他格式。
网络协议(Network Protocol)
简单地说就是网络中文件传输的规定(包括文件的分割、传输、组合等一系列的规定)。如TCP/IP协议,它本身是两个协议集,TCP是传输控制协议,IP是互联网协议。
网络协议标准
世界各国目前所遵循的都是IEEE(美国电子电气工程师协会)制定的以802开头的标准,目前共有11个与局域网有关的标准,它们分别是:
IEEE 802.1──局域网概述、体系结构、网络管理和性能测量等
IEEE 802.2──逻辑链路控制协议等
IEEE 802.3──CSMA/CD访问方法及物理层技术规范
IEEE 802.4──ARCnet总线结构、访问方法及物理层技术规范
IEEE 802.5──令牌环(Token Ring)网介质访问控制协议及物理层技术规范等
IEEE 802.6──城域网(MAN)介质访问控制协议DQDB及物理层技术规范
IEEE 802.7──宽带局域网
IEEE 802.8──光纤局域网(FDDI)
局域网(Lan)
指分布距离几米至10千米以内范围,位于一个建筑物或一个单位几幢建筑物内的计算机互联成网,常见于公司、学校、政府机关。主要特点为配置容易,数据传输速率高。
按照传输介质可分为有线网和无线网;按照传输介质所使用的访问控制方法,可分为交换式局域网(所有计算机通过交换器直接进行相互通信,为星 形拓扑结构)、以太网(所有节点在一条总线以集线器为中心,为总线结构)、标记环网和FDDI网。不同类型的局域网采用不同的技术,使用不同的硬件和软 件,适合不同的应用。档案馆比较适合采用交换式局域网的类型。
广域网(Wan)
又称远程网,与局域网的本质区别是网络的规模而不是距离,一般分布距离几百千米至几千千米,可以连接任意多个场地的任意多台计算机,并能使 得大量计算机相互之间能同时通信,如金盾、中国教育网、CHINANET。可通过电话拨号接入、ISDN、不对称数字用户线技术、电缆调制解调技术和光纤接入网等方式接入。
VPN技术
又叫虚拟专用网,即借助公共网建立“隧道”,使用点到点协议将数据加密、封装并安全地由一端传输到另一端的通讯过程。使用费用低廉、安全、方便,适合解决数字档案馆的馆际互联问题,包括省、市、县档案馆馆际间和馆室间互联的问题。
主机 (host)
任何连接到网络并运行应用程序的计算机,可以是PC机,也可以是大型机,CPU可快可慢,内存可大可小,连接的网络运行速度可高可低。TCP/IP使得任何一对主机都可以互相连接并进行数据通信。
服务器 (server)
是网络上提供共享资源的计算机,它可以向其他入网计算机提供资源服务。服务器是一种功能较强的计算机,要求运算速度快、存储量大且要提供数 据保护手段和良好的稳定性、可靠性。在一个网络中网络服务器起着非常重要的作用,是网络高速、稳定的保证。常用的有IBM. DELL品牌。
专用服务器(SERVER-BASE)
网络中提供某一类信息资源的服务器,如多媒体数据库服务器,档案目录数据库服务器等,它根据数据的安全性与容量等要求来确定是否建立。
工作站( work station )
是指用户直接使用的、能够利用网络资源的入网计算机,它不仅可以利用本机内部的资源,而且可以利用服务器提供的各种服务。
网络操作系统(NOS)
即管理文件系统、计算机存储器、共享应用程序、设备的输入/输出、CPU调度等资源的程序软件。一、服务器操作系统(SOS),主要有Netware Unix/Linux和Windows Server三种。二、工作站操作系统,主要有DOS、WINDOWS98/2000/ME/XP、UNIX/LINUX。
交换机(Switch)
用于网络联线之间的转换,作用是将信号再生转发,它的主要用于连接集线器、服务器和分散式主干网。它的作用是将收到的数据包括目的地址转发到相应端口,并可在同时刻与多个端口之间互相通信,能有效解决争用信道造成拥堵等问题,与集线器相比,速度更快。
集线器(HUB)
用于网络联线之间的转换,作用是将信号再生转发,它把网络线缆提供的一个接口转换为多个。使用集线器可以改善网络的管理和维护,提高网络的稳定性和可靠性。
网卡network interface card(NIC)
又称网络接口卡、网络适配器,是计算机与网络相连的硬件设备。它一般插在主板扩展槽中,通过网线与网络相连。不同的网络还必须使用不同的网卡,但同网络可使用不同公司生产的相互兼容的网卡。
双绞线 (Twisted Pair)
是目前局域网常用的传输介质,最常用的有五类或超五类线,其特点是传输距离小(一般不超过100米)、抗干扰能力弱、价格便宜等特点。
光 缆(fibreoptic cable)
是用光缆纤维作为信号传输介质。光缆由能传送光波的超细玻璃纤维制成,外包一层比玻璃折射率低的材料,进入光纤的光波在两种材料介面上形成全面反射,从而不断向前传递常用于广域网,其特点是传输距离远、速率高、无信号泄漏、抗干扰能力强、传输信息大且信息不失真。
网桥(BRIDGE)
网桥工作在数据链路层,将两个局域网(LAN)连起来,根据MAC地址(物理地址)来转发帧,可以看作一个“低层的路由器”(路由器工作在 网络层,根据网络地址如IP地址进行转发)。它可以有效地联接两个LAN,使本地通信限制在本网段内,并转发相应的信号至另一网段,网桥通常用于联接数量不多的、同一类型的网段。
网关(Gateway)
就是一个网络连接到另一个网络的“关口”。是一个网络通向其他网络的IP地址.要实现这两个网络之间的通信,则必须通过网关。从根本上说,网关不能完全归为一种网络硬件。用概括性的术语来讲,它们应该是能够连接不同网络的软件和硬件的结合产品。特别地,它们可以使用不同的格式、通信协议或结构连接起两个系统。
路由器(ROUTER)
所谓“路由”,是指把数据从一个地方传送到另一个地方的行为和动作,而路由器,正是执行这种行为动作的机器,是一种连接多个网络或网段的网络设备,具有判断网络地址和选择路径的能力,它能将不同网络或网段之间的数据信息进行“翻译”,以使它们能够相互“读懂”对方的数据,从而构成一个更大的网络。包括网络互连、数据处理、网络管理等功能。
蓝牙(Bluetooth)
是一种用于替代某些电子设备上使用电缆或连线的短距离无线连接技术。蓝牙的目标是要提供一种通用的无线接口标准,用微波取代传统网络中错综 复杂的电缆,在蓝牙设备间实现方便快捷、灵活安全、低成本低功耗的数据和话音通信。因此,其载频选用在全球都可用的2.45GHz ISM(工业、科学、医学)频带。
利用“蓝牙”技术,能够有效地简化掌上电脑、笔记本电脑和移动电话手机等移动通信终端设备之间的通信,也能够成功地简化以上设备与Internet之间的通信,从而使这些设备与因特网之间的数据传输变得更加迅速高效。目前具有蓝牙功能的掌上电脑有很多款,相信随着掌上电脑的逐步发展,蓝牙功能将成为掌上电脑的一种普通功能。但目前来看,具有蓝牙功能的掌上电脑价格比较贵。
USB接口(Universal Serial Bus)
通用序列界面,是一新型界面规格和设备插架的一种规范,支持主系统与不同外设间的数据传输,是电脑系统接驳外围设备(如键盘、鼠标、打印机等)的输入/输 出接口标准。USB把不同的接口统一起来,使用一个4针插头作为标准插头。通过这个标准插头把所有的外设连接起来,并且不会损失带宽。也就是说,USB将取代当前PC上的串口和并口。在USB方式下,所有的外设都在机箱外连接,连接外设不必再打开机箱;允许外设热插拔,而不必关闭主机电源。一个USB控制 器可以连接多达127个外设,而每个外设间距离(线缆长度)可达5米。现在的USB分两种版本,1.1和2.0,前者的理论传输速度是12MB/秒,后者 的传输速度是480MB/秒。
防火墙(firewall)
防火墙就是一个位于计算机和它所连接的网络之间的软件和硬件,是一种保护在网络中利用的计算机安全的技术性措施,是一个阻止网络中黑客入侵的屏障。计算机流入流出的所有网络通信均要经过防火墙,防火墙对流经它的网络通信进行扫描,这样能够过滤掉一些攻击,以免其在目标计算机上被执行。防火墙还可以关闭不使 用的端口,而且它还能禁止特定端口的流出通信,封锁特洛伊木马。最后,它可以禁止来自特殊站点的访问,从而防止来自不明入侵者的所有通信。防火墙有不同类型。一个防火墙可以是硬件自身的一部分,你可以将因特网连接和计算机都插入其中。防火墙也可以在一个独立的机器上运行,该机器作为它背后网络中所有计算机 的代理和防火墙。最后,直接连在因特网的机器可以使用个人防火墙。
软件体系结构
客户机/服务器模式(CLIENT/SERVER C/S)
C/S又称Client/Server或客户/服务器模式。服务器通常采用高性能的PC、工作站或小型机,并采用大型数据库系统,如Oracle、Sybase、Informix或SQL Server。客户端需要安装专用的客户端软件。C/S的优点是能充分发挥客户端PC的处理能力,很多工作可以在客户端处理后再提交给服务器。对应的优点就是客户端响应速度快。缺点主要有以下几个:
只适用于局域网。而随着互联网的飞速发展,移动办公和分布式办公越来越普及,这需要我们的系统具有扩展性。这种方式远程访问需要专门的技术,同时要对系统进行专门的设计来处理分布式的数据。
客户端需要安装专用的客户端软件。首先涉及到安装的工作量,其次任何一台电脑出问题,如病毒、硬件损坏,都需要进行安装或维护。特别是有很多分部或专卖店的情况,不是工作量的问题,而是路程的问题。还有,系统软件升级时,每一台客户机需要重新安装,其维护和升级成本非常高。
对客户端的操作系统一般也会有限制。可能适应于Win98,但不能用于win2000或Windows XP。或者不适用于微软新的操作系统等等,更不用说Linux、Unix等。
浏览器/服务器模式(BROWSER/SERVER B/S)
B/S是Brower/Server的缩写,客户机上只要安装一个浏览器(Browser),如Netscape Navigator或Internet Explorer,服务器安装Oracle、Sybase、Informix或SQL Server等数据库。浏览器通过Web Server同数据库进行数据交互。
B/S最大的优点就是可以在任何地方进行操作而不用安装任何专门的软件。只要有一台能上网的电脑就能使用,客户端零维护。系统的扩展非常容易,只要能上网,再由系统管理员分配一个用户名和密码,就可以使用了。甚至可以在线申请,通过公司内部的安全认证(如CA证书)后,不需要人的参与,系统 可以自动分配给用户一个账号进入系统。
数据存储与管理
数据库(database)
是指以一定的组织方式存贮在一起,能为多个用户所共享的、与应用程度彼此独立的、相互联系的数据集合。数据库不仅存放数据,还存放了数据之间的关系
全文数据库context database
数据库的一种,全文数据库內存储了各类档案资料的全文。所存储的全文包含文字全文和影像(扫描)全文等,对全文数据库中全文的可以进行多种方式的检索和浏览。许多数据库管理系统都提供了丰富的全文数据管理功能。
目录数据库catalogue database
数据库的一种,目录数据库内只存储了档案资料的目录信息(责任者、题名、文件时间,主题词.等)。与全文数据库相比较,它存储的条目更多、检索功能更强大。
多媒体数据库multimedia database
和全文数据库不同,多媒体数据库是一种能够处理非结构化数据(如图形、图像和声音等),并对这些信息进行管理、运用和共享的新型数据库。多媒体数据库需处理的信息主要包含图形、图像、声音和视像等。
数据仓库(data warehouse)
在系统管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合,是一种应用解决方案,是一个设计思路,不是一个可以买到的产 品。关键技术包括数据的抽取,存储与管理,数据在多维分析、数理统计和数据挖掘方面,基本体系结构包括数据源、监视器、集成器、数据仓库和应用。
Oracle数据库
美国甲骨文公司开发的一种关系型数据库管理系统,目前应用最广泛的是它的8i和9i版本,Oracle可以安装在70种以上不同的大、中、小型机上,可在VMS、DOS、UNIX、WINDOWS等多种操作系统下工作,在性能方面一直处于业界领先水平。
SQL SERVER数据库
Microsoft SQL Sever7数据库是美国微软公司1998年发布的第一个完全集成数据转换服务、O-LAP服务以及Microsoft Repository2.0的关系型数据库管理系统,运行在Windows平台上。关系模型是当前最流行的数据存储和查询模型。在数据库中存储的数据通过 各个表之间的关联紧密地结合成为一个整体,只要知道个体的某一个特征,就可以在整个数据库范围内查询出所有与之相关的数据。在SQL Server中除了表这一个基本对象外,还有许多辅助操纵数据的对象,目前SQL Server的最新版是SQL server 2000。
DB2数据库
美国IBM公司开发的一种关系型数据库管理系统,主要运行在IBM的硬件平台上,目前也有运行在Windows环境下的版本。
数据库管理系统(DBMS)
是一组在操作系统支持下对数据进行管理的大型软件,这组软件给数据用户提供一系列数据操作命令,用户通过这些命令向数据库管理系统发出数据 请求,数据库管理系统能够接受、分析并解释用户的命令请求,通过相应的处理程序,操作数据库中的数据,帮助用户对计算机系统中存贮的数据进行增删、更新、运算、查找和输出等各种数据处理。概括的说数据库管理系统必须具备数据安全性保护、数据的完整性检查、并发控制、数据恢复等功能。
数据类型(data type)
它又分为系统数据类型和用户自定义数据类型两种。系统数据类型,是一种常用的数据库基本数据类型,如INT,REAL,CHAR,VARCHAR等;用户自定义数据类型是用户为了方便自己定义的数据类型,它是建立在关系数据类型基础上的,是对系统数据类型的一种扩展。
数据库备份(database backup)
就是把数据库复制到转储设备的过程。其中,转储设备是指用于放置数据库拷贝的磁带或磁盘。数据库备份分为物理备份和逻辑备份两种。物理备份 是将实际组成数据库的操作系统文件从一处拷贝到另一处的备份过程,通常是从磁盘到磁带,逻辑备份是利用SQL语言从数据库中抽取数据并存于二进制文件的过 程。
数据灾难备份基地(Data Copy Base)
灾难备份是指通过技术和管理的途径,确保在灾难发生后,关键数据、数据处理系统和业务在短时间内能够恢复的过程。数据备份恢复只是灾难备份 中涵盖的一个方面,灾难备份系统还包括最大范围地容灾、最大限度地减少数据丢失、实时切换、短时间恢复等多项内容。建设灾难备份系统的目的是保证数据中心业务的高度持续性,对于金融、电信、民航、铁路等对信息实时性要求很强的行业要求灾难备份中心配备与生产中心性能匹配的全部专用设备,还要建设高成本的宽 带网络,投入相当昂贵。实施的前提包括电子政务、电子商务建设中软件运行平台和设备选型的一致,应用版本的规范和相关应用的整合问题;完善的管理机制的建立,因为据调查显示,灾备系统的40%故障率来自人为因素,另40%的故障源于应用系统故障,而只有20%的故障是由于火灾、水灾、地震等天灾造成的。
在以上两种数据复制方式的基础之上,可以建立两种相对应的灾难备份解决方案——同城灾备方案和异地灾备方案。同城灾备方案是指生产中心和灾难备份中心同在一个城市或相近区域内的灾难备份方案。这种方案会使数据中心和灾难备份中心之间的距离比较近,可以比较容易地实现数据的同步镜像,可以保证高 度的数据完整性和数据零丢失。异地灾备一般是跨省域的,生产中心和灾难备份中心距离比较远,从技术角度看,通过异步数据复制更容易实现。同城灾备可以防范火灾、建筑物破坏等可能遭遇的风险隐患,但对于战争、地震、水灾等潜在的风险隐患就显得力不从心了,防范这些情况还需要考虑异地灾备方案。针对同城灾备和 异地灾备各有所长的特点,为达到最理想的防灾效果,也可以考虑异地+同城的灾难备份方案,在异地灾备基础上,再建立同城备份站点。这种方案防灾效果完美,但资金投入会比较多。
澳大利亚大通-曼哈顿银行的灾备方案就是一个较为典型的例子。澳大利亚大通-曼哈顿银行的全球灾备系统有五个灾难备份中心,包括三个全球同城灾备中心,两 个全球异地灾备中心。位于澳大利亚的同城灾备中心距离生产中心约30公里,两个中心使用两条高速的ATM通讯链路连接。银行所有的重要数据均在同城灾备中 心的服务器上作镜像,同时,大通-曼哈顿银行在英国的全球备份中心对数据进行异地备份。为了减少开支,灾备中心作为银行内部在网络上的逻辑节点,不但提供了完整的灾难恢复服务,而且还提供某一服务器的热备份服务,新应用上生产前的测试服务等。
档案部门建立灾难备份基地,重点考虑的是数据的存储备份和长久保存问题,以同城备份为主,主要依托电子政务数据交换平台和数据交换中心建立。
日志(log)
主要作用是将用户所有的操作全部自动地记录下来,它是维护数据库完整性的重要工具。
磁盘阵列 (disk array)
一、软件阵列,是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的多块硬盘配置成逻辑盘,组成阵列。软件阵列可以提供数据冗余功能。
二、硬件阵列,是指使用专门的磁盘阵列卡来实现阵列功能,能够提供在线扩容、动态修改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保护、可靠性、可用性和可管理性的解决方案。磁盘阵列卡拥有一个专门的处理器,一般是Intel的I960芯片。
光盘镜像服务器Optical image server
是一种将硬盘高速缓存技术和服务器技术相结合,专为光盘网络共享而设计的NAS(Network Attached Storage,网络连接存储)光盘网络共享设备。光盘镜像服务器本身没有通用服务器那样复杂的操作系统和硬件连接,只完成光盘镜像服务器硬盘数据和客户机之间的数据传送,使客户机能以硬盘的访问速度来共享CD-ROM光盘上的信息资源,极大地改善了光盘网络共享的性能。光盘镜像服务器本身就是一台WWW服务器,客户机可通过WWW浏览器对光盘服务器直接进行远程访问和检索。一般支持多种网络操作系统,如Windows NT、UNIX和NetWare等,具有很强的可访问性。光盘镜像服务器还具有很强的扩展性,用户可根据实际情况给光盘镜像服务器增加硬盘来扩充服务器容量。光盘镜像服务器将光盘的信息存储和读取功能分离,凭借硬盘的高速存取能力来共享光盘信息资源,因此光盘镜像服务器的访问速度要比光盘库或光盘塔快几十 倍。
光盘库(Optical Libraries)
光盘库是20世纪80年代初出现的一种新型存储系统,集中应用了现代光盘存储技术、精密机械技术、自动控制技术及计算机技术,为近线(Nearline)自动存取和检索海量数据的存储系统,具有容量大、可靠性高、成本低、数据保存寿命长等特点。其存储介质光盘可用作数据的安全、长期存储(备份)。光盘库的存储容量可由小型库的几十个盘片、百余GB到大型库的2000个盘片、20TB以上。
NAS
是一种专业的网络文件存储及文件备份设备,全称为网络附加存储设备(Network Attached Storage),或称为网络直联存储设备、网络磁盘阵列。一个NAS里面包括核心处理器,文件服务管理工具,一个或者多个的硬盘驱动器用于数据的存储。NAS可以应用在任何的网络环境当中。主服务器和客户端可以非常方便地在NAS上存取任意格式的文件,包括SMB格式(Windows)NFS格式(Unix, Linux)和CIFS格式等等。NAS系统可以根据服务器或者客户端计算机发出的指令完成对内在文件的管理。另外的特性包括:独立于操作平台,不同类的文件共享,交叉协议用户安全性/许可性, 浏览器界面的操作/管理,和不会中断网络的增加和移除服务器。
SAN
是Storage Area Network的缩写,即“存储区域网络”。 它是一种通过光纤集线器、光纤路由器、光纤交换机等连接设备将磁盘阵列、磁带等存储设备与相关服务器连接起来的高速专用子网。在SAN中,存储设备通过专用交换机到一群计算机上。在该网络中提供了多主机连接,允许任何服务器连接到任何存储阵列,让多主机访问存储器和主机间互相访问一样方便,这样不管数据置放在那里,服务器都可直接存取所需的数据。
SAN由三个基本的组件构成:接口(如SCSI、光纤通道、ESCON等)、连接设备(交换设备、网关、路由器、集线器等)和通信控制协议 (如IP和SCSI等)。这三个组件再加上附加的存储设备和独立的SAN服务器,就构成一个SAN系统。SAN提供一个专用的、高可靠性的基于光通道的存 储网络,SAN允许独立地增加它们的存储容量,也使得管理及集中控制(特别是对于全部存储设备都集群在一起的时候)更加简化。而且,光纤接口提供了10 km的连接长度,这使得物理上分离的远距离存储变得更容易.
它的优点:可实现大容量存储设备数据共享,高速计算机与高速存储设备的高速互联,灵活的存储设备配置要求,数据快速备份,提高了数据的可靠性 和安全性,适合对数据安全性要求很高的企业 如电信、金融和证券 的计费 ;对数据存储性能要求高的企业如电视台、交通部门和测绘部门 的音频/视频、石油测绘和地理信息系统等;在系统级方面具有很强的容量(动态)可扩展性和灵活性的企业 的ERP系统、CRM系统和决策支持系统;具有超大型海量存储特性的图书馆、博物馆、税务和石油 的资料中心和历史资料库。实现对分散数据高速集中备份和数据在线性要求高的商业网站和金融企业的电子商务以及实现与主机无关的容灾的数据中心
磁带机(Tape Drive)
当前的磁带机(库)支持的备份技术主要有DAT、8mm、DLT、LTO、AIT及VXA等。
DAT技术
DAT(Digital Audio Tape)技术又可以称为数码音频磁带技术,也叫4mm磁带机技术,最初是由惠普公司(HP)与索尼公司(SONY)共同开发出来的。这种技术以螺旋扫描 记录(Helical Scan Recording)为基础,将数据转化为数字后再存储下来,早期的DAT技术主要应用于声音的记录,后来随着这种技术的不断完善,又被应用在数据存储领 域里。4mm的DAT经历了DDS-1、DDS-2、DDS-3、DDS-4几种技术阶段,容量跨度在1GB-12GB。目前一盒DAT磁带的存储量可以 达到12GB,压缩后则可以达到24GB。DAT技术主要应用于用户系统或局域网。
8mm技术
8mm技术由Exabyte(安百特)公司在1987年开发,采用螺旋扫描技术,其特点是磁带容量大,传输速率高,它在较高的价位上提供了相对较高容量的存储解决方案。8mm磁带机的发展经历了8200、8500、8500c和8900(mammoth)的数据格式,容量从最初的2GB发展 到现在的40GB,传输速率最快可达6MB/s。新一代的Mammoth-2技术又进一步提升,存储容量达到170GB(非压缩60GB)传输速率30MB/s(非压缩12MB/s),在技术上有广阔的发展空间。主要制造商是Exabyte公司。
DLT技术
DLT(Digital Linear Tape-数字线性磁带)技术源于1/2英寸磁带机。1/2英寸磁带机技术出现很早,主要用于数据的实时采集,如程控交换机上话务信息的记录,地震设备的震动信号记录等等。DLT磁带由DEC和Quantum公司联合开发。由于磁带体积庞大,DLT磁带机全部是5.25英寸全高格式。DLT产品由于高容 量,主要定位于中、高级的服务器市场与磁带库系统。目前DLT驱动器的容量从10GB到80GB不等,数据传送速度相应由1.25MB/秒至10MB /秒。另外,一种基于DLT的Super DLT(SDLT)是昆腾公司2001年推出的格式,它在DLT技术基础上结合新型磁带记录技术,使用激光导引磁记录(LGMR)技术,通过增加磁带表面 的记录磁道数使记录容量增加。目前SDLT的容量为160GB,近3倍于DLT磁带系列产品,传输速率为11MB/s,是DLT的2倍。
LTO技术
LTO(Linear Tape Open)技术,即线性磁带开放协议。是由HP、IBM、Seagate这三家厂商在1997年11月联合制定的,其结合了线性多通道、双向磁带格式的优 点,基于服务系统、硬件数据压缩、优化的道面和高效率纠错技术,来提高磁带的能力和性能。
LTO技术有两种存储格式,即高速开放磁带格式Ultrium和快速访问开放磁带格式Accelis,它们可分别满足不同用户对LTO存储 系统的要求,Ultrium采用单轴1/2英寸磁带,非压缩存储容量100GB、传输速率最大20MB/s、压缩后容量可达200GB,而且具有增长的空 间。非常适合备份、存储和归档应用。Accelis磁带格式则侧重于快速数据存储,Accelis磁带格式能够很好地适用于自动操作环境,可处理广泛的在 线数据和恢复应用。
AIT技术
AIT是指先进智能磁带,英文为Advanced Intelligent Tape,具有螺旋扫描、金属蒸发带等先进技术,AIT的数据保护性能比较突出,AIT已经发展到目前的AIT-3,目前开发AIT技术的索尼公司和专注 在AIT技术上开发产品的Spectra Logic公司都在大力的推广采用AIT的产品。
AIT采用的是螺旋扫描方式进行记录,与家用录像机的工作原理一样,这样一来,整个磁带机中,只有磁鼓是高速旋转,其它部件,如磁带、伺服机构都是低速运动的。这样的结构紧凑合理、易于设计和维护。而LTO(Linear Tape Open)、DLT(Digital linear Tape)、SDLT(Super Digital linear Tape)都是线性记录,像录音机一样,磁头是固定不动的,磁带直线运动通过磁头。与录音机不同的是,磁带机要保证记录速度,就要让磁带高速通过磁头,为此,就需要复杂机构控制磁带抖动、冷却高速运动的各种部件和轴承。在相同材料下,采用螺旋扫描的方式能使材料寿命延长。
从应用方面讲,对于企业级用户来说,AIT磁带库可用于数据备份。与其它同容量、同传输速率的产品相比,AIT机架式的带库具有体积小、能 耗低、容量大、价格便宜的优点。对于中端用户,AIT自动加载机是较好的选择。考虑到数据容量和自动备份等问题,可选用能容纳4盘磁带的自动加载机。
VXA技术
VXA技术是由Exabyte(安百特)公司开发的磁带备份技术,VXA技术不依赖于精确的磁头和磁道位置来保证读写的可靠性,它不像流式 磁带设备为定位磁道而需要昂贵的高精度的部件和精确的机械零件。不同于传统的磁带驱动器,VXA通过自动调节磁带移动易和主机的传输速率相匹配而完全消除 磁带“回扯”问题,能够显著提高介质和驱动器的可靠性,进而优化了备份和存储。
VAX以包的格式多些数据,对磁带上的数据记录区进行无空隙扫描,目前已经从VAX-1发展到VAX-2,在保持高可靠性的基础上,提高了速度和容量,单盒磁带容量为160GB(非压缩为80GB),速度为每秒12MB(非压缩为6MB)。)
磁带(Tape)
磁带机的存储介质。目前常用的磁带介质有普通金属磁带Metal Particle (MP)、高级金属蒸发带Advanced Metal Evaporated (AME)、具有自动清洗功能的高级金属蒸发带AME with Smart Clean TM Technology等类型。
MP介质
MP磁带即普通金属磁带,它的实现原理金属粉末粘到磁带上,一般MP磁带可以读写2,000次。
AME介质
AME介质(高级金属蒸镀带)是金属粉末通过激光照射,高温使其蒸发成气态然后冷凝到磁带上,这种磁带比MP有很多优点:记录密度高,表面光滑可以减少磁头磨损,更薄可以同样的磁带容积容纳更长的磁带。一般AME磁带可以读写25,000次。
具有自动清洗功能的AME介质
具有自动清洗(Smart Clean)技术的AME磁带是为提高可靠性而设计的。带Smart Clean技术的AME介质在其前端包含了2米长的用于自动清洗磁鼓和磁头的清洗带,能够减少介质的磨损,使磁头寿命延长30%。)