- · 《信息系统工程》栏目设[06/28]
- · 《信息系统工程》收稿方[06/28]
- · 《信息系统工程》投稿方[06/28]
- · 《信息系统工程》征稿要[06/28]
- · 《信息系统工程》刊物宗[06/28]
全国美术馆藏品普查信息系统技术路线
作者:网站采编关键词:
摘要:充分利用现代信息技术,实行“统一平台、分别采集、及时上报、分级管理”是《全国美术馆藏品普查工作方案》确定的普查基本原则。为了有效支持普查工作,确保完成普查任务,在
充分利用现代信息技术,实行“统一平台、分别采集、及时上报、分级管理”是《全国美术馆藏品普查工作方案》确定的普查基本原则。为了有效支持普查工作,确保完成普查任务,在本次普查中,普查工作机构将开发统一的普查信息系统。普查信息系统的总体目标是,支持普查工作人员按照普查工作标准的要求便捷地采集藏品文字信息和影像信息,在数据采集软件中完成数据登录和本地审核,通过网络将藏品信息数据上报至藏品普查数据管理系统;支持省级和国家级审核专家在线审核并反馈审核结果;有效支撑普查数据的存储、管理、传输、交换等工作,保证国家美术藏品数据的安全管理和使用;有效支撑普查工作的运行管理和信息交流。普查信息系统作为普查工作的基础条件,为普查全过程提供支撑和保障。为此,必须针对业务需求,确立合适的技术路线。
1.需要重点考虑的问题。
(1)大集中与分布架构的选择。
大集中就是将分布在各个分支机构和网点的业务数据及其他一些相关的数据,统一实现集中存储和处理。好处是系统架构清晰,部署简单,性能稳定,升级维护方便,可以保证数据的一致性。目前,经济普查、国土资源普查、水资源普查、林业普查都采取了类似的结构,统一配备数据采集终端和采集工具,数据直接上传到集中的服务器。但是,本次藏品普查不可能为各个数据采集单位配备电脑;数据采集的地点可能在库房,不具备直接上网的条件;采集单位需要在本单位保存原始尺寸的影像数据,也需要本地对采集的数据管理和利用。为此,经慎重考虑,采取集中和分布相结合的架构,即数据采集软件在各单位安装,通过该软件完成数据的采集、修改和审核。美术馆完成自身审核后,即在联网的条件下,自动上报到大集中的数据中心。此后,数据的省级审核、国家级审核、技术校验和入库,均在大集中的数据中心完成。这样,既照顾到普查单位的限制条件和业务需求,也兼备了大集中模式的优越性。
(2)数据更新方式的选择。
采用分布与集中相结合的模式,难点在于数据的一致性。在数据更新的过程中,必须保证采集单位本地的数据库与集中存储的数据的一致性。据了解,全国可移动文物普查尽管也采用了客户端采集软件和登录平台两种并存的数据采集方式,但是采集软件的数据在完成上报后,就由大集中的数据管理平台负责后续的修改,并且修改后的数据也不再反馈到采集软件。针对美术普查的具体情况,如果采用这种方式,尽管在系统开发的技术实现上会简单些,但是,由此可能造成美术馆自身保存的数据和普查数据中心的数据不一致。为此,需要限定修改必须在美术馆的采集软件中完成,大集中的数据中心的审核信息及修改要求,均通过技术手段反馈到采集软件,由美术馆完成修改后重新上报。系统设计时,需要重点考虑数据的上报、省级和国家级审核、下发、修改及重新报送等流程和状态的有效管理。
(3)并发访问的性能。
并发访问就是同时有多个客户请求同一个服务。大量的并发访问如果超出了服务器的承受能力的话,轻则导致服务器抛弃一部分请求,重则导致服务器资源耗尽以至宕机。根据参普单位调查分析,本次普查涉及三百多家美术馆、两千二百多名工作人员。以每个美术馆仅指定一台机器上传数据计算,数据采集软件上传数据的最大在线数量为300,以15%的并发量计算,则需要支持的并发量为45个。数据管理系统中的藏品信息,由省普查办及全国美术馆藏品普查办进行审核,估算总审核次数300万次。普查期间按照200个工作日进行审核操作,则每个工作日数据管理系统需支持的审核次数为次,以每天八小时工作进行计算,则每分钟的审核操作数量为32次。事实上操作可能集中在某个特高峰时段,此时每分钟需完成的审核操作约为300次,即每秒钟五次。此外,普查官方网站以所有参普人员共2200人左右计算,同时登录在线的用户量以15%的计算,则需要支持的登录并发用户数为330个。为此,考虑到藏品普查数据上报与审核业务的特殊性,大量用户可能集中在特定的时间段访问使用系统,对应用系统服务、数据库都会产生较大的压力,在设计时充分考虑并发访问优化和控制机制。
(4)网络带宽的估算。
根据参普单位调查分析,本次藏品总计约50万件。每件藏品的文本数据及相关的审核记录、日志记录等存储容量约为60KB,折合数据库记录约1000万条、数据库容量约为30G,数据库规模并不算大。但是,按照普查标准规范中关于藏品影像的规定,藏品影像信息为不小于5M,不大于30M的JPG格式图片,若以平均每件藏品的影像数据存储容量为20M计算,则影像数据总容量约为10T。普查数据采集时间约20个月,但事实上,美术馆很难按时间均匀上报,最可能的是在普查最后阶段集中上报,没有足够的网络带宽就可能成为制约数据上报的瓶颈。为此,在系统设计的时候,必须采用边采集、边审核、边上报的方式,数据采集完成到一定的节点,自动提醒工作人员及时审核;审核之后,在网络连通时,自动上报数据。这样,按普查进度要求,藏品数据如果按照分布在五个月陆续上报,每个月需上报的数据增量约为1T。由于大部分美术馆只能在上班时间开机、下班必须关机关电源,数据上传时间每天按照四小时计算、每月上报15天计算,由此可以计算出,所需的净数据速率为(1TB÷15工作日÷4小时÷60分钟÷60秒)×8Bit≈35Mb/s。目前,中国美术馆已经有一条中国电信提供的100M专线和一条中国联通提供的10M专线。为保证数据正常上报,拟在普查期间,将中国联通的10M专线扩容为100M,并采用负载均衡技术。
文章来源:《信息系统工程》 网址: http://www.xxxtgc.cn/qikandaodu/2021/0320/1130.html
上一篇:结构化文本格式对音乐编辑出版思维的影响
下一篇:资讯