DATA MANAGEMENT数据管理与应用
汉王文献众包系统
系统概述
随着Web2.0技术的发展,基于用户贡献内容(UGC,User Generated Content)的“众包”、“众筹”理念深入人心,由用户驱动的系统开发和管理技术日益成熟,国外许多大型图书馆、档案馆、博物馆开始利用这种模式来对大量的馆藏手稿进行元数据著录和全文标引,取得了较好的效果。
随着Web2.0技术的发展,基于用户贡献内容(UGC,User Generated Content)的“众包”、“众筹”理念深入人心,由用户驱动的系统开发和管理技术日益成熟,国外许多大型图书馆、档案馆、博物馆开始利用这种模式来对大量的馆藏手稿进行元数据著录和全文标引,取得了较好的效果。
众包系统的主要目标是建立一个以针对档案、手稿等手写资料的元数据著录和全文标引为主题的众包系统。为用户提供元数据深度著录和全文标引的平台,对图书馆收藏的大量手写资料中人、地、时、事等内容特征进行深度标引,对无法OCR的全文进行抄录。
整个系统建设包括三个部分:任务发布平台、任务抄录平台以及管理平台,从任务发布到任务验收,提供完善的众包流程和友好的使用环境。
系统架构
系统架构
1.任务发布平台:任务发布平台用于需要在平台上发布任务,需要支持包含例如图片批量上传、元数据批量上传、任务相关信息设置、结果评分等的任务发布流程以及任务验收流程。
2.任务抄录平台:该平台面对任务接收者,允许用户进行接受任务、在线抄录、修改、提交任务等任务抄录流程。
3.管理平台:管理平台主要用于用户管理以及后台统计,以维护系统次序为主要目标。
功能介绍
任务管理:可将某类影像资料打包成项目发布,自动统计完成度、退回次数等,便于了解项目进度。
元数据管理:支持已有元数据导入,可配置元数据schema和需要标引或抄录的元素。
流程管理:任务发布->领取任务->抄录->提交->专家审核打分。
个性化服务:“我的”页面集中显示抄录中、已完成、被退回等状态的所有个人任务。
积分激励机制:支持可配置的、基于数量、质量、任务难度的积分算法规则,通过积分排行榜激励用户的兴趣。