HOME

010-82786818 / 010-82786999

×分享到微信

打开微信,使用“扫一扫”即可分享

汉王科技联合第一历史档案馆成功研发满文识别通软件,推动满文档案信息化跨越式发展

  11月5日,中国第一历史档案馆在京举办的“改革开放四十年满文档案工作回顾与展望”座谈会上,正式发布了由一史馆与汉王科技等单位合作研发的满文图像识别软件系统—“满文识别通”、“满文输入通”,以及基于这两个软件开发的“满文朱批奏折全文检索数据库”。




 
  汉王科技高级副总裁李志峰(右二)在项目成果发布仪式上代表合作企业为软件发布揭幕
  该项目软件开创了少数民族文字手写体识别技术的先河,填补了满文档案信息化和数字化领域的技术和应用软件空白,不仅使满文档案数字化及利用方式产生了飞跃式变革,还为历史档案在“互联网+”时代如何弘扬中国历史文化提供了新思路。同时,这一满文图像识别软件项目也荣获了“2018年度国家档案局优秀科技成果特等奖”:


 
  汉王科技作为第一历史档案馆满文识别软件的技术提供方,在多年模式识别技术及应用经验积累下为古籍的数字化保护提供了良好的解决方案。汉王科技旗下子公司汉王数字,利用OCR识别技术(光学字符识别,该技术为人工智能研究的重要领域之一)对古籍进行识别与收录,再辅之以图像的整理与美化,可以快速且高效地完成古籍保护工作。
  早在2015年汉王科技就与一史馆合作开始了“满文档案图像识别软件”项目的研发,其中的“满文识别通”软件可将满文档案的图像信息通过识别技术转换成可编辑检索的文本信息,同时可实现识别模型的迭代更新,随着样本库的增加,识别率逐步提升。这一系统的满文行书识别率86.6%,满文楷书识别率95.1%,其单机识别速度达到每小时625画幅,而人工每人每小时处理速度仅约4画幅。此外,软件易操作、兼容性强,具有重要的推广实用价值,可用以建立满文档案全文检索数据库,为满语言这一国家语言文字遗产的传承和活化开辟了途径,并将推动满文档案工作和研究实现跨越式发展。


 
  软件界面可同时显示满文档案原图、满文标准字体或满文转写字母,便于校对。上图演示以满文朱批为例,左边是档案的文件名,淡黄色背景为档案图像,右边的拉丁字母是识别结果
  满文档案种类多样,内容丰富,满文档案在完整、准确解读历史方面的独特作用和珍贵价值是中华民族历史文化遗产的重要组成部分。据介绍,一史馆馆藏1000多万件档案中,满文档案占约200万件,占馆藏的五分之一,是世界上现存满文档案数量最多的机构。过去满文档案的整理、著录、编目和翻译等工作基本依靠专业人员纯人工操作,是一项颇费时日的工程,“满文档案图像识别软件系统”项目研发开拓了满文档案的工作思路,提高了满文档案文献信息化工作效率,同时在一定程度缓解了满文人才紧缺的难题。此外,这一项目也为其他少数民族文字的文献数字化项目提供了参考。