世界读书日 | 以AI致敬古籍经典
“ 历经千百年岁月洗礼,古籍以其不可估量的历史价值、以其蕴含的风华文雅一路传承,成为人类文明不可磨灭、未曾销蚀的精神力量。阅读古籍,在时空交错中与先贤圣哲流传世代的思想精髓摩擦碰撞,更能在万古江河的历史动线中建立博古通今的链接。可是,真正的古籍通常在图书馆和博物馆里被束之高阁,普通民众鲜有机”
恰逢4月23日“世界读书日”之际,小编向大家盘点咱汉王家的各种AI黑科技是怎样助力古籍走入寻常、让今人得以相遇古人,追寻流淌千年的文化基因,领略中国乃至世界古籍沉浸千百年智慧的迷人魅力。
01
—
手抄本古籍识别
文档电子化让古籍跃然屏幕
—
手抄本古籍识别
文档电子化让古籍跃然屏幕
基于深度学习技术,在海量数据训练基础上,经多年研发,汉王科技突破性解决了手抄本古籍识别这一OCR领域难题,这是文字识别领域的一项重大技术突破。面对手抄本古籍内容,利用此技术只要随手一拍,就可以秒级转换为文本。无论是背景干扰严重的复印纸、还是形状弯曲的纸稿,都可以轻松应对,真正做到了人眼可辨即可识。
作为业界致力于OCR识别技术研发和应用的先驱者,自2013年,汉王科技就将文档电子化的触角延伸至包括图书馆等多个国家级项目。在图书馆领域,汉王已与国家图书馆持续合作了十三个年头。从最初的图书扫描加工,到元数据加工,再到高精度全文加工;从简体中文识别,到繁体中文识别,再到高难度的古籍识别;从纸质文献到电子文献;从内容加工服务到管理平台建设,汉王深度与国家图书馆合作,不断挑战新的业务高度。
02
—
突破自然语言处理
文本结构化树智慧图书馆标杆
—
突破自然语言处理
文本结构化树智慧图书馆标杆
2015年,得益于深度学习算法的快速进展,大规模社交文本数据以及语料数据的不断积累,NLP技术有了飞跃式的发展。汉王科技进行文档大数据化研发工作,力图突破NLP技术,建立起自己的文档大数据库体系,开发各种新的应用,主攻包括文本分类、聚类、结构化数据抽取、知识抽取、知识图谱、机器阅读等在内的NLP技术。
在对文史出版社丛书文献进行知识加工过程中,通过从文献中碎片化抽取、清洗、归集、融合得到基础数据,深度加工挖掘得到人物、地点、机构、事件类的知识条目,再基于知识条目构建人物库、地点库、机构库、事件库等知识资源库,并通过关系定义实现跨类别的知识关联,提供了超越图书内容信息的深度知识服务。
在承接的国家图书馆"智慧图书馆体系建设项目"中,汉王针对民国文献数字资源开展知识化加工,完成数字资源精细化标引和知识内容抽取,细化文献颗粒度,多维度揭示文献的知识内容,并开展多维度、多层次知识组织,提供基于知识图谱的可视化展示。该项目实施过程中就应用到了包括基于深度学习的新一代文字识别、自然语言理解、智能抽取、知识图谱构建、数据可视化等多项人工智能创新型技术。这将是双方在人工智能新时代,针对文化领域的一个重点创新与尝试,其成果将作为全国智慧图书馆体系建设的重要参考之一。
03
—
数字技术增强现实世界
AR/VR技术让山海经走进元宇宙
元宇宙时代的到来为文博行业注入了新科技的力量。数字技术与现实世界的结合变得更加深入,增强人通过数字化平台感知世界、链接世界的能力。汉王科技结合自身在AI人工智能、AR/VR/MR等技术方面的积累,拓展文物数字藏品展示与使用场景,在元宇宙时代焕发出新的生命力。
在某省级图书馆虚拟古籍馆项目中,以古籍场馆实体为基础,结合馆藏古籍实际,对古籍馆及部分藏品进行数字采集,高度还原古籍藏品的真实形态,让读者可以随时随地通过网络虚拟浏览古籍馆;
综合运用音视频、灯光、色调、配乐、解说等多种元素进行图书馆的虚拟古籍馆展厅制作,给观赏者带来如临其境的参展体验。
在国家图书馆山海经AR方案规划中,汉王对山海经里的各版本古籍插图进行重新设计和建模,设计脚本和动作,投射到现实环境进行增强现实展示打造沉浸空间,神兽可以从画面中走出与参观者进行对话,参观者可以进入到剧本中一起探索山海经,唤醒山海神兽,打造山海秘境。参观者可以通过手机或者AR眼镜进入秘境之中,同时支持多场景切换,同时每个参观者也可以自由选择自己在场景的形象体验换装沉浸式体验,并且支持互动拍照合影,体验一把仙界之旅.
中国古籍经典如漫天星光,璀璨闪耀,即便撷取些许也能成为照亮暗夜之光。面对当前方兴未艾的数字化浪潮,汉王从浩瀚磅礴的“文化宇宙”出发,集结AI技术的力量,将经典化作可以滋养文化根基的养分,化作深化社会思考的基石,这不仅是给予热爱阅读的人一份穿越时光、见字如面的慰藉,也在文化层面上深度释放科技温度、助力我国传统文化加速复兴。
下一篇:典红百年、典活记忆、典亮青春