文档“大数据” 汉王攻坚AI难点-自然语言处理(下)
攻坚人工智能难中之难
中文自然语言处理
自然语言处理-NLP NaturalLanguageProcessing是研究人与计算机交互的语言问题。从语言识别,到语义识别,从而真正做到可以交互。业界普遍认为,自然语言处理是人工智能中最难的部分,也是决定AI是否“智能”的关键因素。
目前在这一领域从事相关技术研发工作的主角为国际巨头谷歌。目前谷歌正在开发一套神经网络,开发代号是神经官能症(neurosis),而这套智慧网络的核心就是让机器具有强大的学习能力,理解人类几千年积累下来的自然语言信息,帮助人类随时调用和理解这些信息,进行快速学习,以适应知识大爆炸的时代来临。
而对于博大精深的中文,是以“字”为单位,一个中文文本或一个汉字(含标点符号等)串可能有多个含义,相对于天然分词的英文,中文处理的难度有所提高,是自然语言理解中的主要困难和障碍。汉王利用其中文文字识别技术优势,布局自然语言理解技术研发与突破,在未来将帮助更多的相关工作者或机构将平面的书本变成立体化的知识书库。
为此,汉王科技融合武汉大学的研发团队联合成立了武汉汉王大数据技术有限公司,专门研究及开发“自然语言理解”课题方面的技术及产品。
布局各领域文档大数据工程
从大的技术发展来看,现在无论是IT技术业、互联网业,“自然语言理解”都是最尖端的研究方向。武汉汉王大数据的“自然语言理解工具化”发展方向,已经成为最尖端的IT技术研究工作。
2016年,汉王科技不仅成立了武汉汉王大数据技术有限公司,还成功收购了北京影研创新科技发展有限公司,影研科技业务范围涵盖文档信息化应用及内容管理解决方案,目前在医疗和法院市场具有竞争优势,将技术、资金注入影研科技,显而易见,汉王完成了医疗和法院文档大数据市场的进入。
随着汉王数字、武汉汉王大数据、影研科技的发展,汉王科技在文档数据化领域的布局将进一步延伸,通过承担国家级、各行业项目,汉王进行文档“大数据化”研发工作,并同步建立起自己的文档大数据库,而未来要做的,则是在大数据基础上开发各种新的应用,以探索文档数据化更广阔的应用前景。
基于NLP的文档大数据
让AI真正“智能”
这种通过自然语言处理(NLP)而“结构化的文档大数据”会给整个社会带来从生活到思维上革命性的变化:未来,法院法律文档大数据平台可以为律师等法律工作者提供海量的同类案例参考,使其能更方便地借鉴历史判案情况,也可以帮助普通人查阅理解自己在生活中遇到的各种相关法律问题;而挖掘健康领域数字化文档资源价值,也将对医疗市场产生颠覆性的影响,未来,医学界人士可透过院内、院际的互通数据,辅以病患本身的健康信息与过往病历,迅速做出较以往精确许多的诊断,加速推动包括疾病诊断与预测、临床实验数据的分析与处理等诸多应用。
上一篇:文档“大数据” 汉王攻坚AI难点-自然语言处理(上)
下一篇:汉王还有这功夫