用大数据破译汉字密码 让“冷门绝学”热起来
2019年,安阳师范学院计算机与信息工程学院教师刘永革带领团队研发的世界第一款免费甲骨文大数据平台“殷契文渊”惊艳亮相,一下拉近了甲骨文与普通大众的距离。
3000年前的文字,计算机将如何读懂?甲骨文“撞上”现代科技,如何让“冷门”不冷?如何以大众喜闻乐见的形式展示甲骨文的魅力?
沉睡3000年的甲骨文急需“唤醒”
“2000年,当时回到学校,两位研究甲骨文的老师力主我开展甲骨文信息化研究,而我对甲骨文的认识等同于空白。”作为出身数学专业的本科生和计算机软件硕士刚毕业的刘永革,自那一刻起,笃定了将甲骨文信息化研究作为一生奋斗的事业。
谈起自己的研究工作,刘永革开玩笑用“两头堵”来形容,他说:“一头是中国最古老的文明甲骨文,另外一头是先进的计算机技术、人工智能。”
甲骨文发现于今安阳市西北五里小屯村北面,距今3000多年,这种远古文字,也因年代久远而充满神秘和未知,破解甲骨文成了世界难题,而要破解还有一个难题摆在面前——我们没有办法把甲骨文输入到电脑。
“因为甲骨文和汉字不一样,它好多字我们不认识,所以说你用拼音输入法不行,还有一些字像一幅画一样,那么也不能用部首,也不能拆分,此前甲骨文输入法采用编码输入,记忆负担和学习成本较大。”刘永革说。
刘永革称,之前不管是写论文、讲课,还是做研究等,所有场合使用都需要用图片粘贴,研制甲骨文输入法,建立字库,让任何人使用都可以轻松输入至关重要。
“用计算机技术研究甲骨文的编码、字库、输入法、数据库建设,为甲骨文专家提供一些工具,辅助甲骨文研究,是我和团队的主要任务。”
“殷契文渊”让甲骨文瞬间“活起来”
为了学习最新的研究成果,让思想不落伍,每当有甲骨文研究专家到安阳,刘永革和团队成员一定积极请教;甲骨文学术研究会议,时间再紧也要参加……
随着了解得越来越深入,刘永革发现,我们民族最古老的文字,因为晦涩难懂和研究资料较少,与现实技术不兼容,导致研究效率低下。
如何让甲骨文的研究信息共享,让全人类资源互通,群力群策一起研究呢?刘永革决定利用自己的专业,为甲骨文的发展绘制蓝图。
于是一个汇集甲骨文信息的“殷契文渊”项目悄然启动,这个项目就是在互联网上为世界提供甲骨文的全部信息,让全世界人民了解甲骨文、认识甲骨文、研究甲骨文。2019年,由刘永革团队用8年时间精心打造的世界第一款免费甲骨文数据库“殷契文渊”惊艳亮相。
“比如说,某个字不认识,就可以登录我们的殷契文渊,通过点击部首,与这个字相关的信息都可以查到,可以把这个字输入到文档里。”刘永革举例说。
从“殷契文渊”开放的第一天起,平台就对全世界用户提供免费服务,它里面现有152种著录,是目前最大的甲骨文数据库。“它不仅服务全球的甲骨文、考古、历史、文字方面的研究专家,还吸引了古文字爱好者、中小学语文教师、书法爱好者等使用。”
此前甲骨文资料很难查到,即使甲骨文专家也不可能拥有全部资料,“殷契文渊”项目建成后解决了这个问题。
科技创新赋能破译甲骨“文明密码”
就在前一阵子,刘永革所在实验室和腾讯合作,共同开展人机协同助力甲骨文释读研究和传承活化,这个项目主要进行两方面工作。
“一方面是利用人工智能技术为释读甲骨文提供智能化工具,比如古文字图形检索工具。这些工具将设置在‘殷契文渊’;另一方面,利用腾讯的传播平台优势进行甲骨文的传播,比如我们正在做的微信小程序‘了不起的甲骨文’,在公众特别是中小学中传播甲骨文文化,做好研学活动,由本省发展到全国,该小程序三月底将进行内部测试。”刘永革介绍说。
为完成甲骨文大数据平台信息采集和录入工作,每年都有学生从大一开始参与甲骨文信息化课题研究。在刘永革的支持下,学院还开设了《甲骨文信息处理》特色课程。
“甲骨文研究专家、书法专家、信息技术专家……目前,我们已经组建了一支跨专业、多学科的甲骨文信息化处理团队,甲骨文信息化教学和科研都位于全国前列。”刘永革骄傲地说。
“眼下,我们和腾讯合作已经取得了三项技术突破,一是提出了一个甲骨文全信息数字模型,二是研制了光照变换矩阵的甲骨文高清拍摄技术,三是确立了甲骨三维建模的技术和设备,马上进行第一批甲骨文三维建模实验。”
“做好传承,把‘殷契文渊’建设好,使安阳真正成为世界甲骨文数据中心;大胆创新,利用人工智能技术破译甲骨文,让科技赋能研究,用计算机破解甲骨文,揭开甲骨背后‘文明密码’,讲好甲骨文的故事。”刘永革说,他要将甲骨学研究带入新的智能化时代。
版权声明:本文为三牛号作者或机构在本站上传并发布,仅代表该作者或机构观点,不代表本站的观点或立场,三牛网仅提供信息发布平台。