古籍对于我们来说是一大难题。难点很多:一是很难找到相关的古籍。既

张生全精彩历史呀 2023-03-01 17:02:50

古籍对于我们来说是一大难题。难点很多:一是很难找到相关的古籍。既然叫古籍,肯定就很少刊印于世。若想找某个古籍,多半只能去图书馆。而图书馆里有没有收藏,又是难题。二是就算找到了相关古籍,碍于标点符号或者古文字的问题,还不一定搞得懂。三是想要持续性的研究,基本上不可能,因为基本上不允许你把古籍带出图书馆。所以,对古籍进行数字化整理,就是一件迫在眉睫的事情。最近,北京大学和字节跳动合作共建的古籍数字化平台“识典古籍”,正是这样一个免费公益“数字图书馆”。据介绍,目前这个平台还只是处在起步阶段,涵盖469部经典古籍,主要来自《四部丛刊》,共计7880多万字。听到这个消息以后,我特地点进这个网站看了一下。在总目录上,我看到了“儒学经典”“道家经典”“文学经典”三个板块。我是搞文学的,于是就点进了“文学经典”,看到里面有《诗经》《楚辞》《陶渊明集》《杜甫集》等等。于是我又点开了《杜甫集》,里面共有25卷。我点开第一卷,翻到咱们耳熟能详的《月夜》一诗,发现每一句诗,都有很详细的注解,主要是对于人名、地名、难解字的解释,以及对背景的交代,还有就是历代注释家的注释等等,感觉还是非常靠谱的。我在页面的右上角发现了配备了原始影像。对照以后我才发现,原来这就是原始影像的文字化、数字化,忠实地传达了原始影像的内容,这就使得它具有了极大的权威性。我查阅了相关的介绍。目前行业内OCR识别准确率平均为93%至94%,而“识典古籍”的准确率达到96%至97%。这已经相当了不起了!另外,“识典古籍”还有个重要的特点,就是具有强大的检索功能。比如我输《月夜》,结果经史子集和历朝历代写的《月夜》都出现了,让我可以非常方便地对比着看。总之,北京大学和字节跳动合作共建的这个公益项目,确实是一个非常好的惠民行动。我们支持他们继续做下去,做完善,做好,让错误率更低一些,加油吧!

0 阅读:1

张生全精彩历史呀

简介:主笔张生全,中国作协会员,有著作《最后的士绅家族》等