【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
因为没资格,微软在ui设计语言方面跟谷歌一个级别。 Win7...
真不用听鱼圈那些知其然不知其所以然的大聪明告诉你过滤不够ba...
首先说结论一架歼-35A吊打最少100架KF21,为什么这么...
本文首发于公众号:Hunter后端 原文链接:Golang基...
本人作为一个历史爱好者,发现了三个基本事实。 第一,所有的...
哪来这么多营销账号一个劲的神话明星颜值?真是笑了。 首先网...