当前位置: 首页 >
【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
包装印刷加工
MacBook的诱惑在哪里?
如何设计一条 prompt 让 LLM 陷入死循环?
用了几年大厂云服务器,现在想换便宜的,有推荐的吗?
包装胶带
为什么一直宣传爱国的华为连***都用的是外国***?
卧推100kg做组的胸,都是啥样的。?
你是因为什么肥胖起来的?
语音室成套设备
为什么现在键盘轴体不用颜色命名了,全是些莫名其妙的名字,看不懂到底是什么?
中国狸花猫有什么优缺点呢?
日本制造的质量真的就那么好吗?
印章用品
为什么越来越多的国内男孩,要娶国外女孩?
为什么Next.js和Nuxt.js发布时间只隔了几小时?
苹果为什么要给每代MacOS起个名字,真以为人们记得住分得清吗?
眼镜片
国产厂商为什么都不用三星屏幕了?
为什么16-28岁女性对labubu欲罢不能?
如何评价“寡姐”斯嘉丽·约翰逊的身材?
验钞机
在广州,找个对象是不是真的很难?
曹玉磊冒充「清华院长」频繁参加活动遭官方打***,他为何能堂而皇之以***身份开展活动?其将受到哪些处罚?
自己拥有一台服务器可以做哪些很酷的事情?
友情链接