十 232010
在《cmd下的txt文件批处理》一文中提到对词频的统计。从李笑来的博文得到信息,可以利用wordsmith软件进行统计。自己在网上搜索时发现了Replace Pioneer这款软件,也可以完成同样的工作。wordsmith的使用稍显复杂,软件也相对较大。先来看Replace Pioneer。
Replace Pioneer的操作相对简单,打开软件,在菜单栏中选择Tools->Pattern Counter。如下所示。

在弹出窗口中选“File/http”,选择你的需要统计的文档。确保“Counter Template”选择的是“characters words lines”。最后点“detail”便可得到最后的输出结果。


PS:可以看到英文中最常用的词莫过于“the”了,这正像我小学时所领悟到的那样,汉语中最常用的字是“的”。(*^__^*)