因为需要统计一批英文文本中的单词词频,文本数量较多,一次一篇地统计相对麻烦而且得到的结果似乎不会比将它们融合为一片之后得到的统计结果来得精确。故而,这里我就遇到了一个问题:如何将这些utf-8格式的txt文档合并起来。
这里也许有人想到了软件。不错,其实我也想到过。之前在网上见过软件可以将大文档分割为小文档,那么反过来应该也会有相应的软件。
上网查了一下,发现一条巨NB且简洁的命令:type *.txt > a.txt
操作步骤如下:
- cmd下切换到当前的work directory。我的是C:\Users\Administrator\Downloads\915
- 输出的结果里最底下的6个文件不是我所需要的。要筛选出来需要用到通配符。这里用最简单的*
- 下面使用type命令执行合并,目标文件名为xx.txt

在http://ss64.com/nt/里可以查到where的用法。我当时试了一下ls,发现cmd无反应。



—————————————————————————
补充:(2010-12-2 )
最近转战XP平台,在xp下调用cmd输入where命令时居然不能识别。如下:
