我对这个其他noob问题真的很抱歉,但我真的不能找出这里发生了什么。 我想从一个文件,其中的话是一个由线计算的话的频率。 该文件是非常大的,所以这可能是问题(它计算30万线在这个例子中)
我做这个命令:
cat .temp_occ | uniq -c | sort -k1,1nr -k2 > distribution.txt
而问题是,它给了我一个小错误:它认为我同样的话不同。 例如,第一条目是:
306 continua
278 apertura
211 eventi
189 murah
182 giochi
167 giochi
与giochi重复两次,你可以看到
在文件的底部,它会变得更糟,它看起来是这样的:
1 win
1 win
1 win
1 win
1 win
1 win
1 win
1 win
1 win
1 winchester
1 wind
1 wind
对于所有的话
我真的很抱歉再次为愚蠢的问题,但我有点shell编程菜鸟。 我究竟做错了什么?
非常感谢