微信搜索superit|邀请体验:大数据, 数据管理、OLAP分析与可视化平台 | 赞助作者:赞助作者

shuf 随机选取txt文件特定行数

shell aide_941 38℃

shuf 随机选取txt文件特定行数

一, 多个 txt 文件合并为一个txt 文件

现有 neg_12.txt  ,  part_12.txt   , pos_12.txt  三个文件 , 合并为一个名为 train.txt的文件

cat neg_12.txt part_12.txt pos_12.txt > train.txt

就会在目录下生成一个 包含 上面三个文件内容的 train.txt文件。

二 ,随机选取 train.txt 中指定行数

查看 shuf 命令帮助 “shuf –help”

  1. 用法: shuf [选项]… [文件]
  2.  或者: shuf -e [选项]… [参数]…
  3.  或者: shuf -i LO-HI [选项]…
  4. Write a random permutation of the input lines to standard output.
  5. 如果没有指定文件,或者文件为”-“,则从标准输入读取。
  6. 必选参数对长短选项同时适用。
  7. -e, –echo treat each ARG as an input line
  8. -i, –input-range=LO-HI treat each number LO through HI as an input line
  9. -n, –head-count=COUNT output at most COUNT lines
  10. -o, –output=FILE write result to FILE instead of standard output
  11. –random-source=FILE get random bytes from FILE
  12. -r, –repeat output lines can be repeated
  13. -z, –zero-terminated line delimiter is NUL, not newline
  14. –help 显示此帮助信息并退出
  15. –version 显示版本信息并退出

可以根据帮助信息进行操作 ,如随机选取train.txt中的200行保存在新文件 test.txt中

shuf train.txt -n 200 -o test.txt

则在test.txt中为train.txt中随机打乱后的200行数据。

转载请注明:SuperIT » shuf 随机选取txt文件特定行数

喜欢 (1)or分享 (0)