A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
-bash/zsh: csplit: command not found #Debian apt-get install coreutils #Ubuntu apt-get install coreutils #Alpine apk add coreutils #Arch Linux pacman -S coreutils #Kali Linux apt-get install coreutils #CentOS yum install coreutils #Fedora dnf install coreutils #OS X brew install coreutils #Raspbian apt-get install coreutils #Docker docker run cmd.cat/csplit csplit
在类 Unix 操作系统上,csplit 命令根据上下文行将文件拆分为多个部分。csplit 命令用于将一个大文件分割成小的碎片,并且将分割后的每个碎片保存成一个文件。碎片文件的命名类似 xx00
,xx01
。csplit 命令是 split 的一个变体,split 只能够根据文件大小或行数来分割,但 csplit 能够根据文件本身特点来分割文件。
本文档介绍了 ucsplit 的 GNU / Linux 版本。
csplit [OPTION]... FILE PATTERN...
-b<输出格式> 或 --suffix-format=<输出格式>:预设的输出格式其文件名称为 xx00,xx01 等,用户可以通过改变<输出格式>来改变输出的文件名; -f<输出字首字符串> 或 --prefix=<输出字首字符串>:预设的输出字首字符串其文件名为 xx00,xx01 等,如果制定输出字首字符串为“hello”,则输出的文件名称会变成hello00,hello、01...... -k或--keep-files:保留文件,就算发生错误或中断执行,与不能删除已经输出保存的文件; -n<输出文件名位数>或--digits=<输出文件名位数>:预设的输出文件名位数其文件名称为 xx00,xx01..... 如果用户指定输出文件名位数为“3”,则输出的文件名称会变成xx000,xx001等; -q或-s或--quiet或——silent:不显示指令执行过程; -z或--elide-empty-files:删除长度为 0 Byte 文件。
文件:指定要分割的原文件; 模式:指定要分割文件时的匹配模式。
#从计算机中的CD创建 ISO 光盘映像。 dd if=/dev/sr0 of=/home/hope/exampleCD.iso bs=2048 conv=noerror,sync #创建 /dev/sda 硬盘的 img 文件。 要还原该映像类型:dd if=disk1.img =/dev/sda dd if=/dev/sda of=~/disk1.img #将内容从 if = drive/dev/sda 复制到 of = drive/dev/sdb。 dd if=/dev/sda of=/dev/sdb
csplit 示例测试文件 server.log
$ cat server.log SERVER-1 [con] 10.10.10.1 suc [con] 10.10.10.2 fai [dis] 10.10.10.3 pen [con] 10.10.10.4 suc SERVER-2 [con] 10.10.10.5 suc [con] 10.10.10.6 fai [dis] 10.10.10.7 pen [con] 10.10.10.8 suc SERVER-3 [con] 10.10.10.9 suc [con] 10.10.10.10 fai [dis] 10.10.10.11 pen [con] 10.10.10.12 suc
需要将 server.log 分割成 server1.log、server2.log、server3.log,这些文件的内容分别取自原文件中不同的 SERVER 部分:
[root@localhost split] $ csplit server.log /SERVER/ -n2 -s {*} -f server -b "%02d.log"; rm server00.log [root@localhost split] $ ls server01.log server02.log server03.log server.log
csplit 在第 5 和 23 行分割文件:
csplit file 5 23
csplit 每 5 行分割一个文件(如果总行数不能被 5 整除,这将失败):
csplit file 5 {*}
csplit 每 5 行分割一个文件,忽略精确划分错误:
csplit -k file 5 {*}
csplit 在第 5 行分割文件,并为输出文件使用自定义前缀:
csplit file 5 -f prefix
csplit 在与正则表达式匹配的行处分割文件:
csplit file /regex/
/[正则表达式]/ #匹配文本样式,比如/SERVER/,从第一行到包含SERVER的匹配行。 {*} #表示根据匹配重复执行分割,直到文件尾停止,使用{整数}的形式指定分割执行的次数。 -s #静默模式,不打印其他信息。 -n #指定分割后的文件名后缀的数字个数。比如01、02、03等。 -f #指定分割后的文件名前缀。 -b #指定后缀格式。比如%02d.log,类似于C语言中的printf参数格式。 rm server00.log #是删除第一个文件,因为分割后的的第一个文件没有内容,匹配的单词就位于文件的第一行中。