csplit 命令详解

| 选择喜欢的代码风格  

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

csplit 命令安装:


-bash/zsh: csplit: command not found

#Debian
apt-get install coreutils

#Ubuntu
apt-get install coreutils

#Alpine
apk add coreutils

#Arch Linux
pacman -S coreutils

#Kali Linux
apt-get install coreutils

#CentOS
yum install coreutils

#Fedora
dnf install coreutils

#OS X
brew install coreutils

#Raspbian
apt-get install coreutils

#Docker
docker run cmd.cat/csplit csplit

csplit 命令补充说明:


在类 Unix 操作系统上,csplit 命令根据上下文行将文件拆分为多个部分。csplit 命令用于将一个大文件分割成小的碎片,并且将分割后的每个碎片保存成一个文件。碎片文件的命名类似 xx00xx01。csplit 命令是 split 的一个变体,split 只能够根据文件大小或行数来分割,但 csplit 能够根据文件本身特点来分割文件。

本文档介绍了 ucsplit 的 GNU / Linux 版本。

csplit 命令语法:


csplit [OPTION]... FILE PATTERN...

csplit 命令选项:


-b<输出格式> 或 --suffix-format=<输出格式>:预设的输出格式其文件名称为 xx00,xx01 等,用户可以通过改变<输出格式>来改变输出的文件名;
-f<输出字首字符串> 或 --prefix=<输出字首字符串>:预设的输出字首字符串其文件名为 xx00,xx01 等,如果制定输出字首字符串为“hello”,则输出的文件名称会变成hello00,hello、01......
-k或--keep-files:保留文件,就算发生错误或中断执行,与不能删除已经输出保存的文件;
-n<输出文件名位数>或--digits=<输出文件名位数>:预设的输出文件名位数其文件名称为 xx00,xx01..... 如果用户指定输出文件名位数为“3”,则输出的文件名称会变成xx000,xx001等;
-q或-s或--quiet或——silent:不显示指令执行过程;
-z或--elide-empty-files:删除长度为 0 Byte 文件。

csplit 命令参数:


文件:指定要分割的原文件;
模式:指定要分割文件时的匹配模式。

csplit 命令实例


#从计算机中的CD创建 ISO 光盘映像。
dd if=/dev/sr0 of=/home/hope/exampleCD.iso bs=2048 conv=noerror,sync

#创建 /dev/sda 硬盘的 img 文件。 要还原该映像类型:dd if=disk1.img =/dev/sda
dd if=/dev/sda of=~/disk1.img

#将内容从 if = drive/dev/sda 复制到 of = drive/dev/sdb。
dd if=/dev/sda of=/dev/sdb

csplit 示例测试文件 server.log

$ cat server.log

SERVER-1
[con] 10.10.10.1 suc
[con] 10.10.10.2 fai
[dis] 10.10.10.3 pen
[con] 10.10.10.4 suc

SERVER-2
[con] 10.10.10.5 suc
[con] 10.10.10.6 fai
[dis] 10.10.10.7 pen
[con] 10.10.10.8 suc

SERVER-3
[con] 10.10.10.9 suc
[con] 10.10.10.10 fai
[dis] 10.10.10.11 pen
[con] 10.10.10.12 suc

需要将 server.log 分割成 server1.logserver2.logserver3.log,这些文件的内容分别取自原文件中不同的 SERVER 部分:

[root@localhost split]
$ csplit server.log /SERVER/ -n2 -s {*} -f server -b "%02d.log"; rm server00.log

[root@localhost split]
$ ls
server01.log  server02.log  server03.log  server.log

csplit 在第 5 和 23 行分割文件:

csplit file 5 23

csplit 每 5 行分割一个文件(如果总行数不能被 5 整除,这将失败):

csplit file 5 {*}

csplit 每 5 行分割一个文件,忽略精确划分错误:

csplit -k file 5 {*}

csplit 在第 5 行分割文件,并为输出文件使用自定义前缀:

csplit file 5 -f prefix

csplit 在与正则表达式匹配的行处分割文件:

csplit file /regex/

csplit 命令详细说明


/[正则表达式]/   #匹配文本样式,比如/SERVER/,从第一行到包含SERVER的匹配行。
{*}     #表示根据匹配重复执行分割,直到文件尾停止,使用{整数}的形式指定分割执行的次数。
-s      #静默模式,不打印其他信息。
-n      #指定分割后的文件名后缀的数字个数。比如01、02、03等。
-f      #指定分割后的文件名前缀。
-b      #指定后缀格式。比如%02d.log,类似于C语言中的printf参数格式。
rm server00.log    #是删除第一个文件,因为分割后的的第一个文件没有内容,匹配的单词就位于文件的第一行中。

csplit 命令扩展阅读:




csplit 命令评论