使用Unix命令从文件中删除不可打印的ASCII字符

・1 分钟阅读

由于各种原因,你可以在Unix文件系统上使用带有二进制字符的文本文件。

使用Unix'tr'命令删除垃圾字符

最简单的解决方案是使用Unix tr命令。以下是从Unix文本文件中删除不可打印二进制字符(垃圾)所需的全部内容:

tr -cd '11121540-176' < file-with-binary-chars > clean-file

此命令使用-c和-d参数对tr命令中的所有字符(除以单引号显示的ASCII八进制值),此命令允许以下字符通过Unix过滤器:

octal 11: tab
octal 12: linefeed
octal 15: carriage return
octal 40 through octal 176: all the"good" keyboard characters 

在这个转换进程中,所有其他二进制字符- -文件中的垃圾"字符- -都会被去掉。

关于ASCII字符的更多信息

有关ASCII字符的详细信息,请查看以下任一站点的ASCII字符表:

Syq2803 profile image