在文本中查找所有唯一的4个字母的单词

・1 分钟阅读

 $ cat ipsum.txt | perl -ne 'print map("$_n", m/w+/g);' | tr A-Z a-z | sort | uniq | awk 'length($1) == 4 {print}'

说明

  • perl正规表达式模式m/w /g将匹配连续的非字符,生成源字符串中所有单词的列表,
  • map("$_n", @list)转换列表,在每个元素末尾添加一个新行,
  • tr A-Z a-z将大写字母转换为小写
  • 在awk中 length($1) == 4 {print} 方法:对于符合筛选条件"第一列的长度为4"的行,执行代码块,在本例中只是打印
Hujiuxiang profile image