在网页中,使用grep,sort,uniq,wget获取链接的文档(doc ,docx,xls,xlsx,pdf,ppt,pptx ... )

・1 分钟阅读

获取网页中链接的文档(doc ,docx,xls,xlsx,pdf,ppt,pptx ... ),

curl https://www.domain.com/ | grep -Eo"(http|https)://[a-zA-Z0-9./?=_-]*.*(doc|docx|xls|xlsx|ppt|pptx|pdf)" | sort | uniq > list.txt | wget list.txt
Hujiuxiang profile image