在网页中,使用grep,sort,uniq,wget获取链接的文档(doc ,docx,xls,xlsx,pdf,ppt,pptx ... )
Hujiuxiang
・1 分钟阅读
获取网页中链接的文档(doc ,docx,xls,xlsx,pdf,ppt,pptx ... ),
curl https://www.domain.com/ | grep -Eo"(http|https)://[a-zA-Z0-9./?=_-]*.*(doc|docx|xls|xlsx|ppt|pptx|pdf)" | sort | uniq > list.txt | wget list.txt