使用 wget 下载整个网站

如果您需要下载整个网站,也许是为了离线浏览,wget 可以完成这项工作——例如:

$ wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains website.org \
     --no-parent \
         www.website.org/tutorials/html/

此命令下载网站 www.website.org/tutorials/html/

选项包括:

  • --recursive: 下载整个网站。

  • --domains website.org: 不要跟踪 website.org 之外的链接。

  • --no-parent: 不要跟踪 tutorials/html/ 目录之外的链接。

  • --page-requisites: 获取组成页面的所有元素(图像、CSS 等)。

  • --html-extension: 将文件保存为 .html 扩展名。

  • --convert-links: 转换链接,使其可以在本地离线工作。

  • --restrict-file-names=windows: 修改文件名,使其也能在 Windows 中工作。

  • --no-clobber: 不要覆盖任何现有文件(用于下载中断并恢复的情况)。

加载 Disqus 评论