使用 wget 下载整个网站
于 2008 年 9 月 5 日
如果您需要下载整个网站,也许是为了离线浏览,wget 可以完成这项工作——例如:
$ wget \ --recursive \ --no-clobber \ --page-requisites \ --html-extension \ --convert-links \ --restrict-file-names=windows \ --domains website.org \ --no-parent \ www.website.org/tutorials/html/
此命令下载网站 www.website.org/tutorials/html/。
选项包括:
-
--recursive: 下载整个网站。
-
--domains website.org: 不要跟踪 website.org 之外的链接。
-
--no-parent: 不要跟踪 tutorials/html/ 目录之外的链接。
-
--page-requisites: 获取组成页面的所有元素(图像、CSS 等)。
-
--html-extension: 将文件保存为 .html 扩展名。
-
--convert-links: 转换链接,使其可以在本地离线工作。
-
--restrict-file-names=windows: 修改文件名,使其也能在 Windows 中工作。
-
--no-clobber: 不要覆盖任何现有文件(用于下载中断并恢复的情况)。