之前下载页面一直使用的单页模板扒手,随着大部分网址都升级到https免费单页模板扒手已经不够用了,最近学了python 就想着用 python写一个。
github
https://github.com/yelingkong/python-html-down
使用方法
安装依赖
pip install -r requirements.txt
修改main.py的代码
downurl = "https://www.wanjunshijie.com" # 需要下载的地址
path = 'web' # 要保存的目录
file = 'index.html' # 要保存的文件名
运行python
python main.py
更新日志
2021年04月30日
当文件夹中存在同名的文件时,会重命名新文件,避免覆盖
对比之前和重命名的文件判断内容是否相同,相同则删除最新的文件,不同则保留两个文件
2021年05月03日
css文件下载重命名只修改最后一次
下载css文件内的图片和字体文件
下载文件时携带Referer 避免防盗链导致无法下载
添加懒加载图片中的下载
2021年05月04日
下载页面中以style形式的背景图片
2021年05月05日
处理win下面报错无法保存问题