1 Star 0 Fork 2

zikang / parseHtml

forked from 同名自定义 / parseHtml 
加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
0BSD

parseHtml

介绍

目标网站解析器,可以把网站整体下载下 来主要功能:

  1. 解析css链接,及其内容内的静态文件
  2. img文件
  3. js文件
  4. css行内,style,以及css链接中的内部图片资源的解析

特别声明

  1. 不得用本开源攻击,破坏他人网站,侵权他人信息.不得随意修改代码内的间隔时间(需要保护目标网站,因解析时过多的访问请求,拖累网站负担)
  2. 不得用来牟利
  3. 不得用来违法
  4. 不得用来侵权
  5. 我不会满足任何人的需求开发本代码
  6. 开源只是学习,研究.非作它用.如果你想补充请提交代码

我 不回复任何使用问题,不提供任何咨询,如果克隆下来发现使用不了,请立即删除,不要来询问如何使用.

软件架构

python3.10+

BeautifulSoup

使用说明

  1. git克隆后
  2. 本目录打开main.py,在listurl中填写需要解析的网站
  3. 打开终端本目录位置运行py main.py

安装教程

  1. 直接 py main.py,发现了少了哪块模块,自己pip install安装上

参与贡献

  1. Fork 本仓库
  2. 新建 Feat_xxx 分支
  3. 提交代码
  4. 新建 Pull Request
Copyright (c) 2022 同名自定义 Permission to use, copy, modify, and/or distribute this software for any purpose with or without fee is hereby granted. THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.

简介

目标网站解析器,可以把网站整体下载下来主要功能: 解析css 静态文件 img文件 js文件 css行内,style,以及css链接中的内部图片资源的解析 展开 收起
Python
0BSD
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Python
1
https://gitee.com/catcanfly/parse-html.git
git@gitee.com:catcanfly/parse-html.git
catcanfly
parse-html
parseHtml
master

搜索帮助