The current repo belongs to Paused status, and some functions are restricted. For details, please refer to the description of repo status
1 Star 0 Fork 152

沉默 / ghost-login
Paused

forked from liinux / ghost-login
Paused
 
Create your Gitee Account
Explore and code with more than 12 million developers,Free private repositories !:)
Sign up
This repository doesn't specify license. Please pay attention to the specific project description and its upstream code dependency when using it.
Clone or Download
contribute
Sync branch
Cancel
Notice: Creating folder will generate an empty file .keep, because not support in Git
Loading...
README

Ghost-login


  • 此处所说的模拟登录不是指利用网站本身提供的认证API接口进行登录,主要是通过分析前端代码,摸清登录认证原理、核心加密代码,然后程序模拟,来实现自动登录网站的过程;
  • 专门用来解决爬虫采集相关网站数据时模拟登录,验证码自动识别的问题;欢迎加入一起开发完善。
  • Specifically designed to solve the crawler when collecting Internet web data who need to login the web-site by useing some Simulated ways. The Ghost-login will verificate the captcha code automatically; Welcome to join in together to develop and improve it.

主要基于以下第三方lib及技术

  1. HttpComponents 4.5.x HTTP请求以及响应
  2. Selenium 2.53.x 模拟自动登录
  3. Bouncycastle 加密解密
  4. Tesseract-ocr 验证码Tesseract识别
  5. Captcha-Recognize验证码LibSVM识别

模拟登录一些常见的网站Done

Will todo list

  1. 重构代码,增加可扩展性
  2. 增加简单验证码识别模块;
  3. 重新组织文件结构和代码风格;
  4. 增加可扩展性,方便添加新的功能;

tips of pull request

欢迎大家一起来 pull request

  1. 兼容JDK1.8版本;
  2. 自动模拟登录新的网;
  3. 改进bug, 完善代码;
  4. 增加新的模拟自动登录的方法;

something to add

  1. 网站的前端更新、验证、变化较快,若不能用了请及时告知,我会定期修改完善,同时热烈欢迎有兴趣的加入我们。
  2. 接下来最重要的是重构代码,让大家可以更容易的做出一些满足个性需求的功能。
  3. 如果你觉得某个网站的登录很有代表性,欢迎在 issue 中提出,如果你感觉网站的模拟自动登录很有意思,加入我们吧。
  4. 验证码的识别模块还有待完善...

除责申明

  1. 本开源项目仅为技术交流此一目的,严禁用于其他任何商业、违法犯罪、恶意攻击等行为;
  2. 若第三者用此项目侵犯相关网站权益,一切责任自负;
  3. 若本项目侵犯相关网站、个人,组织机构权益,请及时联系;

交流讨论

本项目会不断更新,欢迎提交有难度的登录网站;

  1. 开源网络爬虫QQ交流群:322937592 网络爬虫&数据分析
  2. Email address: liinux # qq.com
  3. 微信号:WebCrawlerAIDA

联系作者

扫码关注官方公众号和官方微信群

微信公众号 扫码企鹅群

Empty file

About

专门用来解决爬虫采集相关网站数据时模拟自动登录,验证码自动识别的问题;欢迎加入一起开发完善。 expand collapse
Cancel

Releases

No release

Contributors

All

Activities

Load More
can not load any more
Java
1
https://gitee.com/fengyunliu/ghost-login.git
git@gitee.com:fengyunliu/ghost-login.git
fengyunliu
ghost-login
ghost-login
master

Search