Skip to content

soulahan/PowerSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PowerSpider

PowerSpider基于requests、lxml、封装成简单的爬虫。将给您避免大量的重复工作

便捷易用的PowerSpider提供以下功能

  • 智能化解析编码(二进制、中文、英文更多)
  • 解放双手,开箱即用。

PowerSpider 原理可参见释放双手,封装爬虫

使用要求

  • Python 版本不低于3.6
  • gcc 正常且完成安装

安装依赖包

强烈推荐使用 Condavirtualenv 创建虚拟环境,Python 版本不低于 3.6。

运行示例

from powerspider.Download import downloader

print(downloader("https://www.baidu.com")[:100])

# 2020-11-09 16:08:35.365 | INFO     | powerspider.Download:downloader:7 - Scraping https://www.baidu.com
# <!DOCTYPE html>
# <!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charse
# 2020-11-09 16:08:37.744 | INFO     | powerspider.Download:downloader:18 - Redirect_URL: https://www.baidu.com/

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages