爬取拉勾招聘职位

作者: 夜希辰 | 来源:发表于2019-04-28 12:47 被阅读17次

爬取拉勾招聘职位

import json

import pymysql

import requests

from bs4 import BeautifulSoup

from requests.exceptions import RequestException

headers = {

    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36',

    'Host':'www.lagou.com',

    'Referer':'https://www.lagou.com/jobs/list_%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90?px=default&city=%E6%88%90%E9%83%BD',

    'X-Anit-Forge-Code':'0',

    'X-Anit-Forge-Token':'None',

    'X-Requested-With':'XMLHttpRequest',

    'Origin':'https://www.lagou.com'

    }

data = {

    'first':'true',

    'pn':'1',

    'kd':'数据分析'

}

def get_one_page(url):

    try:

        respones = requests.post(url, headers=headers, data=data)

        respones.encoding = 'utf-8'

        if respones.status_code == 200:

            return respones.text

        else:

            print("访问异常,状态码:"+ respones.status_code)

    except RequestException as e:

        print('请求错误')

        print(e)

        return None

def main():

    url = 'https://www.lagou.com/jobs/positionAjax.json?px=default&city=%E6%88%90%E9%83%BD&needAddtionalResult=false'

    html = get_one_page(url)

    print(html)

# if main() == '__main()__':

#    main()

#我写的错代码,很奔溃……

if __name__ == '__main__':

    main()

相关文章

  • 爬取拉勾招聘职位

    爬取拉勾招聘职位 import json import pymysql import requests from ...

  • 拉勾网职位信息爬取

    分析网页 通过浏览器查看网页源代码,未能找到职位信息,因此需要打开F12开发者工具抓包分析职位数据使怎样被加载到网...

  • 拉勾网职位列表爬取

    三个小爬虫的最后一个是对拉勾网职位列表的爬取,当然这里没有考虑增量爬取,也没有考虑多线程爬取,仅仅是简单的把职位列...

  • 拉勾网前端职位数据分析(Excel,Python工具)

    一、使用scrpy爬取拉勾网(厦门地区)前端职位数据数据爬取过程可以参考慕课网教程。 使用Excel数据透视表(样...

  • 爬虫—拉钩网招聘岗位爬取

    爬取拉勾网各类招聘岗位,爬取不同的岗位种类只需要初始化时候传入参数不同,爬取成功后会自动写入同目录的csv文件中,...

  • Selenium小例子

    爬取腾讯动漫 爬取某网站漫画 爬取拉勾网

  • 数据分析师薪酬?拉勾网职位爬取+分析

    ——2018.06.01——最近几天看到了很多文章写拉勾网职位爬取,那些基本是基于requests + json,...

  • 拉勾爬虫实战

    0 引言   一次简单的 Python 爬虫练习:输入 目标城市 和 目标职位,从 拉勾网 爬取相关的职位列表数据...

  • Python爬虫-拉勾网职位爬取

    感觉好久没写python了哈哈,最近都在忙工作,所以也是没有学习python。刚好凑巧朋友正在找工作,也是java...

  • requests + Beautiful爬取拉勾网职位

    这次的案例中我们会接触到Ajax动态加载的网页,可以看到,包括下一页等很多信息块都没有链接出线,所以就页数遍历上面...

网友评论

    本文标题:爬取拉勾招聘职位

    本文链接:https://www.haomeiwen.com/subject/prjdnqtx.html