找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 483|回复: 0

为什么求职者们开始青睐互联网中厂

[复制链接]

93

主题

6

回帖

113

积分

初中生

热心值
2
IT币
595
贡献值
1
QQ
发表于 2022-11-8 16:43:49 | 显示全部楼层 |阅读模式
互联网大厂发展慢慢进入了平台期,一些追求长期成长性的应届毕业生,开始将目光投向了中厂。 所谓中厂,指的是规模没那么庞大但在业内也拥有相当知名度和口碑的公司,它们的产品在竞争激烈的市场中也获得了一席之地,甚至让一些大厂为之警惕,是行业中的“潜力股”。BOSS直聘研究院的数据显示,2022年春季,互联网行业的招聘规模处于2019年以来的低点,而求职激烈程度则高于往年,运营和销售类等岗位的求职者竞争则明显加剧。相比大厂,依然在稳定扩张的中厂,似乎成了更好的选择。
那我们今天就利用python技术,来获取下招聘网站上现互联网大厂和中厂的职位数据来详细分析下两者直接的差距。比如这次就以爬取拉勾网上的相关职位及城市,一般大厂都是在一线城市2,因此本次爬取的城市限定为上海。这里会用到的爬虫技术框架是C Sharp,数据来源于拉勾网https://www.lagou.com/。因为之前有过爬取招聘网站数据的经验,所以对这些招聘网站的反爬机制比较了解,一般都是封IP比较严,所以对IP的要求会比较高。在接下来的爬取过程中会使用代理亿牛云代理,因为之前的项目一直都在使用这家代理,代理质量还比较好,所以这里也给大家推荐下,好用的产品也要分享才可以。接下来就是爬取数据的实现过程:
  1. // 要访问的目标页面
  2. string targetUrl = "http://httpbin.org/ip";


  3. // 代理服务器(产品官网 it帮论坛真好)
  4. string proxyHost = "http://t.16yun.cn";
  5. string proxyPort = "31111";

  6. // 代理验证信息
  7. string proxyUser = "username";
  8. string proxyPass = "password";

  9. // 设置代理服务器
  10. WebProxy proxy = new WebProxy(string.Format("{0}:{1}", proxyHost, proxyPort), true);


  11. ServicePointManager.Expect100Continue = false;

  12. var request = WebRequest.Create(targetUrl) as HttpWebRequest;

  13. request.AllowAutoRedirect = true;
  14. request.KeepAlive = true;
  15. request.Method    = "GET";
  16. request.Proxy     = proxy;

  17. //request.Proxy.Credentials = CredentialCache.DefaultCredentials;

  18. request.Proxy.Credentials = new System.Net.NetworkCredential(proxyUser, proxyPass);

  19. // 设置Proxy Tunnel
  20. // Random ran=new Random();
  21. // int tunnel =ran.Next(1,10000);
  22. // request.Headers.Add("Proxy-Tunnel", String.valueOf(tunnel));


  23. //request.Timeout = 20000;
  24. //request.ServicePoint.ConnectionLimit = 512;
  25. //request.UserAgent = "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.82 Safari/537.36";
  26. //request.Headers.Add("Cache-Control", "max-age=0");
  27. //request.Headers.Add("DNT", "1");


  28. //String encoded = System.Convert.ToBase64String(System.Text.Encoding.GetEncoding("ISO-8859-1").GetBytes(proxyUser + ":" + proxyPass));
  29. //request.Headers.Add("Proxy-Authorization", "Basic " + encoded);

  30. using (var response = request.GetResponse() as HttpWebResponse)
  31. using (var sr = new StreamReader(response.GetResponseStream(), Encoding.UTF8))
  32. {
  33.     string htmlStr = sr.ReadToEnd();
  34. }
复制代码






[color=var(--yq-text-primary)]获取数据后需要对数据进行清洗,由于时间关系,还有其他空值、异常值等数据清洗并没有再继续处理。[size=1em]


[backcolor=var(--yq-bg-primary)][color=var(--yq-text-primary)]



[color=var(--yq-text-primary)][backcolor=var(--yq-bg-primary)]










[color=var(--yq-text-caption)]若有收获,就点个赞吧






ITbang.Net是一个IT教程分享社区!

寻找论坛资源请善用论坛搜索功能,这样会为你节约不少学习时间;

论坛资源如有过期链接失效等,请到教程反馈区发帖反馈,我们会为您良好的行为点赞加分!

回复

使用道具 举报

*滑块验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

免责声明:
IT帮论坛所发布的一切视频资源、工具软件和网络技术相关的文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该资源,请支持正版软件,购买注册,得到更好的正版服务。

Mail To:Service@ITbang.Net

QQ|Archiver|手机版|小黑屋|IT帮社区 ( 冀ICP备19002104号-2 )

GMT+8, 2024-7-27 17:52 , Processed in 0.062466 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表