蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 1257|回复: 1
收起左侧

[人力资源] 猎聘网就业招聘形式分析

[复制链接]
药徒
发表于 2018-3-17 20:52:12 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 calvin 于 2018-3-17 20:52 编辑

简介

本次从猎聘网上获取了4400条招聘信息,信息内容包括:岗位,工作年限要求,薪资。然后对该数据进行清洗,删除研发、销售、IT、行政等岗位。仅保留质量部、工程部、生产部、统计分析、注册、仓库的数据。以为已在药厂从事相关工作的朋友提供一个参考。如需所有原始数据,请自行用附件A的R代码爬取。本报告仅分析岗位需求。
注:本次数据获取仅自行研究和有限范围的展示,其它人请勿用做它用以及一些有可能损害相关利益方利益的行为。

数据清洗
  1. library(stringr)
  2. library(ggplot2)
  3. td<-read.csv("drugpositionclean.csv",stringsAsFactors = FALSE)
  4. td$group<-td$position
  5. td$group[str_detect(td$position,pattern="\\w*QA\\w*")]<-"QA"
  6. td$group[str_detect(td$position,pattern="\\w*QC\\w*")]<-"QC"
  7. td$group[str_detect(td$position,pattern="\\w*质量\\w*")]<-"Quality"
  8. td$level[str_detect(td$position,pattern="\\w*主管\\w*")]<-"主管"
  9. td$level[str_detect(td$position,pattern="\\w*经理\\w*")]<-"经理"
  10. td$level[str_detect(td$position,pattern="\\w*主任\\w*")]<-"主任"
  11. td$level[str_detect(td$position,pattern="\\w*总监\\w*")]<-"总监"
  12. td$level[is.na(td$level)]<-"None"
复制代码

岗位分布

对频次只有1的进行合并,合并为“其它”,画折线图,我们可以看出质量相关人员需求还是蛮大的。td$group[td$group %in% names(table(td$group))[table(td$group)==1]]<-"other"
  1. podis<-sort(table(td$group),decreasing = T)
  2. podis<-data.frame(podis=podis[c(2:length(podis),1)])
  3. ggplot(podis,aes(x=podis.Var1,y=podis.Freq))+geom_bar(stat="identity")+theme_bw()+theme(axis.text.x=element_text(angle=90,vjust=0.5,size=rel(0.9)))+geom_text(aes(label=podis.Freq),vjust=-0.3,size=2.5)
复制代码



对于质量部QA相关人员,我们再进行详细的挖掘。QAdetail<-td$position[str_detect(td$position,pattern="\\w*QA\\w*")]
  1. QAdetail<-sort(table(str_sub(QAdetail,start=1,end=4)),decreasing = T)
  2. ggplot(data.frame(QAdetail),aes(x=Var1,y=Freq))+geom_bar(stat="identity")+theme_bw()+geom_text(aes(label=Freq),vjust=-0.3)
复制代码



附件A

爬虫代码
  1. {r,echo=TRUE,eval=FALSE}
  2. library(Rwebdriver)
  3. library(XML)
  4. library(stringr)
  5. # Run the server
  6. start_session(root="http://localhost:4444/wd/hub/",browser="chrome")
  7. # Get the subject list.
  8. post.url("https://www.liepin.com/zhaopin/?industryType=industry_10&fromSearchBtn=2&ckid=80b9029c43a8be95&industries=270&init=-1&flushckid=1&headckid=80b9029c43a8be95&d_pageSize=40&siTag=1B2M2Y8AsgTpgAmY7PhCfg%7EfA9rXquZc5IkJpXC-Ycixw&d_headId=db463eab01d5e0a26aca705a4e4b76ae&d_ckId=db463eab01d5e0a26aca705a4e4b76ae&d_sfrom=search_fp_nvbar&d_curPage=0")
  9. pagesource<-page_source()
  10. Encoding(pagesource)<-"UTF-8"
  11. pagesource
  12. pagesource <- htmlParse(pagesource,encoding = "UTF-8")
  13. xpathSApply(pagesource,"//div[@class='job-info']//a",xmlValue)
  14. url_list<-str_extract_all(pagesource,"coser/detail/\\d*/\\d*")
  15. url_list<-str_c("https://bcy.net/coser/detail",unlist(str_extract_all(unlist(url_list),"/\\d*/\\d*")))
  16. # Create the handle
  17. handle<-getCurlHandle(useragent=str_c(R.version$platform,R.version$version.string,sep=", "),httpheader=c(from="111@qq.com"))
  18. # Define download function
  19. downloadPIC<-function(url_list){
  20.   dir.create(paste0("E:\\image\",Sys.Date()))
  21.   for(i in 1:length(url_list)){
  22.     post.url(url=url_list[i])
  23.     pagesource_pic<-page_source()
  24.     Encoding(pagesource_pic)<-"utf-8"
  25.     pic_list<-unlist(str_extract_all(pagesource_pic,"https:.*?\\.jpg"))
  26.     for(j in 1:length(pic_list)){
  27.       writeBin(getBinaryURL(pic_list[j]),paste0("E:\\image\",Sys.Date(),"\",i,"-",j,".jpg"))
  28.     }
  29.   }
  30. }
复制代码


更多内容请关注微信公众号:DataSciences
qrcode_for_gh_454c111c2639_258.jpg
回复

使用道具 举报

药徒
发表于 2018-3-19 16:56:59 | 显示全部楼层
原来是这么的“吃香”啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-2-23 09:01

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表