csdn积分任务小脚本

今天想下载个资源发现没有积分了,做了个任务,任务要求:点击【执行任务】,跳转至CSDN JOB最懂程序员的招聘会首页:http://job.csdn.net/event/zpweb/index.html 2.数一数共有“多少家”企业负责人的名字是“两个字”的(例如甘泉、邹达)3.返回任务页面,点击【领取奖励】4.将数字填写至横线处。

根据这个任务需求发现可以写个小脚本来实现,也是想练习一下代码,老也不写代码,写了几行python 脚本都调了半天,利用这个机会顺便又温习了一下正则的写法。]下面是代码。主要就是把网页内容读下来,在根据企业负责人名字所在html标签信息写了个正则,把网页内容中符合的都匹配出来在做进一步提取,提取名字求出两个字的名字总数输出。

import urllib2
import re
count2zi,count3zi = 0,0
html = urllib2.urlopen('http://job.csdn.net/event/zpweb/index.html').read()

pattern = re.compile(ur'<span class="name"><a href="cto/\d{6}\.html" target="_blank">.*</a></span>')
match = pattern.findall(html)
print len(match)
for line in match:
    posstart = line.find('_blank">')
    posend =  line.find('</a></span>')
    line = line[posstart+8:posend].strip(' \r\n')
    print line,len(line)
    if 6==len(line):
        count2zi += 1
    elif 9==len(line):
        count3zi += 1
    else:
        pass
print 'name len is 2 count:',count2zi
相关文章
相关标签/搜索