获取所有tr标签

注:tr并不是一个字符串类型,他是一个tag类型

能通过字符串输出的原因就是实现了__repr__方法

获取第二个tr标签

会发现find_all返回的是一个ResultSet类,其实它是列表的一个子类,可以通过列表的方式操作

获取所有class等于even的tr标签

将所有id等于test,class也等于test的a标签提取出来

获取所有a标签的href属性

获取所有职位信息

find_all的使用:

在提取标签的时候第一个参数是标签的名字,如果需要对提取的标签属性就行过滤,可以通过关键字的参数形式,把对应的属性传到属性名字中,也可以使用attrs属性,传一个字典进去

有的时候需要限制提取标签的个数,可以使用limit属性进行限制

find和find_all的区别:

find是找到第一个满足的条件就返回了,find_all是满足的所有标签都返回

string,stripped_strings,string属性以及get_text方法:

string:获取某个标签下非标签的字符串,返回的是字符串,如果有多行的话就会获取不到了

strings:获取某个标签下子孙标签的非标签字符串,返回的是生成器,可以转成列表进行操作

stripped_strings:获取某个标签下子孙标签的非标签字符串,并去掉空白字符,返回的是生成器,可以转成列表进行操作

get_text:获取某个标签下子孙标签的非标签字符串,不是以列表的形式返回,只是一个字符串