特征筛选器-弊端

2019-8-13 1283

首先很感谢UB的工程师与运营人员的付出,使用UB几个月以来,帮助我不少忙。

本次我碰到的问题是,对某个论坛帖子进行抓取数据的时候,发现每个帖子中关键词A的信息位置不一致。导致筛选器执行报错。请看图一: 我抓的关键词位置,有时出现在 tablerow:"5",有时是 tablerow:"6",造成这种情况的原因是有些帖子是5 行信息,有的是6行信息。 请问这种情况有什么解决办法?  是否可以按关键词呢,比如我看web Scraper 它们取值是 tr:contains('作者:') td[width] ,也就是按关键词定位,然后取想要的值“某某某”(如图二)。


(图1)

_特征筛选器-弊端

(图2)

_特征筛选器-弊端

_特征筛选器-弊端

最新回复 (3)
  • 薇~ 2019-8-14
    2
    可以尝试将有变化的元素特征去掉,或者使用通配符修改元素特征内容
  • 2019-8-14
    3
    这个回复等于是没回复一样。。我白写那么多。。
  • 哒哒 2019-8-14
    4
    试试CSS
返回
发新帖