最新消息:20210917 已从crifan.com换到crifan.org

【基本解决】uiautomator2中查找和定位安卓浏览器中百度搜索结果中描述文字和来源网站

安卓 crifan 711浏览 0评论
折腾:
【未解决】uiautomator2模拟安卓浏览器的百度搜索后去获取和解析搜索结果
期间,继续去看看,如何获取标题外的描述文字和网站来源
如果想要找 描述文字
对比半天,才找到能区分开的规则:
是results下面的,固定的
只能从父级元素去找:
d.xpath('//*[@resource-id="results"]/android.view.View[1]/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]')
d.xpath('//*[@resource-id="results"]/android.view.View[2]/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]')
然后看看如何写代码去解析
本来是打算从顶层找的
现在发现,也可以从
title的button,去向上,然后再向下找sibling去找,即:
去写代码试试
    # get description text
    titleParentElem = eachTitleButtonElement.parent
    titleParent2Elem = titleParentElem.parent
发现此处已经是 XMLElement了,不是Xpath的Selector,没法用xpath的语法去找sibling
好像不方便
先调试看看
或者去找 xml的element,如何找sibling
uiautomator2/XPATH.md at master · openatx/uiautomator2 (github.com)
XMLElement的操作
没找到parent或sibling
去看看uiautomator2的源码
/Users/xxx/.pyenv/versions/3.8.0/Python.framework/Versions/3.8/lib/python3.8/site-packages/uiautomator2/xpath.py
class XMLElement(object):
    def __init__(self, elem, parent: XPath):
        """
        Args:
            elem: lxml node
            d: uiautomator2 instance
        """
        self.elem = elem
        self._parent = parent
        self._d = parent._d

。。。
    def click(self):
        """
        click element, 100ms between down and up
        """
        x, y = self.center()
        self._parent.send_click(x, y)

...
    @property
    def text(self):
        return self.elem.attrib.get("text")


    @property
    def attrib(self):
        return self.elem.attrib


    @property
    def info(self):
        ret = {}
        for key in ("text", "focusable", "enabled", "focused", "scrollable",
                    "selected"):
            ret[key] = self.attrib.get(key)
        ret["className"] = self.elem.tag
        lx, ly, rx, ry = self.bounds
        ret["bounds"] = {'left': lx, 'top': ly, 'right': rx, 'bottom': ry}
        ret["contentDescription"] = self.attrib.get("content-desc")
        ret["longClickable"] = self.attrib.get("long-clickable")
        ret["packageName"] = self.attrib.get("package")
        return ret
只是普通各种函数。
调试看,也的确没有parent
不过注意到有个_parent
好像是Xpath?
去看看?
parent会报错
Exception has occurred: AttributeError
'XMLElement' object has no attribute 'parent'
注意到代码中是:
__init__
        self._parent = parent
那去xpath找找试试
不过还是算了,用内部变量,本身就不是好做法。暂时不用。
不过还是看到之前的:
    # 多个条件定位, 类似于AND
    d.xpath('//android.widget.Button').xpath('//*[@text="私人FM"]')
是支持 xpath的xpath的
此处为何无效,搜不到,很是奇怪
不过此处看代码
/Users/xxx/.pyenv/versions/3.8.0/Python.framework/Versions/3.8/lib/python3.8/site-packages/uiautomator2/xpath.py
class XMLElement(object):
    def __init__(self, elem, parent: XPath):
        """
        Args:
            elem: lxml node
            d: uiautomator2 instance
        """
        self.elem = elem
        self._parent = parent

    def all(self, source=None):
        """
        Returns:
            list of XMLElement
        """
。。
        els = [XMLElement(node, self._parent) for node in match_nodes]
-》看来还是xpath就初始化给了_parent
-》看起来虽然是内部用的,外部用,也是可以的。
所以还是去试试_parent吧
    # get description text
    titleParentXpath = eachTitleButtonElement._parent
    titleParent2Xpath = titleParentXpath.parent()
    titleParent3Xpath = titleParent2Xpath.parent()
    descriptionElemnt = titleParent3Xpath.xpath("//android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]").get()
    print("descriptionElemnt=%s" % descriptionElemnt)
结果:
titleParent2Xpath = titleParentXpath.parent()
报错:
Exception has occurred: AttributeError
'XPath' object has no attribute 'parent'
算了,换其他方式。
d.xpath('//*[@resource-id="results"]/android.view.View[1]/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]')
以及再加一个
/android.view.View[1]
变成代码:
descriptionElementList = d.xpath("//*[@resource-id='results']/android.view.View[1]/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]").all()
结果:
可以找到,但是是单个元素。
再去换成:
descriptionElementList = d.xpath("//*[@resource-id='results']/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]").all()
结果:
可以找到希望的3个了
继续用代码:
# descriptionElementList = d.xpath("//*[@resource-id='results']/android.view.View[1]/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]").all()
descriptionElementList = d.xpath("//*[@resource-id='results']/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]").all()
descriptionNum = len(descriptionElementList)
print("Found %s description" % descriptionNum)

。。。
    curDescriptionElem = descriptionElementList[curIdx]
    curDescription = curDescriptionElem.text
    print("description=%s" % curDescription)
可以输出:
--------------------  [1/3] --------------------
title=在路上on the way - 走别人没走过的路,让别人有路可走
description=crifan 4周前 (03-09) 177浏览 0评论 google 收录查询谷歌收录查询,如何让Google收录网站 – 云...
继续去看看,来源网站的写法
d.xpath('//*[@resource-id="results"]/android.view.View[1]/android.view.View[1]/android.view.View[2]')
再加上:
/android.view.View[1]
即可。
以及:
再去看第二个:
d.xpath('//*[@resource-id="results"]/android.view.View[2]/android.view.View[1]/android.view.View[2]')
-》
d.xpath('//*[@resource-id="results"]/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[1]')
代码:
sourceWebsiteElementList = d.xpath('//*[@resource-id="results"]/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[1]').all()
sourceWebsiteNum = len(sourceWebsiteElementList)
print("Found %s source website" % sourceWebsiteNum)

    curSourceWebsiteElem = sourceWebsiteElementList[curIdx]
    curSourceWebsite = curSourceWebsiteElem.text
    print("curSourceWebsite=%s" % curSourceWebsite)
输出是空的
curSourceWebsite=
去搞清楚
sourceWebsiteElementList = d.xpath('//*[@resource-id="results"]/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[2]').all()
结果:
可以找到,但是只能找到2个
text依旧是空的
去看了看,写法没问题。但是为何是空?
去看了看
发现:竟然层级不同
算了,那就不去解决了。毕竟不规则的逻辑,不好处理。
以及,处理好了,此处只能找到2个,搜索的3个结果中,最后一个由于界面中只显示2个网站来源,所以是正常的。
会导致代码中不好处理。所以更加应该放弃,不去处理了。
【总结】
至此,此处用代码:
# Xpath chain search can find elements
titleButtonElementList = d.xpath("//*[@resource-id='results']//android.widget.Button[@clickable='true']").all()
titleButtonNum = len(titleButtonElementList)
print("Found %s search result title" % titleButtonNum)


# descriptionElementList = d.xpath("//*[@resource-id='results']/android.view.View[1]/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]").all()
descriptionElementList = d.xpath("//*[@resource-id='results']/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]/android.view.View[1]").all()
descriptionNum = len(descriptionElementList)
print("Found %s description" % descriptionNum)


# # sourceWebsiteElementList = d.xpath('//*[@resource-id="results"]/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[1]').all()
# sourceWebsiteElementList = d.xpath('//*[@resource-id="results"]/android.view.View/android.view.View[1]/android.view.View[2]/android.view.View[2]').all()
# sourceWebsiteNum = len(sourceWebsiteElementList)
# print("Found %s source website" % sourceWebsiteNum)


for curIdx, eachTitleButtonElement in enumerate(titleButtonElementList):
    curNum = curIdx + 1
    print("%s  [%d/%d] %s" % ("-"*20, curNum, titleButtonNum, "-"*20))
    # eachTitleButtonElemAttrib = eachTitleButtonElement.attrib
    # print("title attrib: %s" % eachTitleButtonElemAttrib)
    # curTitle = eachTitleButtonElemAttrib["text"]
    curTitle = eachTitleButtonElement.text
    print("title=%s" % curTitle)


    curDescriptionElem = descriptionElementList[curIdx]
    curDescription = curDescriptionElem.text
    print("description=%s" % curDescription)


    # curSourceWebsiteElem = sourceWebsiteElementList[curIdx]
    # curSourceWebsite = curSourceWebsiteElem.text
    # print("curSourceWebsite=%s" % curSourceWebsite)
可以搜索到title外,还能输出 描述
输出结果:
Found 3 search result title
Found 3 description
--------------------  [1/3] --------------------
title=在路上on the way - 走别人没走过的路,让别人有路可走
description=crifan 4周前 (03-09) 177浏览 0评论 google 收录查询谷歌收录查询,如何让Google收录网站 – 云...
--------------------  [2/3] --------------------
title=crifan简介 - crifan的专栏 - CSDN博客 - crifan
description=2020年2月15日crifan简介 各种计算机语言简介和总结 v1.0 08-03 本文主要介绍了各种计算机语言的分类和关系,以及记录了笔者对其中部分语言,如Word VBA,Excel...
--------------------  [3/3] --------------------
title=crifan - Bing 词典 - 必应
description=crifan网络目录;下午;我个人 网络释义 1. 目录 如何实现Linux下的U盘驱动 v0.4 -... ... Specification 规范 crifan 目录 Mass Storage ...
效果:
其中,由于来源网站source website的值,不规则,不好定位,放弃获取。
此处是即使获取到,也是只有2个(页面是就显示了2个)
且还都是空(没有获取到真正要的值)
所以懒得继续深究了。

转载请注明:在路上 » 【基本解决】uiautomator2中查找和定位安卓浏览器中百度搜索结果中描述文字和来源网站

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
90 queries in 0.202 seconds, using 23.37MB memory