如题,蓝天采集器要采集多层级的网页时,例如一些常见的模板站。模板站除了有列表页,详情介绍页,然后还有一个展示演示地址的DEMO页面,而DEMO页面里面又是框架调用了外部的链接。这种情况下如何使用蓝天集体器来采集呢?
其他的设置照常如采集普通网站一样设置,然后到内容起始页的时候我们这样来设置。如图:
首先,加多一个层级:
然后点开这个层级进行设置他的抓取列表内容。这里抓取的就是我们平时采集时的列表页,抓取有多少篇文章。
设置好之后,第二步:设置详情页中点击打开的DEMO网址获取地址。也就是详情页中的跳转地址。
列表设置就设置完了。现在是设置内容页。选择你想要获取的字段,可以从刚才的列表中获取,也可以说跳转后的内容页中获取。
设置完成,并保存,就可以进入采集发布了。是不是很简单呢?希望对您有所帮助。
像这种谷歌自带的人机身份验证,实际上有很多插件可以实现。但是有客户看他们同行都用的谷歌的这种,也让我...
假如你的网站被黑了,**次打开网页时显示跳转到其他网站。再打开时却正常。不要以为网站没事。请注意查一...
欧盟地区包括27个成员国。这些国家分别是奥地利、比利时、保加利亚、塞浦路斯、克罗地亚、捷克共和国、丹...
看到有小伙伴在问做外贸怎么收款,今天我就简单讲下做外贸的几种收款方式:💰1:个人银行卡美金收款一年收...