采集电商平台中的店铺、产品属性,销量及评价信息,可用于复制爆款、潜在市场挖掘及舆情分析。
二、具体案例
1、目标网站:以采集淘宝店铺为例,网址http://www.taobao.com
①在淘宝首页输入关键词进行检索,对检索结果中的店铺实施采集;
②对店铺信息以及店铺内相应产品的信息实施采集。
①价格、销量等属性有时是在js文件中动态加载的,在网页源代码中没有相应的描述,因此通过源代码解析无法完成采集;
②频繁访问页面有时会出现验证码,影响采集实施的效率。
使用火车浏览器的xpath采集,可以直接点击提取页面上的价格、销量等;如果出现验证码,可以使用自动打码功能。
可采集电商平台中的店铺名称、产品链接、产品名称、价格、销量、店铺地址,店铺评分等。