PHP Simple HTML DOM或者phpQuery可以直接取得某些div中的内容,里面有几个例子专门针对于网页抓取,调整好抓取频次,舍去已经存在的数据,你可以参考下
成都创新互联,为您提供成都网站建设公司、成都网站制作、网站营销推广、网站开发设计,对服务成都石雕等多个行业拥有丰富的网站建设及推广经验。成都创新互联网站建设公司成立于2013年,提供专业网站制作报价服务,我们深知市场的竞争激烈,认真对待每位客户,为客户提供赏心悦目的作品。 与客户共同发展进步,是我们永远的责任!
;id=57class=2
这个就比较简单的,你可以用正则去匹配出来你需要的值,不过像你这个页面返回的直接就是一个JSON格式的字符串,你完全可以把它转为数组格式,然后再直接取值即可。
?php
header("content-type:text/html; charset=utf-8");
$fileurl="url2.txt";
$gdomain = @file_get_contents($fileurl,r);//获取文件url2.txt内容
$gdomain = split("\n",$gdomain);
set_time_limit(0);
ob_end_flush();//关闭缓存
foreach($gdomain as $key=$domain){
$url="http://".$domain;
$fp = @fopen($url,r) or die ("超时,或网络无法连接!");
$gcont = @file_get_contents($url);
$pattern1='title(.*)/title';
@preg_match_all($pattern1,$gcont,$rg);
//保存到本地
$of = fopen('temp.txt','a');//创建并打开temp.txt
if($of){
if(!empty($rg[1])){
//
//对比两个文本内容是否一致实现
//
//
echo "a href='$url'$domain/a 当前标题: ".$rg[1]."br/";
fwrite($of,$rg[1]);
}else {
echo "a href='$url'$domain/a 标题不存在!br/";
fwrite($of,"null \r\n");//标记为null
}
}
fclose($of);
flush();
sleep(3);
}
?