原理很简单,一看即懂。操作粗暴简单,哈哈。
href.php
<?php
header("Content-type: text/html; charset=utf-8");
$num = 0;
for ($page=1; $page <99 ; $page++) {
$html = file_get_contents('https://blog.csdn.net/Cai181191/article/list/'.$page.'?');
$dom = new DOMDocument();
@$dom->loadhtml($html);
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate('/html/body//main/div/div/h4/a');
if ($hrefs->length==0) {
print_r('<br/>'.'====================已经抓取到尾页了===================='.'<br/>');
break;
}
else{
for ($i = 0; $i < $hrefs->length; $i++) {
$href = $hrefs->item($i);// 获取a标签元素
$url = $href->getAttribute('href');// 获取a标签元素href属性的值
print_r($url.'<br/>');
$num++;
}
}
}
print_r('一共有'.$num.'篇文章');
?>
效果:
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/151212.html