PHP抓取网页的所有超链接的代码问题_PHP技巧_黑客防线网安服务器维护基地--Powered by WWW.RONGSEN.COM.CN

PHP抓取网页的所有超链接的代码问题

作者:黑客防线网安PHP教程基地 来源:黑客防线网安PHP教程基地 浏览次数:0

本篇关键词:代码问题链接所有
黑客防线网安网讯:  通用HTML标准超链接参数取得正则表达式测试    因为最近要做一个类似专业搜索引擎的东西,需要抓取网页的所有超链接。    大家帮忙测试一下子,下面的代码是否可以针对所有的标...
  通用HTML标准超链接参数取得正则表达式测试
  
  因为最近要做一个类似专业搜索引擎的东西需要抓取网页的所有超链接
  
  大家帮忙测试一下子下面的代码是否可以针对所有的标准超链接
  
  测试代码如下:
  
  <?php
  
  //--------------------------------------------------------------------------
  
  //Filename:Noname1.php
  
  //Description:通用链接参数获取正则表达式测试
  
  //Requirement:PHP4(http://www.php.net)
  
  //Copyright(C),HonestQiao,2005,AllRightsReserved.
  
  //Author:HonestQiao(honestqiao@hotmail.com)
  
  //参数说明:
  
  //$strSource:包含标准链接的HTML网页
  
  //$strResult:处理的结果
  
  //附加说明:
  
  //标准链接,使用<a></a>形势包含的链接
  
  //--------------------------------------------------------------------------
  
  $strSource=<<<HTML
  
  <ahref=1.htm>t1</a>
  
  <ahref='2.htm'>t2</a>
  
  <ahref="3.htm">t3</a>
  
  <ahref=4.htmclass=link>t4</a>
  
  HTML;
  
  preg_match_all('/<a.*?(?:|\t|\r|\n)?href=['"]?(.+?)['"]?(?:(?:|\t|\r|\n)+.*?)?>(.+?)</a.*?>/sim',$strSource,$strResult,PREG_PATTERN_ORDER);
  
  for($i=0;$i<count($strResult[1]);$i++)
  
  {
  
  printf("%dhref=(%s)title=(%s) ",$i,$strResult[1][$i],$strResult[2][$i]);
  
  }
  
  ?>
    黑客防线网安服务器维护方案本篇连接:http://www.rongsen.com.cn/show-17502-1.html
网站维护教程更新时间:2012-09-21 05:20:10  【打印此页】  【关闭
我要申请本站N点 | 黑客防线官网 |  
专业服务器维护及网站维护手工安全搭建环境,网站安全加固服务。黑客防线网安服务器维护基地招商进行中!QQ:29769479

footer  footer  footer  footer