PHP正则表达式提取超链接及其标题_PHP技巧_黑客防线网安服务器维护基地--Powered by WWW.RONGSEN.COM.CN

PHP正则表达式提取超链接及其标题

作者:黑客防线网安PHP教程基地 来源:黑客防线网安PHP教程基地 浏览次数:0

本篇关键词:及其标题链接提取
黑客防线网安网讯:  有这么一段HTML,比较不规则的,如果要提取其中的链接地址和链接名称,怎么弄?    //HTML    $str='<aid="top8"href="http://list.mp3.baidu.com/song/A.htm?top8"class="...
  有这么一段HTML比较不规则的如果要提取其中的链接地址和链接名称,怎么弄?
  
  //HTML
  
  $str='<aid="top8"href="http://list.mp3.baidu.com/song/A.htm?top8"class="p14"target="_top">歌曲列表</a><br><atarget="_blank"id="bp"href="http://list.mp3.baidu.com/list/bangping.html"class="p14">中文金曲榜</a><br><tdnowrap="nowrap">&#8226;&nbsp;<aid="top19"href="qingyinyue.html?top19"class="p14"target="_top">轻音乐</a></td>';
  
  利用正则表达式是最简单的,其它的办法,偶米去想
  
  $pat='/<a(.*?)href="(.*?)"(.*?)>(.*?)</a>/i';
  
  preg_match_all($pat,$str,$m);
  
  输出方法:
  
  print_r($m[2]);
  
  print_r($m[4]);
  
  或者:
  
  for($i=0;$i<count($m[2]);$i++){
  
  echo'<li><ahref="'.$_SERVER['PHP_SELF'].'?url='.$m[2][$i].'">'.$m[4][$i].'</a>';
  
  }
  
  显示结果是:
  
  Array([0]=>http://list.mp3.baidu.com/song/A.htm?top8[1]=>http://list.mp3.baidu.com/list/bangping.html[2]=>qingyinyue.html?top19)Array([0]=>歌曲列表[1]=>中文金曲榜[2]=>轻音乐)
  
  于是,我们要采集某个网站的标题及链接地址方法就出来了。。。自己套用吧。。。
  
  
    黑客防线网安服务器维护方案本篇连接:http://www.rongsen.com.cn/show-17354-1.html
网站维护教程更新时间:2012-09-21 05:17:15  【打印此页】  【关闭
我要申请本站N点 | 黑客防线官网 |  
专业服务器维护及网站维护手工安全搭建环境,网站安全加固服务。黑客防线网安服务器维护基地招商进行中!QQ:29769479

footer  footer  footer  footer