版权声明: https://blog.csdn.net/gwz1196281550/article/details/83785622
$str = file_get_contents($zh_cn_url); $reg1='/<a href=\"(.*?)\".*?>(.*?)<\/a>/i';//匹配所有A标签 preg_match_all($reg1,$str,$aarray); //这个$aarray 你可以打印一下看下你具体的业务需要哪个数组 //这个$aarray 是整个抓取的核心 $reg2="/href=\"([^\"]+)/";//获取href中的值 $arr = array(); for($i=1;$i<=3;$i++){ //这里讲一下我抓取的是前三个所以只需要 1=< i <=3就可以了 //如果想取出所有需要将for改为 //for($i=0;$i<count($aarray[0][$i]);$i++) preg_match_all($reg2,$aarray[0][$i],$hrefarray); $reg3="/>(.*)<\/a>/";//a标签中的内容 preg_match_all($reg3,$aarray[0][$i],$acontent); $arr[$i]['title'] = $acontent[1][0]; $arr[$i]['url'] = $server_name.$hrefarray[1][0]; } $data = array(); foreach ($arr as $key=>$val){ $data[] = $val; }
//为什么还要用个foreach 在放进一个新的数组里 ,这里讲一下,为了迎合我的业务逻辑需要将该数组的内容变为
//array(
// array('title'=>'a中内容1','url'=>'href属性值1'),
// array('title'=>'a中内容2','url'=>'href属性值2'),
// array('title'=>'a中内容3','url'=>'href属性值3'),
// );
return $json = json_encode($data); //返回json格式当然你也可以返回数组,直接 return $data即可