php 从字符串中截取url的问题
大家好,首先,我不会php,但是有个php的问题希望大家能帮我解决下,万分感谢
我从一个php程序中调出一个字符串$longurl
这个$longurl echo 的结果是
www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>
如何截取www.csdn.net/123456 这一段呢
我在网上找的结果是
$aa = $longurl;
preg_match("/http[^\"]*/",$aa,$bb);
echo $bb[0];
但是下一段程序 我用的百度短网址api想缩短
程序是
$urlbd = '$bb[0]';
$result = getBaiduShortUrl($urlbd);
if ($result) {
echo '成功:'.$result;
} else {
die('失败');
}
function getBaiduShortUrl($urlbd) {
$data = array(
'url' => $urlbd,
);
$baidu_url = 'http://dwz.cn/create.php';
$ret = postData($baidu_url, $data);
if ($ret) {
$ret = json_decode($ret, true);
if ($ret['status'] !== 0) {
return false;
} else {
return $ret['tinyurl'];
}
} else {
return false;
}
}
function postData($urlbd, $data) {
$options = array(
CURLOPT_RETURNTRANSFER => true,
CURLOPT_HEADER => false,
CURLOPT_FOLLOWLOCATION => true,
CURLOPT_ENCODING => 'gzip,deflate,sdch',
CURLOPT_USERAGENT => 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.1 (KHTML, like Gecko) Ubuntu/11.10 Chromium/14.0.835.202 Chrome/14.0.835.202 Safari/535.1',
CURLOPT_AUTOREFERER => true,
CURLOPT_CONNECTTIMEOUT => 120,
CURLOPT_TIMEOUT => 120,
CURLOPT_MAXREDIRS => 10,
CURLOPT_REFERER=>'http://www.baidu.com/',
CURLOPT_POSTFIELDS=> $data,
);
$ch = curl_init($urlbd);
curl_setopt_array($ch, $options);
$content = curl_exec($ch);
$err = curl_errno($ch);
$errmsg = curl_error($ch);
$header = curl_getinfo($ch);
curl_close($ch);
return $content;
}
缩短的地址怎么也不对 请大家帮我看下好吗
[解决办法]
你那个正则取不到你想要的那段吧 还有 $urlbd = '$bb[0]'; 你这样子定义 $urlbd的值就是$bb[0]这一个字符串
要用双引号才会解析里面的变量 换成下面的
preg_match("/<a href=http:\/\/([^\"]+)[^<>]*>.*<\/a>/i", $aa, $bb);
$urlbd = $bb[1];
[解决办法]
刚csdn 又怂了.
如何截取www.csdn.net/123456 这一段呢
你是要从 www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>
提取www.csdn.net/123456 ?
如果是的话那可不是什么缩短网址. 方法有很多,我不清楚你还有没有其他的网址情况出现,暂时这么写吧
$str='www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>';
preg_match('/^([a-z\d\.\/]+)<a/i',$str,$match);
$urlStr=$match[1];
echo $urlStr;
结果
www.csdn.net/123456
[解决办法]
www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>
若需要截取的字符都是$s1<a ....这样的话,有必要用正则吗?
用$strArray = explode("<a", $str);分隔,这样不行吗?
[解决办法]
我的意思是:
我从一个php程序中调出一个字符串$longurl
这个$longurl echo 的结果是
www.csdn.net/123456<a href=http://www.csdn.net/123456>点击此处</a>
这个中的 $longurl 字符串是不是都是 {url地址<a>...</a>}这样的规律啊!是的话就可以用php的字符串分隔函数去分隔它,然后返回一个数组:
$strArray = explode("<a", $longurl);
print_r($strArray);
你在看看结果是咋样吧