PHP在一段文字或字符串中提取手机号码和运营商品牌

后端开发   发布日期:2023年05月17日   浏览次数:386

以下核心代码就是在一段文字中检索出有用的手机号,并且通过号段判断出运营商品牌、号码类型(移动电话、小灵通、固定电话)及是否为标准手机号码,如果检测到了就以数据形式返回,如果不是标准的手机号码就会自动过滤掉。

这段函数是从互联网上找的,用在九品源码的时候我已经修复了一些BUG,并补充了一些运营品牌方的号段。

function findThePhoneNumbers($oldStr = ""){
  // 检测字符串是否为空
  $oldStr=" ".trim($oldStr)." ";
  $numbers = array();
  if(empty($oldStr)){
return $numbers;
  }
  // 删除86-180640741122,0997-8611222之类的号码中间的减号(-)
  $strArr = explode("-", $oldStr);
  $newStr = $strArr[0];
  for ($i=1; $i < count($strArr); $i++) { 
if (preg_match("/\d{2}$/", $newStr) && preg_match("/^\d{11}/", $strArr[$i])){
  $newStr .= $strArr[$i]; 
} elseif (preg_match("/\d{3,4}$/", $newStr) && preg_match("/^\d{7,8}/", $strArr[$i])) {
  $newStr .= $strArr[$i]; 
} else {
  $newStr .= "-".$strArr[$i]; 
} 
  }
  // 手机号的获取
  $reg='/\D(?:86)?(\d{11})\D/is';//匹配数字的正则表达式
  preg_match_all($reg,$newStr,$result);
  $nums = array();
  // * 中国移动:China Mobile
  // * 134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188,172,178,195,198
  $cm = "/^1(34[0-8]|(3[5-9]|5[017-9]|7[28]|8[278]|9[58])\d)\d{7}$/";
  // * 中国联通:China Unicom
  // * 130,131,132,152,155,156,185,186,171,175,176
  $cu = "/^1(3[0-2]|5[256]|7[156]|8[56])\d{8}$/";
  // * 中国电信:China Telecom
  // * 133,1349,153,180,189,170,173,174,177,181,191,199
  $ct = "/^1((33|53|8[019]|7[0347]|9[19])[0-9]|349)\d{7}$/";
  //
  foreach ($result[1] as $key => $value) {
if(preg_match($cm,$value)){
  $nums[] = array("number" => $value, "type" => "中国移动");
}elseif(preg_match($cu,$value)){
  $nums[] = array("number" => $value, "type" => "中国联通");
}elseif(preg_match($ct,$value)){
  $nums[] = array("number" => $value, "type" => "中国电信");
}else{
  // 非法号码
}
  }
  $numbers["mobile"] = $nums;
  // 固定电话或小灵通的获取
  $reg='/\D(0\d{10,12})\D/is';//匹配数字的正则表达式
  preg_match_all($reg,$newStr,$result);
  $nums = array();
  // * 大陆地区固定电话或小灵通
  // * 区号:010,020,021,022,023,024,025,027,028,029
  // * 号码:七位或八位
  $phs = "/^0(10|2[0-5789]|\d{3})\d{7,8}$/";
  foreach ($result[1] as $key => $value) {
if(preg_match($phs, $value)){
  $nums[] = array("number" => $value, "type" => "固定电话或小灵通");
} else {
  // 非法
}
  }
  $numbers["landline"] = $nums;
  // 有可能是没有区号的固定电话的获取
  $reg='/\D(\d{7,8})\D/is';//匹配数字的正则表达式
  preg_match_all($reg,$newStr,$result);
  $nums = array();
  foreach ($result[1] as $key => $value) {
$nums[] = array("number" => $value, "type" => "没有区号的固定电话");
  }
  $numbers["possible"] = $nums;
  // 返回最终数组
  return $numbers;
}

调用示例的几种方式:

$str = "这是一段测试文字,我的手机号码是15901118888,再留下一个错误的电话1580000111,这个电话号码是少一位的,会被过滤掉。比如133开头的手机号码有13012345678,或是固定电话51919847等,小灵通010-8825011这些号码都是可以识别出来的,现在就运行一下,试试吧!";
$nums = findThePhoneNumbers($str);

echo "-----------输出整体数组,包含移动电话(移动、联通、电信)、小灵通、固话的类型及运营品牌";
print_r($nums);

echo "-----------以下为只返回移动电话的数组信息";
$mobile=$nums["mobile"];
print_r($mobile);

echo "-----------以下为只返回移动电话的“第一个”“号码”\n";
echo $nums["mobile"][0]["number"]."\n";

echo "-----------以下为输出所有获取到的手机号码,只要号码,不要其它\n";
$mobile=$nums["mobile"];
foreach ($mobile as $tel) {
    echo $tel["number"]."\n";
}

运行结果:

-----------输出整体数组,包含移动电话(移动、联通、电信)、小灵通、固话的类型及运营品牌
Array
(
    [mobile] => Array
        (
            [0] => Array
                (
                    [number] => 15901118888
                    [type] => 中国移动
                )
            [1] => Array
                (
                    [number] => 13012345678
                    [type] => 中国联通
                )
        )
    [landline] => Array
        (
        )
    [possible] => Array
        (
            [0] => Array
                (
                    [number] => 51919847
                    [type] => 没有区号的固定电话
                )
        )
)

-----------以下为只返回移动电话的数组信息
Array
(
    [0] => Array
        (
            [number] => 15901118888
            [type] => 中国移动
        )
    [1] => Array
        (
            [number] => 13012345678
            [type] => 中国联通
        )
)

-----------以下为只返回移动电话的“第一个”“号码”
15901118888

-----------以下为输出所有获取到的手机号码,只要号码,不要其它
15901118888
13012345678


以上就是PHP在一段文字或字符串中提取手机号码和运营商品牌的详细内容,更多关于PHP在一段文字或字符串中提取手机号码和运营商品牌的资料请关注九品源码其它相关文章!