怎么样正确的统计WORDPRESS博文的汉字个数?


PHP 里有 strlen 函数, 不过这个函数只是返回 字符串的位数, 每个字数算1个字节. 比如 字符串:

1
$str='小赖子的英国生活和资讯 JustYY.com ';
$str='小赖子的英国生活和资讯 JustYY.com ';

strlen($str) 的长度是 45, 因为有 11个汉字(在UTF-8下 汉字长度为3), 11*3+12=45. PHP里还提供了一个 mb_strlen 用于计算不同编码下多字节的个数,

1
2
3
echo mb_strlen($str,'utf8'); // 23
echo mb_strlen($str,'gbk');  // 28
echo mb_strlen($str,'gb2312');  // 33
echo mb_strlen($str,'utf8'); // 23
echo mb_strlen($str,'gbk');  // 28
echo mb_strlen($str,'gb2312');  // 33
word-count 怎么样正确的统计WORDPRESS博文的汉字个数? wordpress 小技巧 程序设计 编程 网站信息与统计

统计中文汉字个数

但都不是我们想要的. 该字符串汉字的个数应该是返回11(应该去除英文, 数字, 空格还有其它字符). 我们则可以通过 正则表达式计算汉字UTF-8编码的范围个数:

1
2
3
4
5
6
if (!function_exists("getCount")) {
  function getCount($str) {
      preg_match_all("/([\x{4e00}-\x{9fa5}]){1}/u", $str, $arrCh);
      return count($arrCh[0]); 
  }
}
if (!function_exists("getCount")) {
  function getCount($str) {
      preg_match_all("/([\x{4e00}-\x{9fa5}]){1}/u", $str, $arrCh);
      return count($arrCh[0]); 
  }
}

然后我们就可以编译 子主题functions.php 模板 并加入以下代码:

1
2
3
4
5
6
7
add_filter( 'the_content', 'count_characters' );
function count_characters($content) {
   if (function_exists("getCount")) {
      $content .= getCount($content)." 个汉字";
   }
   return $content;
}
add_filter( 'the_content', 'count_characters' );
function count_characters($content) {
   if (function_exists("getCount")) {
      $content .= getCount($content)." 个汉字";
   }
   return $content;
}

同样根据正则表达式 我们可以统计出英文字母 和 数字和个数:

1
2
3
4
preg_match_all("/[0-9]{1}/", $str, $arrNum);
echo "数字个数:".count($arrNum[0]);
preg_match_all("/[a-zA-Z]{1}/", $str, $arrAl);
echo "字母个数:".count($arrAl[0]);
preg_match_all("/[0-9]{1}/", $str, $arrNum);
echo "数字个数:".count($arrNum[0]);
preg_match_all("/[a-zA-Z]{1}/", $str, $arrAl);
echo "字母个数:".count($arrAl[0]);

Wordpress博客技术文章

GD Star Rating
loading...
本文一共 238 个汉字, 你数一下对不对.
怎么样正确的统计WORDPRESS博文的汉字个数?. (AMP 移动加速版本)
上一篇: Adsense 广告投放技巧之 屏蔽低收入的广告类别
下一篇: 在跑步机上跑和在公园马路上跑的区别比较

扫描二维码,分享本文到微信朋友圈
46dcb011b4d6a12c92e4ba2439e43dce 怎么样正确的统计WORDPRESS博文的汉字个数? wordpress 小技巧 程序设计 编程 网站信息与统计

评论