解决rtrim汉字产生乱码的问题

1、问题重现

echo rtrim('邯郸市','市');

输出: 邯�

2、原因

rtrim函数把参数都转成了UTF8后再进行比较。

对于中文,一般都是先转成Unicode,再根据下表转成UTF8。
UCS-4(UNICODE)编码    UTF-8字节流
U-00000000 – U-0000007F    0xxxxxxx
U-00000080 – U-000007FF    110xxxxx 10xxxxxx
U-00000800 – U-0000FFFF    1110xxxx 10xxxxxx 10xxxxxx
U-00010000 – U-001FFFFF    11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 – U-03FFFFFF    111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 – U-7FFFFFFF    1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

3、解决方法

var_dump(mb_substr('邯郸市',0,-1,'utf-8'));