关于字符串编码[u4e00-u9fa5]
%u4e00 =
%u9fa5 =
一:
龥:
[一-龥]
再看看我们熟悉的A:
x00-xff:
参考文献:
1.http://www.doc88.com/p-900961210938.html(GB2312-80 6763 CJK 个汉字 (4E00—9FA5) Unicode 字)
2.http://blog.csdn.net/nivana999/article/details/4247844(UNICODE汉字数据库)
3.http://library.ust.hk/scip98/papers/sun-wu-li.pdf(The Design and Implementation of CJK Unified Character Set on UNIX Systems)
4.https://zh.wikipedia.org/wiki/GB_2312(GB 2312)
原创文章,版权声明:自由转载-非商用-非衍生-保持署名 | Creative Commons BY-NC-ND 3.0