PHP与MYSQL中UTF8编码的中文排序实例


本文实例讲述了PHP与MYSQL中UTF8编码的中文排序方法,分享给大家供大家参考 。具体实现方法如下:

一般来说,中文共有三种排序方式:

1.根据拼音排序;
2.根据笔画排序;
3.根据偏旁排序 。

系统的默认排序方式为拼音排序了,这个也是我们常用的,下面介绍的就是按拼音排序了

1. 需要在php数组中用中文排序,但是一般使用utf8格式的文件,直接用asort排序不行 。用gbk和gb2312可以 。这跟几种格式的编码有关系 。gbk和gb2312本身的编码就是用拼音排序的 。

复制代码 代码如下:
function utf8_array_asort(&$array)
{
if(!isset($array) || !is_array($array))
{
return false;
}
foreach($array as $k=>$v)
{
$array[$k] = iconv(UTF-8, GBK//IGNORE,$v);
}
asort($array);
foreach($array as $k=>$v)
{
$array[$k] = iconv(GBK, UTF-8//IGNORE, $v);
}
return true;
}

2. 在MySQL中,我们经常会对一个字段进行排序查询,但进行中文排序和查找的时候,对汉字的排序和查找结果往往都是错误的 。 这种情况在MySQL的很多版本中都存在 。

如果这个问题不解决,那么MySQL将无法实际处理中文 。 出现这个问题的原因是因为MySQL在查询字符串时是大小写不敏感的,在编绎MySQL时一般以ISO-8859字符集作为默认的字符集,因此在比较过程中中文编码字符大小写转换造成了这种现象 。

解决方法:

对于包含中文的字段加上"binary"属性,使之作为二进制比较,例如将"name char(10)"改成"name char(10)binary" 。

如果你使用源码编译MySQL,可以编译MySQL时使用 --with--charset=gbk 参数,这样MySQL就会直接支持中文查找和排序了(默认的是latin1) 。也可以用 extra-charsets=gb2312,gbk 来加入多个字符集 。

如果不想对表结构进行修改或者重新编译MySQL,也可以在查询语句的 order by 部分使用 CONVERT 函数 。比如

复制代码 代码如下:
select * from mytable order by CONVERT(chineseColumnName USING gbk);

希望本文所述对大家的PHP+MySQL程序设计有所帮助 。