注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

_

_

 
 
 

日志

 
 

mysql中utf8编码中文字符长度  

2014-11-06 15:25:05|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

[转载] mysql中utf8编码中文字符长度

2010-09-30

分类:码农

版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
http://www.blogbus.com/zyglo-logs/75936446.html

编码一律为 UTF-8 编码 :
先来测试一下 php 把一个汉字认作几个字节:

header('Content-Type:text/html;charset=UTF-8');
$str='我';
echo strlen($str);
?>

输出 3 ,

证明在 UTF-8编码下, 一个汉字被认作3个字节长度.
而如果我们用 php 多字节扩展函数 mb_strlen($str,'utf8'); 这个时候输出 1

下面来测试一下 mysql char 和 varchar 字节长度.

创建一个数据库 (txt) :

CREATE DATABASE IF NOT EXISTS txt DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;

创建一个表 (test) :

create table test(txt_char char(2) null, txt_varchar varchar(2) null ) ENGINE=MyISAM
确认一下我们表的字符集: 确实是UTF8编码的.

插入两条记录:

INSERT INTO test(txt_char,txt_varchar) VALUES ('abcdef','uvwxyz') , ('我是中国人','北京欢迎你');

看看插入结果:
在看看查询结果:

证明 mysql 并不会对超过长度的字符报错,而是直接截断了.
并且 char(2) 和 varchar(2) 都能存储 2个汉字,或者是两个英文字符.
证明 mysql 的 char(n) 可以直接存储 n 个汉字. 而不是 n/3 个
mysql 屏蔽了具体的存储细节,而直接以实际字符的个数来决定 char存储的个数.
这里只是测试在UTF8编码下的,如果是GBK编码,可能不一样,没兴趣去测试那么多了.
下面看看终端输出:
看看 mysql 检测字符长度: length 和 char_length 输出:
LENGTH 输出的结果是 字符实际长度的!
而 CHAR_LENGTH输出的则是屏蔽了字符存储细节,是实际的字符个数!

总结一下:

在涉及中文环境下的php+mysql组合,最好是用 mb_strlen来检测字符长度, 而在mysql 中,使用 CHAR_LENGTH来检测字符长度,这样能做到中英文统一处理.

只适用mysql5.0以上的版本:
1.一个汉字占多少长度与编码有关:
UTF-8:一个汉字=3个字节
GBK:一个汉字=2个字节
2.varchar(n)表示n个字符,无论汉字和英文,Mysql都能存入n个字符,仅是实际字节长度有所区别
3.MySQL检查长度,可用SQL语言:
select LENGTH(fieldname) from tablename 来查看

  评论这张
 
阅读(282)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017