家修资讯 > 家电维修 > 电脑维修 > utf-8是什么编码?

找不到附近家电维修师傅?

一键下单

utf-8是什么编码?

发布时间:2022-12-08 14:10:39 来源:闪电家修网 阅读量:858

UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。

基本特征

UCS字符U+0000到U+007F(ASCII)被编码为字节0×00到0x7F(ASCI兼容)。这意味着只包含7位ASCIl字符的文件在ASCI和UTF-8两种编码方式下是一样的。

所有大于0x007F的UCS字符被编码为一个有多个字节的串,每个字节都有标记位集。因此,ASCIl字节(0x00-0x7F)不可能作为任何其他字符的一部分。表示非ASCIl字符的多字节串的第一个字节总是在0xC0到0XFD的范围里,并指出这个字符包含多少个字节。多字节串的其余字节都在0x80到0xBF范围里。这使得重新同步非常容易,并使编码无国界,且很少受丢失字节的影响。

UTF-8编码字符理论上可以最多到6个字节长,然而16位BMP字符最多只用到3字节长,Bigendian UCS-4字节串的排列顺序是预定的,字节0xFE和OxFF在UTF-8编码中从未用到。

编码字节数

UTF-8使用1~4字节为每个字符编码:

·一个US-ASCIl字符只需1字节编码(Unicode范围由U+0000~U+007F)。

·带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字母则需要2字节编码(Unicode范围由U+0080~U+07FF)。

·其他语言的字符(包括中日韩文字、东南亚文字、中东文字等)包含了大部分常用字,使用3字节编码。

·其他极少使用的语言字符使用4字节编码。

UTF-8编码规则:

如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的字节数,其余各字节均以10开头。

免责声明:本网站转载内容均来自网络,若涉及侵权请务必联系删除,本网站转载内容均来自网络,若涉及侵权请务必联系删除,本网站转载内容均来自网络,若涉及侵权请务必联系删除。
相关标签:

推荐服务

更多...

热门问答

更多...
立式空调漏水是什么原因是什么
可能是零部件损坏,应该检查空调是否出现堵塞或者严重变形的情况;看看空调的安装是否正确;空调管道的保温材料是否符合标准;内部交换器是否出现故障;检查排水 已有 1个问答

2023-03-01 14:20:02

空调外漏水是什么原因是什么
原因可能是空调内机安装不平稳引起的,室内机的左低右高容易造成漏水,可以将室内机的水平角度重新调整固定给到挂墙板解决;原因可能是室内机连接管的出口外高内 已有 1个问答

2023-02-28 13:49:36

新海尔燃气热水器不打火是什么原因
1、这个原因首先考虑电源供电问题,看一下热水器电源指示灯是否亮了。2、热水器的点火器出现问题,就不打火了。3、热水器的点火感应针失灵,热水器也会不打火。4 已有 1个问答

2023-03-07 17:12:49

先科热水器打不着火一般是什么原因
一般是因为电磁阀发生了故障,如果点火的时候只点到啪的一声点火声,但并没有看到电磁阀的磁吸声,则可以断定是电磁阀发生了故障。1、电池问题:若是用电池的热 已有 1个问答

2023-03-07 17:12:49

万家乐天燃气热水器故障代码f2是什么原因
1、风机接触不良。连接处金属生锈导致接触不良,交流风机启动电容损坏,出现故障代码表示无法启动燃气热水器开关。解决方法:更换新的启动电容。如果变压器与电 已有 1个问答

2023-03-07 17:12:48

精选
优选
为你
推荐
自助
下单
客服
顶部
扫码关注公众号

扫码关注公众号

 

7X24小时报修热线

扫码下单享立减

扫码下单享立减

 

全国免费报修热线

-->