成语| 古诗大全| 扒知识| 扒知识繁体

当前位置:首页 > 趣味生活

unicode格式的字符是什么

Q1:什么是unicode格式的字符,当文件保存为ANSI编码的文本文件时,该字符丢失怎

unicode是国际通用的字符格式,ANSI是美国标准。文件保存为ANSI编码的文本文件时,该字符是以乱码形式出现的,两种格式不兼容。
查看原帖>>WWw.Bazh∴IShi.COM

Q2:Unicode格式的字符是什么意思??

UTF8 == Unicode Transformation Format -- 8 bit
是Unicode传送格式。即把Unicode文件转换成BYTE的传送流。
UTF8流的转换程序:
Input: unsigned integer c - the code point of the character to be encoded (输入一个unicode值)
Output: byte b1, b2,b3, b4 - the encoded sequence of bytes (输出四个BYTE值)
Algorithm(算法):
if (c<0x80)
b1 = c>>0 & 0x7F0x00
b2 = null
b3 = null
b4 = null
else if (c<0x0800)
b1 = c>>6 & 0x1F0xC0
b2 = c>>0 & 0x3F0x80
b3 = null
b4 = null
else if (c<0x010000)
b1 = c>>12 & 0x0F0xE0
b2 = c>>6 & 0x3F0x80
b3 = c>>0 & 0x3F0x80
b4 = null
else if (c<0x110000)
b1 = c>>18 & 0x070xF0
b2 = c>>12 & 0x3F0x80
b3 = c>>6 & 0x3F0x80
b4 = c>>0 & 0x3F0x80
end if
=====================
unicode 是一种编码表格,例如,给一个汉字规定一个代码。类似 GB2312-1980, GB18030等,只不过字集不同。
=====================
一个unicode码可能转成长度为一个BYTE,或两个,三个,四个BYTE的UTF8码,取决于unicode码的值。英文unicode码因为值小于0x80,只要用一个BYTE的UTF8传送,比送unicode两个BYTEs快。
UTF8是为传送unicode而想出来的“再编码”方法罢了。
UTF8转unicode用我上面给的程序反算即可。

Q3:我保存一个文档时候,它总是说有unicode格式的字符。,unicode格式的字符是什么?该怎么办呢?

unicode是一种字符编码,其目的是为了涵括各种文字符号,规划一个同一的编码序列。你应该是在用文本文档对吧?点另存为,然后在下面编码的地方选UNICODE就可以保存了。不过这个文档不一定在某些设备上能打开,有些低端的手机就不能打开。

Q4:什么叫 “Unicode格式 字符”??

UTF8 == Unicode Transformation Format -- 8 bit
是Unicode传送格式。即把Unicode文件转换成BYTE的传送流。
UTF8流的转换程序:
Input: unsigned integer c - the code point of the character to be encoded (输入一个unicode值)
Output: byte b1, b2,b3, b4 - the encoded sequence of bytes (输出四个BYTE值)
Algorithm(算法):
if (c<0x80)
b1 = c>>0 & 0x7F0x00
b2 = null
b3 = null
b4 = null
else if (c<0x0800)
b1 = c>>6 & 0x1F0xC0
b2 = c>>0 & 0x3F0x80
b3 = null
b4 = null
else if (c<0x010000)
b1 = c>>12 & 0x0F0xE0
b2 = c>>6 & 0x3F0x80
b3 = c>>0 & 0x3F0x80
b4 = null
else if (c<0x110000)
b1 = c>>18 & 0x070xF0
b2 = c>>12 & 0x3F0x80
b3 = c>>6 & 0x3F0x80
b4 = c>>0 & 0x3F0x80
end if
=====================
unicode 是一种编码表格,例如,给一个汉字规定一个代码。类似 GB2312-1980, GB18030等,只不过字集不同。
=====================
一个unicode码可能转成长度为一个BYTE,或两个,三个,四个BYTE的UTF8码,取决于unicode码的值。英文unicode码因为值小于0x80,只要用一个BYTE的UTF8传送,比送unicode两个BYTEs快。
UTF8是为传送unicode而想出来的“再编码”方法罢了。
UTF8转unicode用我上面给的程序反算即可。

Q5:"该文件含有Unicode 格式的字符,当文件保存为ANSI编码的文本时,该字符将丢失.要

有以下解决方法:

1、可以直接把字符删除。

2、先将字符剪切到记事本中粘贴,再复制到文件中。

3、将字符的Unicode格式转换。

Unicode( 统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。

Unicode是一种可能的宽字符集。由 Unicode 协会开发的能表示几乎世界上所有书写语言的字符编码标准。Unicode 字符清单有多种代表形式,包括 UTF-8、UTF-16 和 UTF-32。大多 Windows 界面使用 UTF-16。

猜你喜欢

更多