Java中byte和char的区别

不管现实多么惨不忍睹,都要持之以恒地相信,这只是黎明前短暂的黑暗而已。不要惶恐眼前的难关迈不过去,不要担心此刻的付出没有回报,别再花时间等待天降好运。真诚做人,努力做事!你想要的,岁月都会给你。Java中byte和char的区别,希望对大家有帮助,欢迎收藏,转发!站点地址:www.bmabk.com,来源:原文

类型 符号 大小 表示范围是 -128-127
byte 有符号 1 字节 大小范围是 -128-127
char 无符号 2字节 大小范围为 0-66535 ( 对应的 Unicode BMP 码位置)

注意1

Java 设计时 Unicode 的码点上限还是 0xFFFF,也就是Java 中 Char 2个字节长度的由来(UTF-16 code unit)。也就是说Java中的Char只能表示简化版的Unicode,即 BMP(第0平面)范围内的字符。

有些字符是4个字节,如何在Java内码中表示?

超过2个字节的长度的字符只能用两个char来表示,就是String了,比如:

// Java内码:
System.out.println("\uD83C\uDF53");      // \uD83C\uDF53 = 🍓
// Java外码:
System.out.println("🍓");      // 🍓   这种写法只存在于.java文件中,无法作为Java的String类型来显示。
// 如果你打开.java文件看到的是直接显示🍓,但是,你无法将🍓放入""中作为Java的内码。会被智能点的IDE转为"\uD83C\uDF53",因此,请不要将从 IDE 中看到 🍓,就认为是一个字符,他存在于 Java 虚拟机中时本质是一个串字符串。

注意2

可能你对表示范围还稍微优点疑惑。没错,这里有坑,将byte转char并不是拓宽,而是窄化。哈哈!
byte竟然超过了char所能表示的范围:
byte:-128-127
char:0-66535

System.out.println((byte) -1);       // -1
System.out.println((char) (byte) -1);     // 什么都没有???因为没有这个符号,计算的结果其实是:'\uFFFF' 65535
System.out.println((int) (char) (byte) -1);  // char转int,'\uFFFF'转为int,即:65535

诶,没想到吧,char由于无法表示byte的负数范围,于是对于负数转char来说,会出错。

解决方法

方法一:安全地拓宽

// 使用short来代替char拓宽byte
System.out.println((short) (byte) -1);	// -1 在转换的过程中,符号位自动左移

方法二:符号位直接作为数值计算

byte b = -1;
char c = (char) (b & 0xff);		       // 在转换的过程中,符号位不参与转换,直接作为数值计算
System.out.println(c);                 // 255

最后,byte和char的区别其实挺复杂的,牵涉Java的编码和Unicode字符集和编码方式这些知识点。不过,花一点点时间研究后,你会大有收获。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/180279.html

(0)
飞熊的头像飞熊bm

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!