`

(转)java String 深入探讨

阅读更多

 要理解 java中String的运作方式,必须明确一点:String是一个非可变类(immutable)。什么是非可变类呢?简单说来,非可变类的实例是不能被修改的,每个实例中包含的信息都必须在该实例创建的时候就提供出来,并且在对象的整个生存周期内固定不变。java为什么要把String设计为非可变类呢?你可以问问 james Gosling :)。但是非可变类确实有着自身的优势,如状态单一,对象简单,便于维护。其次,该类对象对象本质上是线程安全的,不要求同步。此外用户可以共享非可变对象,甚至可以共享它们的内部信息。(详见 《Effective java》item 13)。String类在java中被大量运用,甚至在class文件中都有其身影,因此将其设计为简单轻便的非可变类是比较合适的。

一、创建。
     好了,知道String是非可变类以后,我们可以进一步了解String的构造方式了。创建一个Stirng对象,主要就有以下两种方式:

java 代码
  1. String str1 = new String("abc");    
  2. Stirng str2 = "abc";  

      虽然两个语句都是返回一个String对象的引用,但是jvm对两者的处理方式是不一样的。对于第一种,jvm会马上在heap中创建一个String对象,然后将该对象的引用返回给用户。对于第二种,jvm首先会在内部维护的strings pool中通过String的 equels 方法查找是对象池中是否存放有该String对象,如果有,则返回已有的String对象给用户,而不会在heap中重新创建一个新的String对象;如果对象池中没有该String对象,jvm则在heap中创建新的String对象,将其引用返回给用户,同时将该引用添加至strings pool中。注意:使用第一种方法创建对象时,jvm是不会主动把该对象放到strings pool里面的,除非程序调用 String的intern方法。看下面的例子:

java 代码
  1. String str1 = new String("abc"); //jvm 在堆上创建一个String对象   
  2.   
  3. //jvm 在strings pool中找不到值为“abc”的字符串,因此   
  4. //在堆上创建一个String对象,并将该对象的引用加入至strings pool中   
  5. //此时堆上有两个String对象   
  6. Stirng str2 = "abc";   
  7.   
  8. if(str1 == str2){   
  9.           System.out.println("str1 == str2");   
  10. }else{   
  11.           System.out.println("str1 != str2");   
  12. }   
  13.   //打印结果是 str1 != str2,因为它们是堆上两个不同的对象   
  14.   
  15.    String str3 = "abc";   
  16. //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”   
  17. //因此直接返回str2指向的对象给str3,也就是说str2和str3是指向同一个对象的引用   
  18.   if(str2 == str3){   
  19.           System.out.println("str2 == str3");   
  20.    }else{   
  21.           System.out.println("str2 != str3");   
  22.    }   
  23. //打印结果为 str2 == str3  

    再看下面的例子:

java 代码
  1. String str1 = new String("abc"); //jvm 在堆上创建一个String对象   
  2.   
  3. str1 = str1.intern();   
  4. //程序显式将str1放到strings pool中,intern运行过程是这样的:首先查看strings pool   
  5. //有没“abc”对象的引用,没有,则在堆中新建一个对象,然后将新对象的引用加入至   
  6. //strings pool中。执行完该语句后,str1原来指向的String对象已经成为垃圾对象了,随时会   
  7. //被GC收集。   
  8.   
  9. //此时,jvm发现strings pool中已有“abc”对象了,因为“abc”equels “abc”   
  10. //因此直接返回str1指向的对象给str2,也就是说str2和str1引用着同一个对象,   
  11. //此时,堆上的有效对象只有一个。   
  12. Stirng str2 = "abc";   
  13.   
  14. if(str1 == str2){   
  15.           System.out.println("str1 == str2");   
  16. }else{   
  17.           System.out.println("str1 != str2");   
  18. }   
  19.   //打印结果是 str1 == str2   
  20.   

 

     为什么jvm可以这样处理String对象呢?就是因为String的非可变性。既然所引用的对象一旦创建就永不更改,那么多个引用共用一个对象时互不影响。


二、串接(Concatenation)。
      java程序员应该都知道滥用String的串接操作符是会影响程序的性能的。性能问题从何而来呢?归根结底就是String类的非可变性。既然String对象都是非可变的,也就是对象一旦创建了就不能够改变其内在状态了,但是串接操作明显是要增长字符串的,也就是要改变String的内部状态,两者出现了矛盾。怎么办呢?要维护String的非可变性,只好在串接完成后新建一个String 对象来表示新产生的字符串了。也就是说,每一次执行串接操作都会导致新对象的产生,如果串接操作执行很频繁,就会导致大量对象的创建,性能问题也就随之而来了。
     为了解决这个问题,jdk为String类提供了一个可变的配套类,StringBuffer。使用StringBuffer对象,由于该类是可变的,串接时仅仅时改变了内部数据结构,而不会创建新的对象,因此性能上有很大的提高。针对单线程,jdk 5.0还提供了StringBuilder类,在单线程环境下,由于不用考虑同步问题,使用该类使性能得到进一步的提高。

三、String的长度
    我们可以使用串接操作符得到一个长度更长的字符串,那么,String对象最多能容纳多少字符呢?查看String的源代码我们可以得知类String中是使用域 count 来记录对象字符的数量,而count 的类型为 int,因此,我们可以推测最长的长度为 2^32,也就是4G。
     不过,我们在编写源代码的时候,如果使用 Sting str = "aaaa";的形式定义一个字符串,那么双引号里面的ASCII字符最多只能有 65534 个。为什么呢?因为在class文件的规范中, CONSTANT_Utf8_info表中使用一个16位的无符号整数来记录字符串的长度的,最多能表示 65536个字节,而java class 文件是使用一种变体UTF-8格式来存放字符的,null值使用两个字节来表示,因此只剩下 65536- 2 = 65534个字节。也正是变体UTF-8的原因,如果字符串中含有中文等非ASCII字符,那么双引号中字符的数量会更少(一个中文字符占用三个字节)。如果超出这个数量,在编译的时候编译器会报错。

分享到:
评论

相关推荐

    深入探讨Java中的String类.pdf

    深入探讨Java中的String类.pdf

    JAVA基础课程讲义

    字符串(java.lang.String类)的使用 90 字符串相等的判断 92 思考作业 93 上机作业 94 第四章 异常机制 95 导引问题 95 异常(Exception)的概念 96 异常分类 96 Error 97 Error和Exception的区别 97 Exception 97 ...

    超爽的自学课件(java)

    最后,我们还会深入讨论新型和改进过的Java 1.2集合库。 <br>(9) 第9章:违例差错控制 Java最基本的设计宗旨之一便是组织错误的代码不会真的运行起来。编译器会尽可能捕获问题。但某些情况下,除非进入运行期...

    深入浅出Struts2(附源码)

    作者处处从实战出发,在丰富的示例中直观地探讨了许多实用的技术,如数据类型转换、文件上传和下载、提高Struts 2应用的安全性、调试与性能分析、FreeMarker、Velocity、Ajax,等等。跟随作者一道深入Struts 2,聆听...

    深入浅出Struts 2 .pdf(原书扫描版) part 1

    书中介绍了如何利用Struts 2 来解决Web 应用开发中的常见问题,同时还深入浅出地探讨了许多能帮助程序员编写Struts 2 应用程序的技巧,如管理页面导航活动、输入验证、国际化和本地化、对Ajax 的支持,等等。...

    java8stream源码-devoxx2017basteln:devoxx2017basteln

    深入探讨 Kobalt:Kotlin 编写的构建工具 - 很棒的插件!!! Kotlin 通过延迟初始化查找 - 在属性 val Hello: String by lazy 确保属性仅在第一次访问时初始化 Kotlin 特殊功能:-> 操打字稿。 -> Kotlin 本地...

    二十三种设计模式【PDF版】

    2.设计模式是比 J2EE 等框架软件更小的体系结构,J2EE 中许多具体程序都是应用设计模式来完成的,当你深入到 J2EE 的内 部代码研究时,这点尤其明显,因此,如果你不具备设计模式的基础知识(GoF 的设计模式),你很难...

    Android提高之蓝牙隐藏API探秘

    前面文章讲解了Android的蓝牙基本用法,本文讲得深入些,探讨下蓝牙方面的隐藏API。用过Android系统设置(Setting)的人都知道蓝牙搜索之后可以建立配对和解除配对,但是这两项功能的函数没有在SDK中给出,那么如何去...

    asp.net知识库

    深入剖析ASP.NET组件设计]一书第三章关于ASP.NET运行原理讲述的补白 asp.net 运行机制初探(httpModule加载) 利用反射来查看对象中的私有变量 关于反射中创建类型实例的两种方法 ASP.Net应用程序的多进程模型 NET委托...

Global site tag (gtag.js) - Google Analytics