ThreaLocal内存泄露的有关问题

2013-11-23

ThreaLocal内存泄露的问题下面是测试用例2 的垃圾回收日志对比分析测试用例1 和测试用例2 的GC日志，发现

ThreaLocal内存泄露的问题

下面是测试用例2 的垃圾回收日志

ThreaLocal内存泄露的有关问题

对比分析测试用例1 和测试用例2 的GC日志，发现基本上都差不多，说明是否清楚线程上下文变量不影响垃圾回收，对于无线程池的情况下，不会造成内存泄露

对于测试用例3，由于业务线程sleep 一秒钟，会导致业务系统中有产生大量的阻塞线程，理论上新生代内存会比较高，但是会保持到一定的范围，不会缓慢增长，导致内存溢出，通过分析了测试用例3的gc日志，发现符合理论上的分析，下面是测试用例3的垃圾回收日志

ThreaLocal内存泄露的有关问题

通过上述日志分析，发现老年代产生了一次垃圾回收，可能是开始大量线程休眠导致内存无法释放，这一部分线程持有的线程变量会在重新唤醒之后运行结束被回收，新生代的内存内存一直维持在4112K，也就是4个线程持有的线程变量。

对于测试用例4，由于线程一直sleep，无法对线程变量进行释放，导致了内存溢出。

有线程池的情况：测试用例5-8

对于测试用例5，开设了50个工作线程，每次使用线程完成之后，都会清除线程变量，垃圾回收日志和测试用例1以及测试用例2一样。

对于测试用例6，也开设了50个线程，但是使用完成之后，没有清除线程上下文，理论上会有50M内存无法进行回收，通过垃圾回收日志，符合我们的语气，下面是测试用例6的垃圾回收日志

ThreaLocal内存泄露的有关问题

通过日志分析，发现老年代回收比较频繁，主要是因为50个线程持有的50M空间一直无法彻底进行回收，而新生代空间不够（我们设置的是128M内存，新生代大概36M左右）。所有整体内存的使用量肯定一直在50M之上。

对于测试用例7，由于工作线程最多50个，即使线程一直休眠，再短时间内也不会导致内存溢出，长时间的情况下会出现内存溢出，这主要是因为任务队列空间没有限制，和有没有清除线程上下文变量没有关系，如果我们使用的有限队列，就不会出现这个问题。

对于测试用例8，由于工作线程有1000个，导致至少1000M的堆空间被使用，由于我们设置的最大堆是512M，导致结果溢出。系统的堆空间会从开始的128M逐步增长到512M，最后导致溢出，从gc日志来看，也符合理论上的判断。由于gc日志比较大，就不在贴出来了。

所以从上面的测试情况来看，线上上下文变量是否导致内存泄露，是需要区分情况的，如果线程变量所占的空间的比较小，小于10K，是不会出现内存泄露的，导致内存溢出的。如果线程变量所占的空间比较大，大于1M的情况下，出现的内存泄露和内存溢出的情况比较大。以上只是jdk1.7版本情况下的分析，个人认为jdk1.6版本的情况和1.7应该差不多，不会有太大的差别。

-----------------------下面是对ThreadLocal的分析-------------------------------------

对于ThreadLocal的概念，很多人都是比较模糊的，只知道是线程本地变量，而具体这个本地变量是什么含义，有什么作用，如何使用等很多java开发工程师都不知道如何进行使用。从JDK的对ThreadLocal的解释来看

该类提供了线程局部 (thread-local) 变量。这些变量不同于它们的普通对应物，因为访问某个变量（通过其 get 或 set 方法）的每个线程都有自己的局部变量，

它独立于变量的初始化副本。ThreadLocal 实例通常是类中的 private static 字段，它们希望将状态与某一个线程（例如，用户 ID 或事务 ID）相关联。

ThreadLocal有一个ThreadLocalMap静态内部类，你可以简单理解为一个MAP，这个‘Map’为每个线程复制一个变量的‘拷贝’存储其中。每一个内部线程都有一个ThreadLocalMap对象。

当线程调用ThreadLocal.set(T object)方法设置变量时,首先获取当前线程引用，然后获取线程内部的ThreadLocalMap对象，设置map的key值为threadLocal对象，value为参数中的object。

当线程调用ThreadLocal.get()方法获取变量时,首先获取当前线程引用，以threadLocal对象为key去获取响应的ThreadLocalMap，如果此‘Map’不存在则初始化一个，否则返回其中的变量。

也就是说每个线程内部的ThreadLocalMap对象中的key保存的threadLocal对象的引用，从ThreadLocalMap的源代码来看，对threadLocal的对象的引用是WeakReference，也就是弱引用。

下面一张图描述这三者的整体关系

ThreaLocal内存泄露的有关问题

对于一个正常的Map来说，我们一般会调用Map.clear方法来清空map，这样map里面的所有对象就会释放。调用map.remove(key)方法，会移除key对应的对象整个entry，这样key和value 就不会任何对象引用，被java虚拟机回收。

而Thread对象里面的ThreadLocalMap里面的key是ThreadLocal的对象的弱引用，如果ThreadLocal对象会回收，那么ThreadLocalMap就无法移除其对应的value，那么value对象就无法被回收，导致内存泄露。但是如果thread运行结束，整个线程对象被回收，那么value所引用的对象也就会被垃圾回收。

什么情况下ThreadLocal对象会被回收了，典型的就是ThreadLocal对象作为局部对象来使用或者每次使用的时候都new了一个对象。所以一般情况下，ThreadLocal对象都是static的，确保不会被垃圾回收以及任何时候线程都能够访问到这个对象。

写了下面一段代码进行测试，发现两个方法都没有导致内存溢出，对于没有使用线程池的方法来说，因为每次线程运行完就退出了，Map里面引用的所有对象都会被垃圾回收，所以没有关系，但是为什么线程池的方案也没有导致内存溢出了，主要原因是ThreadLocal.set方法的实现，会做一个将Key== null 的元素清理掉的工作。导致线程之前由于ThreadLocal对象回收之后，ThreadLocalMap中的value 也会被回收，可见设计者也注意到这个地方可能出现内存泄露，为了防止这种情况发生，从而清空ThreadLocalMap中null为空的元素。

import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;public class ThreadLocalLeakTest {    public static void main(String[] args) {        // 如果控制线程池的大小为50，不会导致内存溢出        testWithThreadPool(50);        // 也不会导致内存泄露        testWithThread();    }    static class TestTask implements Runnable {        public void run() {            ThreadLocal tl = new ThreadLocal();            // 确保threadLocal为局部对象,在退出run方法之后，没有任何强引用，可以被垃圾回收            tl.set(allocateMem());        }    }    public static void testWithThreadPool(int poolSize) {        ExecutorService service = Executors.newFixedThreadPool(poolSize);        while (true) {            try {                Thread.sleep(100);                service.execute(new TestTask());            } catch (Exception e) {                e.printStackTrace();            }        }    }    public static void testWithThread() {        try {            Thread.sleep(100);        } catch (InterruptedException e) {        }        new Thread(new TestTask()).start();    }    public static final byte[] allocateMem() {        // 这里分配一个1M的对象        byte[] b = new byte[1024 * 1024 * 1];        return b;    }}

热点排行

编程

ThreaLocal内存泄露的有关问题