Java并发编程 - 对象的共享
您目前处于:笔记  2014-06-30

编写正确的并发程序,关键问题在于:在访问共享的可变状态时需要进行正确的管理。同步代码块和同步方法可以确保以原子的方式执行操作,同步还有另一个重要的方面:内存可见性。

可见性

为了确保多个线程之间对内存写入操作的可见性,必须使用同步机制。

public class NoVisibility {
    private static boolean ready;
    private static int number;

    private static class ReaderThread extends Thread {
        public void run() {
            while (!ready)
                Thread.yield();
            System.out.println(number);
        }
    }

    public static void main(String[] args) {
        new ReaderThread().start();
        number = 42;
        ready = true;
    }
}

NoVisibility可能会持续循环下,因为读线程可能永远都看不到ready的值。一种更奇怪的现象是,NoVisibility可能会输出0,因为读线程可能看到了写入ready的值,却没有看到之后写入number的值,这种现象被称为"重排序"。

重排序:这看上去似乎是一种失败的设计,但却能使JVM充分地利用现代多核处理器的强大性能。例如,在缺少同步的情况下,Java内存模型允许编译器对操作顺序进行重排序,并将数值缓存在寄存器中。此外,它还允许CPU对操作顺序进行重排序,并将数值缓存在处理器特定的缓存中。

在没有同步的情况下,编译器、处理器以及运行时等都可能对操作的执行顺序进行一些意想不到的调整。在缺乏足够同步的多线程程序中,要想对内存操作的执行顺序进行判断,几乎无法得出正确的结论。

  • 非原子的64位操作

    当线程在没有同步的情况下读取变量时,可能会得到一个失效值,但至少这个值是由之前某个线程设置的值,而不是一个随机值。这种安全性保证也被称为最低安全性。最低安全性适用于绝大多数变量,但是存在一个例外:非volatile类型的64位数值变量(double和long)。Java内存模型要求,变量的读取操作和写入操作都必须是原子操作,但对于非volatile类型的double和long变量,JVM允许将64位的读操作或写操作分解为两个32位的操作。

  • 加锁与可见性

    加锁的含义不仅仅局限于互斥行为,还包括内存可见性。为了确保所有县城都能看到共享变量的最新值,所有执行读操作或者写操作的线程都必须在同一个锁上同步。

  • Volatile变量

    当把变量时声明为volatile类型后,编译器与运行时都会注意到这个变量时共享的,因此不会将该变量上的操作与其他内存操作一起重排序。在访问volatile变量时不会执行加锁操作,因此也就不会使执行线程阻塞。volatile变量是一种比synchronized关键字更轻量级的同步机制。

    volatile变量通常用做某个操作完成、发生中断或者状态的标识。

    加锁机制即可以确保可见性又可以确保原子性,而volatile变量只能确保可见性。

    发布与逸出

    "发布"一个对象的意思是指,使对象能够在当前作用域之外的代码中使用。当某个不应该发布的对象发布时,这种情况就被称为逸出。

    发布对象的最简单方法是将对象的引用保存到一个公有的静态变量中,以便任何类型和线程都能看到该对象。

    class UnsafeStates {
        private class String[] states = new String[] {
            "AK", "AL" ...
        };
        public String[] getStates() { return states; }
    }

    如果按照上述方式来发布states,就会出现问题,因为任何调用者都能修改这个数组的内容。当发布一个对象时,在该对象的非私有域中引用的所有对象同样会被发布。一般来说,如果一个已经发布的对象能够通过非私有的变量引用和方法调用到达其他的对象,那么这些对象也会被发布。

    线程封闭

    如果仅在单线程内访问数据,就不需要同步。这种技术被称为线程封闭。当某个对象封装在一个线程中时,这种用法将自动实现线程安全性,即使被封闭的对象本身不是线程安全的。

    线程封闭技术的一种常见应用是JDBC的Connection对象。JDBC规范不要求Connection对象必须是线程安全的,线程从连接池中获得一个Connection对象,并且用该对象来处理请求,使用完后再将对象返还给连接池。由于大多数请求都是由单个线程采用同步的方式来处理,并且在Connection对象返回之前,连接池不会把它再分给其他线程,因此,这种连接管理模式在处理请求时隐含地把Connection对象封装在线程中。

  • Ad-hoc线程封闭

  • Ad-hoc线程封闭是指,维护线程封闭性的职责完全由程序实现来承担。

  • 栈封闭

  • 栈封闭是线程封闭的一种特例,在栈封闭中,只能通过局部变量才能访问对象。局部变量的固有属性之一就是封闭在执行线程中。它们位于执行线程的栈中,其他线程无法访问这个栈。

  • ThreadLocal类

  • ThreadLocal提供了get与set等访问接口或方法,这些方法为每个使用该变量的线程都存有一份独立的副本,因此get总是返回由当前线程在调用set时设置的最新值。ThreadLocal对象通常用于防止对可变对象的单实例变量或者全局变量进行共享。

    当某个频繁执行的操作需要一个临时变量,例如一个缓冲区,而同时又希望避免在每次执行时都重新分配该临时对象,就可以使用这项技术。

    不变性

    如果某个对象在被创建后其状态就不能被修改,那么这个对象就称为不可变对象。不可变对象很简单。它们只有一种状态,并且该状态由构造函数来控制。

    当满足一下条件时,对象才是不可变的:
    对象创建以后其状态就不能修改
    对象的所有域都是final类型
    对象时正确创建的(在对象的创建期间,this引用没有逸出)

    @Immutable
    public final class ThreadStooges {
        private final Set<String> stooges = new HashSet<String>();
    
        public ThreeStooges {
            stooges.add("Moe");
            stooges.add("Larry");
            stooges.add("Curly");
        }
    
        public boolean isStooge(String name) {
            return stooges.contains(name);
        }
    }

    stoogegs是一个final类型的引用变量,因此所有的对象状态都通过一个final域来访问。最后一个要求是"正确地构造对象",在Set对象构造完成后无法对其进行修改。

    安全发布

    如果确保对象不被发布,例如让对象封闭在线程或另一个对象的内部。

    // 不安全发布
    public Holder holder;
    
    public void initialize() {
        hodler = new Holder(42);
    }

    由于存在可见性问题,其他线程看到的Holder对象将处于不一致的状态,即便在该对象的构造函数中已经正确地构造了不变性条件。这种不正确的发布导致其他线程看到尚未创建完成的对象。

  • 安全发布的常用模式

  • 可变对象必须通过安全的方式来发布,这通常意味着在发布和使用该对象的线程时都必须使用同步。

    要安全地发布一个对象,对象的引用以及对象的状态必须同时对其他线程可见。一个正确构造的对象可以通过以下方式来安全地发布:
    在静态初始化函数中初始化一个对象引用
    将对象的引用保存到volatile类型的域或者AtomicReferance对象中
    将对象的引用保存到某个正确构建对象的final类型域中
    将对象的引用保存到一个由锁保护的域中


  • 事实不可变对象

  • 如果对象在发布后不会被修改,那么对于其他在没有额外同步的情况下安全地访问这些对象的线程来说,安全发布是足够的。当对象的引用对所有访问该对象的线程可见时,对象发布时的状态对于所有线程也将是可见的,并且如果对象状态不会再改变,那么这就足以确保任何访问都是安全的。

    如果从技术上来看是可变的,但其状态在发布后不会再改变,那么把这种对象称为"事实不可变对象"。

    例如,Date本身是可变的,如果Date对象的值放入Map后就不会改变,那么synchronizedMap中的同步机制就足以使Date值被安全的发布,并且在访问这些Date值时不需要额外的同步。

  • 可变对象

  • 对于可变对象,不仅在发布对象时需要使用同步,而且在每次对象访问时同样血药使用同步来确保后续修改操作的可见性。

    对象的发布需要取决于它的可变性:
    不可变对象可以通过任意机制来发布
    事实不可变对象必须通过安全方式来发布
    可变对象必须通过安全方式来发布,并且必须是线程安全的或者由某个锁保护起来

  • 安全地共享对象

  • 在并发程序中使用和共享对象时,可以使用一些使用的策略,包括:
    线程封闭。线程封闭的对象只能由一个线程拥有,对象被封闭在该线程中,并且只能由这个线程修改。
    只读共享。在没有额外同步的情况下,共享的只读对象可以由多个线程并发访问,但任何线程都不能修改它。共享的只读对象包括不可变对象和事实不可变对象。
    线程安全共享。线程安全的对象在其内部实现同步,因此多个线程可以通过对象的公有接口来进行访问而不需要进一步的同步。
    保护对象。被保护的对象只能通过持有特定的锁来访问。保护对象包括封装在其他线程安全对象中的对象,以及以发布的并且由某个特定锁保护的对象。


转载请并标注: “本文转载自 linkedkeeper.com ”  ©著作权归作者所有