多线程概述
Java是第一个支持语言内置多线程的主流语言。
要想深入学习线程的生命周期应该学习操作系统,不同的操作系统对线程的调度划分也不尽相同。
1. 进程
进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位。一般而言,进程包含如下三个特征:
- 独立性:进程是系统中独立存在的实体,它可以拥有自己独立的资源,每一个进程都拥有自己私有的地址空间。在没有经过进程本身允许的情况下,一个用户进程不可以直接访问其他进程的地址空间。
- 动态性:进程与程序的区别在于,程序只是一个静态的指令集合,而进程是一个正在系统中活动的指令集合,进程加入了时间的概念。进程具有自己的生命周期和各种不同的状态,这些概念在程序中都是不具备的。
- 并发性:多个进程可以在单个处理器上并发执行,多个进程之间不会相互影响。
2. 并发与并行
并发性(concurrency) 和 并行性(parallel) 是两个概念:
- 并行指在同一时刻,有多条指令在多个处理器上同时执行;
- 并发指在同一时刻只能有一条指令执行,但多个进程指令被快速轮换执行,使得在宏观上具有多个进程同时执行的效果。
现代的操作系统都支持多进程的并发,但在具体的实现细节上可能因为硬件和操作系统的不同而采用不同的策略。比较常用的方式有:
- 共用式:如 Windows3.1 和 MacOS9。
- 抢占式:如 WindowsNT、Windows2000、UNIX/Linux 等,是现在操作系统的多数选择。
3. 多线程
多线程扩展了多进程的概念,使得同一个进程可以同时并发处理多个任务,线程也被称作轻量级进程(Lightweight Process),线程是进程的执行单元,就像进程在操作系统中的地位一样。当进程被初始化后,主线程就被创建了。
线程可以拥有自己的堆栈、自己的程序计数器和自己的局部变量,但不拥有系统资源,它与父进程的其他线程共享该进程所拥有的全部资源(因为多个线程共享父进程里的全部资源,因此编程更加方便;但必须更加小心,因为需要确保线程不会妨碍同一进程里的其他线程)
线程是独立运行的,它并不知道进程中是否还有其他线程存在。线程的执行是抢占式的,也就是说,当前运行的线程在任何时候都可能被挂起,以便另外一个线程可以运行。
一个线程可以创建和撤销另一个线程,同一个进程中的多个线程之间可以并发执行。
从逻辑角度来看,多线程存在于一个应用程序中,让一个应用程序中可以有多个执行部分同时执行,但操作系统无须将多个线程看作多个独立的应用、对多线程实现调度和管理以及资源分配。线程的调度和管理由进程本身负责完成。
当线程数大于处理器数时,依然会存在多个线程在同一个 CPU 上轮换的现象。
4. 多线程的优点
使用多线程编程有如下优点:
- 进程之间不能共享内存,但线程之间共享内存非常容易;
- 系统创建进程时需要为该进程重新分配系统资源,但创建线程则代价小得多,因此使用多线程来实现多任务并发比多进程的效率高;
- Java 语言内置了多线程功能支持,而不是单纯地作为底层操作系统的调度方式,从而简化了 Java 的多线程编程。
5. 线程的调度
线程调度的细节取决于底层平台所采用的策略:
- 对于采用抢占式策略的系统而言,系统会给每个可执行的线程一个小时间段来处理任务,当该时间段用完后,系统就会剥夺该线程所占用的资源,让其他线程获得执行的机会,在选择下一个线程时,系统会考虑线程的优先级。
- 所有现代的桌面和服务器操作系统都采用抢占式调度策略,但一些小型设备如手机则可能采用协作式调度策略。在协作式调度策略中,只有当一个线程调用了它的
sleep()
或yield()
方法后才会放弃所占用的资源,这意味着必须由该线程主动放弃所占用的资源。