何为线程
线程与并行处理任务息息相关,就像进程一样。那么,线程与进程有什么区别呢?当你在电子表格上进行数据计算的时候,在相同的桌面上可能有一个播放器正在播放你最喜欢的歌曲。这是一个两个进程并行工作的例子:一个进程运行电子表格程序;另一个进程运行一个媒体播放器。这种情况最适合用多任务这个词来描述。进一步观察媒体播放器,你会发现在这个进程内,又存在并行的工作。当媒体播放器向音频驱动发送音乐数据的时候,用户界面上与之相关的信息不断地进行更新。这就是单个进程内的并行线程。
那么,并发是如何实现的呢?在单核CPU计算机上,并行工作类似在电影院中不停移动图像产生的一种假象。对于进程而言,在很短的时间内中断占有处理器的进程就形成了这种假象。然而,处理器迁移到下一个进程。为了在不同进程之间进行切换,当前程序计数器被保存,下一个程序计数器被加载进来。这还不够,相关寄存器以及一些体系结构和操作系统特定的数据也要进行保存和重新加载。
正如一个CPU可以驱动两个或多个进程一样,同样也可以让CPU在单个进程内运行不同的代码片段。当一个进程启动时,它总是执行一个代码片断从而该进程就被认为是拥有了一个线程。然而,该程序可以决定启动第二个线程。这样,在一个进程内部,两个不同的代码序列就需要被同步处理。通过不停地保存当前线程的程序计数器和相关寄存器,同时加载下一个线程的程序计数器和相关寄存器,就可以在单核CPU上实现并行。在不同活跃线程之间的切换不需要这些线程之间的任何协作。当切换到下一个线程时,当前线程可能处于任一种状态。
当前CPU设计的趋势是拥有多核。一个典型的单线程应用程序只能利用一个核。但是,一个多线程程序可被分配给多个核,使得程序以一种完全并行的方式运行。这样,将一个任务分配给多个线程使得程序在多核CPU计算机上的运行速度比传统的单核CPU计算机上的运行速度快很多。
GUI线程和工作者线程
如上所述,每个程序启动后就会拥有一个线程。该线程称为“主线程”(在Qt应用程序中也叫“GUI线程”)。Qt GUI必须运行在此线程上。所有的部件和几个相关的类,例如:QPixmap,不能工作于次线程中。次线程通常称为“工作者线程”,因为它主要处理从主线程中卸下的一些工作。
数据的同步访问
每个线程都有自己的栈,这意味着每个线程都拥有自己的调用历史和本地变量。不同于进程,线程共享相同的地址空间。下图显示了内存中的线程块图。非活跃线程的程序计数器和相关寄存器通常保存在内核空间中。对每个线程来说,存在一个共享的代码片段和一个单独的栈。
如果两个线程拥有一个指向相同对象的指针,那么两个线程可以同时去访问该对象,这可能潜在地破坏对象的完整性。很容易想象,一个对象的两个方法同时执行可能会出错。
有时,从不同线程中访问一个对象是不可避免的。例如:当位于不同线程中的许多对象之间需要进行通信时。由于线程之间使用相同的地址空间,线程之间进行数据交换要比进程之间进行数据交换快得多。数据不需要序列化然后拷贝。线程之间允许传递指针,但是必须严格协调哪些线程使用哪些指针。禁止在同一对象上执行同步操作。有一些方法可以实现这种要求,下面描述其中的一些方法。
那么,怎样做才安全呢?在一个线程中创建的所有对象在线程内部使用是安全的,前提条件是其它线程没有引用该线程中创建的一些对象且这些对象与其它的线程之间没有隐性耦合关系。当数据作为静态成员变量,单例或全局数据方式共享时,这种隐性耦合是可能发生的。
使用线程
对线程来讲,基本上有两种使用情形:
- 利用多核处理器使处理速度更快。
- 将一些处理时间较长或阻塞的任务移交给其它的线程,从而保证GUI线程或其它对时间敏感的线程保持良好的反应速度。
何时不应使用线程
开发者在使用线程时必须特意小心。启动其它线程很容易,但很难保证所有共享的数据保持一致。问题通常很难找到,因为它们可能在某个时候仅显示一次或仅在某种硬件配置下出现。在创建线程解决某些问题之前,应予以考虑可能的替代方案。
非线程方式 | 描述 |
---|---|
QEventLoop::processEvents() | 在一个耗时的计算中反复调用QEventLoop::processEvents()以免GUI被阻塞。但是,这种解决方式不能很好地扩展,因为会调用processEvents()可能太频繁或不够,取决于硬件。 |
QTimer | 有时,在后台进程中使用一个计时器来调度在将来某个时间点运行一段程序非常方便。超时时间为0的计时器将在事件处理完后立即触发。 |
QSocketNotifier QNetworkAccessManager QIODevice::readyRead() |
当在一个低速的网络连接上进行阻塞读的时候,可以不使用多线程。只要对一块网络数据的计算可以很快地执行,那么,这种交互式的设计比线程中的同步等待要好些。交互式设计比多线程要不容易出错且更有效。在许多情况下,也有一些性能上的提升。 |
一般情况下,建议只使用安全的且已被验证过的路径,避免引入线程概念。QtConcurrent提供了一种简易的接口,来将工作分配到所有的处理器的核上。线程相关代码已经完全隐藏在QtConcurrent 框架中,因此,开发者不需要关注这些细节。但是, QtConcurrent 不能用于那么需要与运行中的线程进行通信的情形,且它也不能用于处理阻塞操作。
该使用哪种Qt线程技术?
参见:Multithreading Technologies in Qt,介绍在不同途径中使用Qt多线程,以及如何选择其中的准则。
Qt 线程基础
以下各节描述的QObject如何与线程交互,程序如何安全地从多线程中访问数据,以及如何异步执行产生结果不阻塞线程。
QObject和Threads
如上所述,当从其它线程调用objects的函数时,开发人员必须经常关心。Thread affinity没有改善这种状况,Qt文档中将一些方法标记为线程安全, postEvent()就是一个值得注意的例子。一个线程安全的方法可以同时在不同的线程被调用。
通常情况下,并不会并发访问一些方法,在其它线程中调用对象的非线程安全方法,在并发访问前可能运行了数千次,出现意想不到的行为。编写测试代码不能完全确保线程的正确性,但它仍然是重要的。在Linux上,Valgrind和Helgrind有助于检测线程错误。
保护数据的完整性
在编写多线程应用程序时,需要格外小心,一定要注意避免数据损坏。见:Synchronizing Threads,了解如何安全地使用线程。
处理异步执行
一种获得工作者线程结果的方式是等待该线程停止。然而,在许多情况下,阻塞的等待是不可接受的。另一种方式是通过发送的事件或queued信号和槽来获得异步结果。这产生了一些开销,因为一个操作的结果并不是出现在下一个代码行,而是在一个位于其它地方的槽中。Qt开发者习惯了这种异步行为,因为它与GUI应用程序中事件驱动的方式非常类似。
示例
Qt提供了使用线程的一些例子,参考:QThread和QThreadPool简单的示例,更高级的请参考:Threading and Concurrent Programming Examples。
深入研究
线程是一个非常复杂的课题。Qt提供了更多比我们介绍过的线程相关类,下面内容可以帮助你更深入的进入主题:
- Qt中Thread Support in Qt是一个很好的参考文档起点。
- Qt提供了一些额外的例子QThread and QtConcurrent。
- 一些好书介绍如何使用Qt线程。覆盖面最广的是《Qt高级编程》(作者:Mark Summerfield),共500页左右,大约有70页覆盖了QThread和QtConcurrent。