临界区与共享资源
信号量是一种同步机制,用来解决并发程序对共享资源访问的问题,既可以应用于进程,也可以应用于线程。同步:避免并发和防止竞争条件,任务有序协作执行。
- 临界区:访问和操作共享数据的代码段。多线程并发访问同一个资源是通常是不安全的,临界区内往往要求做到原子执行。
- 共享资源:被多个线程共享的,需要被保护或被锁的资源。
信号量本质
Linux 中的信号量是一种睡眠锁,本质是一种锁机制。当一个任务试图获取一个不可用的信号量时,信号量会将其推进一个等待队列,让其睡眠。当信号量可用时,处于等待队列的任务再被唤醒。这一点相比自旋锁提供了更好的处理器利用率,因为没有把时间花在忙等待上。从信号量的这种睡眠锁特性可得出:
- 适用于锁被长时间持有的情况。如果时间短,就不适宜了,因为睡眠、维护等待队列以及唤醒也是有开销时间的。
- 执行线程在锁被征用是会睡眠,所以只能在进程上下文获取信号量锁,在中断上下文中是不能进行调度的。
- 持有信号量时不能占用自旋锁。因为等待信号量时可能会睡眠,持有自旋锁不允许睡眠。
PV(down, up)操作
信号量可被同时持有的数量在声明时制定。PV操作是原子操作。任何同步机制本质都是要靠处理器级别的原子操作支持的。PV出自荷兰语,P - Proberen(尝试, down), V - Vershogen(增加,up). Linux 通过 down操作对信号量技术减一获得信号量锁,如果大于0,将其减去1进入临界区,等于0则将其挂起,up操作如果有其他进程因为等待被挂起则唤醒,否则值加1.
Linux 信号量常用API有: semget, semctl, semop
, 可以参考官方的Linux的API man手册。一个例子,父子进程交替输出控制台:
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/sem.h>
/* 该联合体需要使用者声明,在 /usr/include/linux/sem.h 中,灵活用grep翻代码 */
/* arg for semctl system calls. */
union semun {
int val; /* value for SETVAL */
struct semid_ds *buf; /* buffer for IPC_STAT & IPC_SET */
unsigned short *array; /* array for GETALL & SETALL */
struct seminfo *__buf; /* buffer for IPC_INFO */
void *__pad;
};
void pv(int sem_id, int op)
{
struct sembuf sem_b;
sem_b.sem_num = 0;
sem_b.sem_op = op;
sem_b.sem_flg = SEM_UNDO;
semop(sem_id, &sem_b, 1);
}
int main()
{
pid_t pid;
int sem_id;
union semun sem_un;
sem_id = semget(IPC_PRIVATE, 1, 0666);
sem_un.val = 1;
semctl(sem_id, 0, SETVAL, sem_un);
pid = fork();
if (pid > 0) {
pv(sem_id, -1); /* PV 之间的就是临界区,共享资源就是标准输出 */
printf("father run, get semaphore for 3s.\n");
sleep(3);
pv(sem_id, 1);
} else if (pid == 0) {
pv(sem_id, -1);
printf("child run, get semaphore for 3s.\n");
sleep(3);
pv(sem_id, 1);
} else {
printf("fork error!\n");
return 1;
}
waitpid(pid, NULL, 0);
semctl(sem_id, 0 , IPC_RMID, sem_un);
return 0;
}