解决多线程并发问题

来源:互联网 发布:网络催生新职业 编辑:程序博客网 时间:2024/06/11 01:08

1、文件锁

如果对该表的更新或插入的操作,都会经过一个统一的文件,这种方式是可以解决的多进程并发的问题;

实现方式如下:

复制代码
public static function cbInventoryReserve() {        $LOCK_FILE_PATH = $_SERVER['DOCUMENT_ROOT']."wmsinventoryapi/inventory/InventoryReserve.php";        $fp = fopen( $LOCK_FILE_PATH, "r" );        if (!$fp) {            die("Failed to open the lock file!");        }        flock ( $fp, LOCK_EX );            //需要进行的操作        $params = Flight::request()->getBody();        $params = json_decode($params, true);        if (! is_array($params) || empty($params)) {            Flight::sendRouteResult(array("error_code" => "40002","error_info" => "params empty"));        }        $result = \Inventory\InventoryEngine::getInstance()->inventoryReserve($params);                flock ( $fp, LOCK_UN );        fclose ( $fp );        Flight::sendRouteResult($result);    }
复制代码

  函数说明  flock()会依参数operation所指定的方式对参数fd所指的文件做各种锁定或解除锁定的动作。此函数只能锁定整个文件,无法锁定文件的某一区域。

   参数  operation有下列四种情况:

   LOCK_SH 建立共享锁定。多个进程可同时对同一个文件作共享锁定。

  LOCK_EX 建立互斥锁定。一个文件同时只有一个互斥锁定。

  LOCK_UN 解除文件锁定状态。

   LOCK_NB 无法建立锁定时,此操作可不被阻断,马上返回进程。通常与LOCK_SH或LOCK_EX 做OR(|)组合。

   单一文件无法同时建立共享锁定和互斥锁定,而当使用dup()或fork()时文件描述词不会继承此种锁定。

   返回值  返回0表示成功,若有错误则返回-1,错误代码存于errno。

换言之:

 

使用共享锁LOCK_SH,如果是读取,不需要等待,但如果是写入,需要等待读取完成。

 

使用独占锁LOCK_EX,无论写入/读取都需要等待。

 

LOCK_UN,无论使用共享/读占锁,使用完后需要解锁。

 

LOCK_NB,当被锁定时,不阻塞,而是提示锁定。

 

为了更好的移植性,对于文件的打开与关闭我选择了fopen和fclose的组合,但flock的第一个参数要求的是int类型的文件描述符。这里对fopen返回的FILE类型的文件指针进行转换,转换为int型的文件描述符 (假设open函数返回的文件描述符为fd,而fopen返回的文件指针为*fp,则fd等价于fp->_fileno).

2、序列化接口(对象序列化)

所有php里面的值都可以使用函数serialize()来返回一个包含字节流的字符串来表示。unserialize()函数能够重新把字符串变回php原来的值。 序列化一个对象将会保存对象的所有变量,但是不会保存对象的方法,只会保存类的名字。

复制代码
<?php// classa.inc:    class A {      public $one = 1;          public function show_one() {          echo $this->one;      }  }  // page1.php:  include("classa.inc");    $a = new A;  $s = serialize($a);  // 把变量$s保存起来以便文件page2.php能够读到  file_put_contents('store', $s);// page2.php:    // 要正确了解序列化,必须包含下面一个文件  include("classa.inc");  $s = file_get_contents('store');  $a = unserialize($s);  // 现在可以使用对象$a里面的函数 show_one()  $a->show_one();?>
复制代码

3、select *** for update

Select …forupdate语句是我们经常使用手工加锁语句。通常情况下,select语句是不会对数据加锁,妨碍影响其他的DML和DDL操作。同时,在多版本一致读机制的支持下,select语句也不会被其他类型语句所阻碍。

借助for update子句,我们可以在应用程序的层面手工实现数据加锁保护操作。

for update子句的默认行为就是自动启动一个事务,借助事务的锁机制将数据进行锁定。

开启一个事务使用for update

start transaction;select sum(quantity) from ws_inventory_item where inventory_item_id=86 for update;

再开启另一个事务时,做update 操作的时,只能等待上面的事务,commit才能执行;

start transaction;update ws_inventory_item set quantity = quantity + 1  where inventory_item_id = 86;
MySQL  使用 SELECT … FOR UPDATE 做事务写入前的确认
以MySQL 的InnoDB 为例,预设的 Tansaction isolation level 为 REPEATABLE READ,在 SELECT 的读取锁定主要分为两种方式:
SELECT … LOCK IN SHARE MODESELECT … FOR UPDATE
这两种方式在事务(Transaction) 进行当中SELECT 到同一个数据表时,都必须等待其它事务数据被提交(Commit)后才会执行。而主要的不同在于LOCK IN SHARE MODE 在有一方事务要Update 同一个表单时很容易造成死锁 。
简单的说,如果SELECT 后面若要UPDATE 同一个表单,最好使用 SELECT … UPDATE。
举个例子:假设商品表单products 内有一个存放商品数量的quantity ,在订单成立之前必须先确定quantity 商品数量是否足够(quantity>0) ,然后才把数量更新为1。
不安全的做法:
SELECT quantity FROM products WHERE id=3;UPDATE products SET quantity = 1 WHERE id=3;
为什么不安全呢?
少量的状况下或许不会有问题,但是大量的数据存取「铁定」会出问题。
如果我们需要在 quantity>0 的情况下才能扣库存,假设程序在第一行 SELECT 读到的 quantity 是 2 ,看起来数字没有错,但是当MySQL 正准备要UPDATE 的时候,可能已经有人把库存扣成 0 了,但是程序却浑然不知,将错就错的 UPDATE 下去了。
因此必须透过的事务机制来确保读取及提交的数据都是正确的。
于是我们在MySQL 就可以这样测试:(注1)
1    SET AUTOCOMMIT=0;2    BEGIN WORK;3    SELECT quantity FROM products WHERE id=3 FOR UPDATE;
此时 products 数据中 id=3 的数据被锁住(注3),其它事务必须等待此次事务提交后才能执行 SELECT * FROM products WHERE id=3 FOR UPDATE (注2)如此可以确保 quantity 在别的事务读到的数字是正确的。
1    UPDATE products SET quantity = '1' WHERE id=3 ;2    COMMIT WORK;
提交(Commit)写入数据库,products 解锁。
注1:BEGIN/COMMIT 为事务的起始及结束点,可使用二个以上的MySQL Command 视窗来交互观察锁定的状况。
注2:在事务进行当中,只有SELECT … FOR UPDATE 或LOCK IN SHARE MODE 同一笔数据时会等待其它事务结束后才执行,一般SELECT … 则不受此影响。
注3:由于InnoDB 预设为Row-level Lock,数据列的锁定可参考这篇。
注4:InnoDB 表单尽量不要使用LOCK TABLES 指令,若情非得已要使用,请先看官方对于InnoDB 使用LOCK TABLES 的说明,以免造成系统经常发生死锁。
 
MySQL SELECT … FOR UPDATE 的 Row Lock 与 Table Lock
上面介绍过SELECT … FOR UPDATE 的用法,不过锁定(Lock)的数据是判别就得要注意一下了。由于InnoDB 预设是Row-Level Lock,所以只有「明确」地指定主键,MySQL 才会执行 Row lock (只锁住被选取的数据) ,否则MySQL 将会执行 Table Lock (将整个数据表单给锁住)。
举个例子:
假设有个表单products ,里面有id 跟name 二个栏位,id 是主键。
例1: (明确指定主键,并且有此数据,row lock)
 
     SELECT * FROM products WHERE id='3' FOR UPDATE;
例2: (明确指定主键,若查无此数据,无lock)
     SELECT * FROM products WHERE id='-1' FOR UPDATE;
例2: (无主键,table lock)
     SELECT * FROM products WHERE name='Mouse' FOR UPDATE;
例3: (主键不明确,table lock)
     SELECT * FROM products WHERE id<>'3' FOR UPDATE;
例4: (主键不明确,table lock)
     SELECT * FROM products WHERE id LIKE '3' FOR UPDATE;
注1: FOR UPDATE 仅适用于InnoDB,且必须在事务区块(BEGIN/COMMIT)中才能生效。
注2: 要测试锁定的状况,可以利用MySQL 的Command Mode ,开二个视窗来做测试。
 

4、事务隔离级别

如何解决多进程或多线程并发问题

本节转载,原文地址:http://singo107.iteye.com/blog/1175084

数据库事务的隔离级别有4个,由低到高依次为Read uncommitted、Read committed、Repeatable read、Serializable,这四个级别可以逐个解决脏读、不可重复读、幻读这几类问题。

 

√: 可能出现    ×: 不会出现

 脏读不可重复读幻读Read uncommitted√√√Read committed×√√Repeatable read××√Serializable×××

 

注意:我们讨论隔离级别的场景,主要是在多个事务并发的情况下,因此,接下来的讲解都围绕事务并发。

Read uncommitted 读未提交

公司发工资了,领导把5000元打到singo的账号上,但是该事务并未提交,而singo正好去查看账户,发现工资已经到账,是5000元整,非常高兴。可是不幸的是,领导发现发给singo的工资金额不对,是2000元,于是迅速回滚了事务,修改金额后,将事务提交,最后singo实际的工资只有2000元,singo空欢喜一场。



 

出现上述情况,即我们所说的脏读,两个并发的事务,“事务A:领导给singo发工资”、“事务B:singo查询工资账户”,事务B读取了事务A尚未提交的数据。

当隔离级别设置为Read uncommitted时,就可能出现脏读,如何避免脏读,请看下一个隔离级别。

Read committed 读提交

singo拿着工资卡去消费,系统读取到卡里确实有2000元,而此时她的老婆也正好在网上转账,把singo工资卡的2000元转到另一账户,并在singo之前提交了事务,当singo扣款时,系统检查到singo的工资卡已经没有钱,扣款失败,singo十分纳闷,明明卡里有钱,为何......

出现上述情况,即我们所说的不可重复读,两个并发的事务,“事务A:singo消费”、“事务B:singo的老婆网上转账”,事务A事先读取了数据,事务B紧接了更新了数据,并提交了事务,而事务A再次读取该数据时,数据已经发生了改变。

当隔离级别设置为Read committed时,避免了脏读,但是可能会造成不可重复读。

大多数数据库的默认级别就是Read committed,比如Sql Server , Oracle。如何解决不可重复读这一问题,请看下一个隔离级别。

Repeatable read 重复读

当隔离级别设置为Repeatable read时,可以避免不可重复读。当singo拿着工资卡去消费时,一旦系统开始读取工资卡信息(即事务开始),singo的老婆就不可能对该记录进行修改,也就是singo的老婆不能在此时转账。

虽然Repeatable read避免了不可重复读,但还有可能出现幻读。

singo的老婆工作在银行部门,她时常通过银行内部系统查看singo的信用卡消费记录。有一天,她正在查询到singo当月信用卡的总消费金额(select sum(amount) from transaction where month = 本月)为80元,而singo此时正好在外面胡吃海塞后在收银台买单,消费1000元,即新增了一条1000元的消费记录(insert transaction ... ),并提交了事务,随后singo的老婆将singo当月信用卡消费的明细打印到A4纸上,却发现消费总额为1080元,singo的老婆很诧异,以为出现了幻觉,幻读就这样产生了。

注:Mysql的默认隔离级别就是Repeatable read。

Serializable 序列化

Serializable是最高的事务隔离级别,同时代价也花费最高,性能很低,一般很少使用,在该级别下,事务顺序执行,不仅可以避免脏读、不可重复读,还避免了幻像读。

 Mysql事务隔离级别设置方式

用户可以用SET TRANSACTION语句改变单个会话或者所有新进连接的隔离级别。它的语法如下:

SET [SESSION | GLOBAL] TRANSACTION ISOLATION LEVEL {READ UNCOMMITTED | READ COMMITTED | REPEATABLE READ | SERIALIZABLE}

 

注意:默认的行为(不带session和global)是为下一个(未开始)事务设置隔离级别。如果你使用GLOBAL关键字,语句在全局对从那点开始创建的所有新连接(除了不存在的连接)设置默认事务级别。你需要SUPER权限来做这个。使用SESSION 关键字为将来在当前连接上执行的事务设置默认事务级别。 任何客户端都能自由改变会话隔离级别(甚至在事务的中间),或者为下一个事务设置隔离级别。 

 

 

 

Java 多线程并发编程会有许多不同的问题,主要有如下问题的应用:

 

  1. 多线程读写共享数据同步问题
  2. 并发读数据,保持各个线程读取到的数据一致性的问题。

解决方案:

  1. synchronized关键字和Lock并发锁:主要解决多线程共享数据同步问题。 
  2. ThreadLocal主要解决多线程中数据因并发产生不一致问题。
 

ThreadLocal与synchronized有本质的区别:

 synchronized是利用锁的机制,使变量或代码块在某一时该只能被一个线程访问。
而ThreadLocal为每一个线程都提供了变量的副本,使得每个线程在某一时间访问到的并不是同一个对象,这样就隔离了多个线程对数据的数据共享。
ThreadLocal与synchronized有本质的区别:
 synchronized是利用锁的机制,使变量或代码块在某一时该只能被一个线程访问。而ThreadLocal为每一个线程都提供了变量的副本,使得每个线程在某一时间访问到的并不是同一个对象,这样就隔离了多个线程对数据的数据共享。而Synchronized却正好相反,它用于在多个线程间通信时能够获得数据共享。

ThreadLocal与synchronized有本质的区别:
 synchronized是利用锁的机制,使变量或代码块在某一时该只能被一个线程访问。而ThreadLocal为每一个线程都提供了变量的副本,使得每个线程在某一时间访问到的并不是同一个对象,这样就隔离了多个线程对数据的数据共享。而Synchronized却正好相反,它用于在多个线程间通信时能够获得数据共享。

ThreadLocal是什么?

早在JDK 1.2的版本中就提供Java.lang.ThreadLocal,ThreadLocal为解决多线程程序的并发问题提供了一种新的思路。使用这个工具类可以很简洁地编写出优美的多线程程序。

ThreadLocal很容易让人望文生义,想当然地认为是一个“本地线程”。其实,ThreadLocal并不是一个Thread,而是Thread的局部变量,也许把它命名为ThreadLocalVariable更容易让人理解一些。

当使用ThreadLocal维护变量时,ThreadLocal为每个使用该变量的线程提供独立的变量副本,所以每一个线程都可以独立地改变自己的副本,而不会影响其它线程所对应的副本。

从线程的角度看,目标变量就象是线程的本地变量,这也是类名中“Local”所要表达的意思。

线程局部变量并不是Java的新发明,很多语言(如IBM IBM XL FORTRAN)在语法层面就提供线程局部变量。在Java中没有提供在语言级支持,而是变相地通过ThreadLocal的类提供支持。

所以,在Java中编写线程局部变量的代码相对来说要笨拙一些,因此造成线程局部变量没有在Java开发者中得到很好的普及。

ThreadLocal的接口方法

ThreadLocal类接口很简单,只有4个方法,我们先来了解一下:

void set(Object value)
设置当前线程的线程局部变量的值。

public Object get()
该方法返回当前线程所对应的线程局部变量。

public void remove()
将当前线程局部变量的值删除,目的是为了减少内存的占用,该方法是JDK 5.0新增的方法。需要指出的是,当线程结束后,对应该线程的局部变量将自动被垃圾回收,所以显式调用该方法清除线程的局部变量并不是必须的操作,但它可以加快内存回收的速度。

protected Object initialValue()
返回该线程局部变量的初始值,该方法是一个protected的方法,显然是为了让子类覆盖而设计的。这个方法是一个延迟调用方法,在线程第1次调用get()或set(Object)时才执行,并且仅执行1次。ThreadLocal中的缺省实现直接返回一个null。

 

值得一提的是,在JDK5.0中,ThreadLocal已经支持泛型,该类的类名已经变为ThreadLocal<T>。API方法也相应进行了调整,新版本的API方法分别是void set(T value)、T get()以及T initialValue()。

ThreadLocal是如何做到为每一个线程维护变量的副本的呢?其实实现的思路很简单:在ThreadLocal类中有一个Map,用于存储每一个线程的变量副本,Map中元素的键为线程对象,而值对应线程的变量副本。我们自己就可以提供一个简单的实现版本:

 

 

  1. <span style="font-size:18px;">// 代码清单1 SimpleThreadLocal  
  2. class SimpleThreadLocal {  
  3.     private Map valueMap = Collections.synchronizedMap(new HashMap());  
  4.     public void set(Object newValue) {  
  5.         valueMap.put(Thread.currentThread(), newValue);// ①键为线程对象,值为本线程的变量副本  
  6.     }  
  7.     public Object get() {  
  8.         Thread currentThread = Thread.currentThread();  
  9.         Object o = valueMap.get(currentThread);// ②返回本线程对应的变量  
  10.         if (o == null && !valueMap.containsKey(currentThread)) {// ③如果在Map中不存在,放到Map  
  11.             // 中保存起来。  
  12.             o = initialValue();  
  13.             valueMap.put(currentThread, o);  
  14.         }  
  15.         return o;  
  16.     }  
  17.     public void remove() {  
  18.         valueMap.remove(Thread.currentThread());  
  19.     }  
  20.     public Object initialValue() {  
  21.         return null;  
  22.     }  
  23. }</span>  

 

虽然代码清单9?3这个ThreadLocal实现版本显得比较幼稚,但它和JDK所提供的ThreadLocal类在实现思路上是相近的。

一个TheadLocal实例


  1. <span style="font-size:18px;">package threadLocalDemo;  
  2. public class SequenceNumber {  
  3.     // ①通过匿名内部类覆盖ThreadLocal的initialValue()方法,指定初始值  
  4.     private static ThreadLocal<Integer> seqNum = new ThreadLocal<Integer>() {  
  5.         public Integer initialValue() {  
  6.             return 0;  
  7.         }  
  8.     };  
  9.     // ②获取下一个序列值  
  10.     public int getNextNum() {  
  11.         seqNum.set(seqNum.get() + 1);  
  12.         return seqNum.get();  
  13.     }  
  14.     public static void main(String[] args)  
  15.     {  
  16.         SequenceNumber sn = new SequenceNumber();  
  17.         // ③ 3个线程共享sn,各自产生序列号  
  18.         TestClient t1 = new TestClient(sn);  
  19.         TestClient t2 = new TestClient(sn);  
  20.         TestClient t3 = new TestClient(sn);  
  21.         t1.start();  
  22.         t2.start();  
  23.         t3.start();  
  24.     }  
  25.     private static class TestClient extends Thread  
  26.     {  
  27.         private SequenceNumber sn;  
  28.         public TestClient(SequenceNumber sn) {  
  29.             this.sn = sn;  
  30.         }  
  31.         public void run()  
  32.         {  
  33.             for (int i = 0; i < 3; i++) {  
  34.                 // ④每个线程打出3个序列值  
  35.                 System.out.println("thread[" + Thread.currentThread().getName()+"] sn[" + sn.getNextNum() + "]");  
  36.             }  
  37.         }  
  38.     }  
  39. }</span>  


 
参考文献:
  1. http://www.xuebuyuan.com/1628079.html
  2. http://blog.sina.com.cn/s/blog_5204918b0100d044.html
ThreadLocal与synchronized有本质的区别:
 synchronized是利用锁的机制,使变量或代码块在某一时该只能被一个线程访问。而ThreadLocal为每一个线程都提供了变量的副本,使得每个线程在某一时间访问到的并不是同一个对象,这样就隔离了多个线程对数据的数据共享。而Synchronized却正好相反,它用于在多个线程间通信时能够获得数据共享。
 
 
原创粉丝点击