数据同步方案思考
Yahoo的PNUTS的数据同步:
基于行的Mastership;通过YMB(yahoo message broker)去以异步方式同步那些replicas数据。首先,应用更新请求到达router,router根据key映射到某一个storeunit,storeunit去向YMB发送数据更新消息,YMB做到安全保存数据(可能是互备消息),然后响应storeunit;这时候写入数据,然后向router返回响应,然后向应用发送响应。同步时机有YMB控制,估计最终一致时间差不会很大。
这里比较有特色的是利用了YMB代替了undo,redo log去做数据的恢复和同步。,
Amazon的Dynamo的数据同步:
基于NWR模型去完成数据同步。N指系统的数据备份数目,W指写的数目,R指读的数据份数。要求W+R>N,即写的分数要大于系统的备份份数-读的份数。也就是每一次读至少都会读到一个更新版本。这个缺点在于并发写同一数据多时,版本冲突问题,Dynamo通过vector clock去解决(大致可以采用返回版本有app自己设置解决,或者简单的最后修改时间胜出)。
其他的数据同步方案有:
Master/slave结构中的,写master,然后通过log去同步slaves的数据。
Master/Master,写一个同步另一个。
同时全写(也就是同步写方案)。
?