3.GFS

文章页面

分布式系统

3.GFS

这个东西学起来抽象，但是用起来是一点也不抽象
论文写的相当工业化，这里就不看了，如果想看可以B站找个视频看看讲解

这不是学术论文，是我被6.824折磨后想明白的东西。GFS（Google File System）是2003年Google为MapReduce量身定做的存储系统，核心就一句话：在廉价硬件上可靠地存超大型文件，让批量数据处理飞起来

在你学习GFS的时候请你忘记你的电脑磁盘，这两个完全不是一个东西

这就像你用卡车运矿石，而不是用跑车送快递。

这种东西一般叫做单点故障,形容的是整个系统只有一个管理节点，这个节点一旦挂掉整个系统崩溃
万事万物都有一个但是，GFS也是这样

这种架构使得Master节点不再是性能瓶颈，Master的压力也不大

GFS的一致性要求并不是非常非常高的强一致性，它要求的是最终一致性(Eventual Consistency)，中间可能暂时看不到结果，但是最终肯定会被更新
因为GFS每次吞吐过大，并且Google当时机器非常烂也非常多，不可能让每个机器保持强一致性

Master把某个Chuck的读写权力暂时交给某一个ChuckServer，然后:

Warning

在此次租约中，如果Primary炸了，心跳无法进行下去，Master会选择一个新的Primary并且进行租约，通知客户端重发

GFS里面使用追加，很少很少使用覆盖
追加就是在全部数据的末端进行填充，然后记录下来信息，下次使用的时候计算偏移量即可
我自己的思路是Master在设计的时候可以定义版本上下限，超过下限就可以回收掉老旧的Chuck
也可能不会进行删除，因为老数据也可能会有作用

当然，机器绝对不是完全可信的，这时候我们就需要设计出来一些冗余，让我们整个系统继续运行，那么我们怎么进行设计呢？

或者我们设计两套进行交替运行，一套运行的时候另一套停止运行，当A出现了无可挽回的故障就用B顶上不过这个设计挺烂的，好的架构肯定不是两套

GFS 是一个面向大规模数据的分布式文件系统，通过 Primary + Lease + 多副本 + append-heavy 设计，把复杂的一致性和容错问题封装起来，实现高吞吐、高可用、可扩展，同时对开发者透明

如果想看怎么写一个的话就需要等明年5-6月了，那时候应该没啥事情，可以写写然后发视频