没有hadoop命令,Hadoop的缺点中不包括-

  没有hadoop命令,Hadoop的缺点中不包括?

  Hadoop为什么不采用RAID?_就这么做!_百度空间

  Hadoop为什么不采用RAID?HDFS集群不使用RAID(冗余磁盘阵列)作为datanodes的存储设备(尽管namenode使用RAID来防止元数据丢失)。由于HDFS采用节点间块复制的方法,RAID提供的冗余机制对HDFS来说是冗余的。

  此外,RAID条带(RAID 0)通常用于提高性能,但它比HDFS使用的JBOD(只是一堆磁盘)慢,JBOD在所有磁盘中按时间片轮换HDFS块。具体来说,RAID 0读写操作受限于冗余磁盘阵列中最慢磁盘的速度。在JBOD,磁盘操作是独立的,因此读写操作的平均速度高于最慢的磁盘。实际上,磁盘的性能是可以改变的,即使是同一类型的磁盘。在雅虎Hadoop集群的基准测试中,测试Gridmix显示JBOD比RAID 0快10%,另一个测试显示快30%(这里的测试指的是HDFS的写能力。

  最后,当JBOD配置中的磁盘出现故障时,HDFS可以继续运行;但是,在RAID中,一个磁盘的故障会使整个阵列(甚至节点)无法使用。

  翻译:Oreilly Hadoop 《The Definitive Guide》 2009年6月

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: