首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 软件管理 > 软件架构设计 >

Tachyon简介及现阶段可用性分析

2013-10-24 
Tachyon简介及目前可用性分析简介翻译tachyon wiki上的介绍“Tachyon是一个高容错的分布式文件系统,允许文

Tachyon简介及目前可用性分析

简介

翻译tachyon wiki上的介绍

Tachyon是一个高容错的分布式文件系统,允许文件以内存的速度在集群框架中进行可靠的共享,就像Spark和 MapReduce那样。通过利用信息继承,内存侵入,Tachyon获得了高性能。Tachyon工作集文件缓存在内存中,并且让不同的 Jobs/Queries以及框架都能内存的速度来访问缓存文件”。因此,Tachyon可以减少那些需要经常使用的数据集通过访问磁盘来获得的次数。


使用

鉴于Tachyon也是AMP实验室开发的项目,属Spark整个生态环境里的一部分,原本打算尝试让Spark/Shark在Tachyon上跑,看看速度/性能有没有一些提升。

Tachyon简介及现阶段可用性分析

Tachyon目前发布的release版本是0.2的,支持CDH3。支持CDH4的tachyon-0.3版本还未发布,不过可以在0.3-branch上下载到,需要自己编译打包,依赖的jdk是1.7的。想要部署cluster,让Spark和Shark在上面跑的话,可以参考下面几份wiki,

// Shark version  val SHARK_VERSION = "0.8.0"  val SPARK_VERSION = "0.8.0-incubating"  val SCALA_VERSION = "2.9.3"  // Hadoop version to build against. For example, "0.20.2", "0.20.205.0", or  // "1.0.1" for Apache releases, or "0.20.2-cdh3u3" for Cloudera Hadoop.  val DEFAULT_HADOOP_VERSION = "1.0.4"  lazy val hadoopVersion = env("SHARK_HADOOP_VERSION") orElse                           env("SPARK_HADOOP_VERSION") getOrElse                           DEFAULT_HADOOP_VERSION  // Whether to build Shark with Yarn support  val YARN_ENABLED = env("SHARK_YARN").getOrElse("false").toBoolean  // Whether to build Shark with Tachyon jar.  val TACHYON_ENABLED = false
另一方面,我用shark-0.7跑的时候,会出一些奇怪的问题,在google的tachyon user上看了相关帖子,很多问题和bug都说会在0.3或者future release中解决,觉得tachyon还不够成熟和稳定,暂时还不敢继续尝试使用。至少等到0.3正式发布,再观望一下情况。

热点排行