大数据开源项目集锦(持续更新)
(1)Hadoop 一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序
http://hadoop.apache.org/
(2)Marathon是一个全新的框架,它将Mesos变成一个更有活力的工具,进而可以在单一的集群上运行不同的应用程序。
https://github.com/mesosphere/marathon
(3)Twitter开源了名为Summingbird的数据分析工具。区别于以往的更快、更准确节奏,Summingbird更注重于流处理与批处理的无缝整合,以及编程语言的原生化。
https://github.com/twitter/summingbird/wiki#future-plans