是个通用的大数据分布式文件系统,最重要的一点是设计就是用来部署在低廉硬件上的。
包括hadoop,完全就是为了大数据而开发的程序。
hadoop框架最核心的设计就两点,hdfs和mapreduce。
hdfs为海量数据提供了存储方式,mapreduce为海量数据提供了计算。
苏小木试图争取了一下,“教授,如果我们课题的时间足够长的话,不如我们试试自己实现,不借用hadoop,重新设计分布式文件系统、并行运算算法、并行处理数据库这些。”
“这样一来,专业针对的就是课题本身的算法、主导数据与行为模型。”
苏小木的话是有道理的,当然也是有私心的……
======
2更。