openstack系列(11)-平台运维

openstack的运维方式,相对传统单机软件运维差别比较大,需要那种对大规模服务器运维的经验,自动化程度需要比较高的要求,监控报警平台也不可或缺。大型分布式系统最难的就是运维和问题的重现,这个时候日志就是最好的排除问题的方法,大部分问题只要有详细的日志记录,都能解决问题。还有一些问题就是软件自身的故障或者bug,需要源代码去进行调试解决。

比较Apache Hadoop 生态系统中不同的文件格式和存储引擎的性能

这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率, 提取性能, 分析扫描以及随机数据查找等领域。这有助于理解它们中的每一个如何(何时)改善你的大数据工作负载的处理能力。