mongodb - Apache Spark SQL和MongoDB之间的区别? [关闭]

我只在RDBMS PostgressSQL方面有经验,但我对ApacheSpark和MongoDB不太熟悉。所以我有以下困惑请我
1)Apache Spark SQL和MongoDB有什么区别?
2)我需要使用sparksql或mongodb或组合方式的地方/场景/域是什么?
3)阿帕奇火花是像蒙多布,卡桑德拉…?
4)我在MongoDB中有多个兆字节的数据,我想做数据分析,然后需要提供报告。
所以请与我分享你的知识,并给我你的投入
当做
山卡尔S


最佳答案:

1)
阿帕奇火花:
ApacheSpark用于在SQL查询中对大数据执行并行计算操作。
蒙古数据库:
MongoDB是一个文档存储,本质上是一个数据库,因此不能与Spark(计算引擎而不是存储)进行比较。
2)
sparksql非常适合处理在spark集群中导入的结构数据,在该集群中有数百万数据可用于大型计算。
MongoDB可以在需要NoSQL功能的地方使用(与SparkSQL相比,它具有完整的NoSQL功能)。
3)
没有Apache Spark用于不同的目的,您不能用Mondodb、Cassandra替换它,就像计算引擎给您提供对large data sets
4)
使用第三方服务,如slam datahttp://slamdata.com/来应用MongoDB分析,也可以使用
Spark数据帧从MongoDB读取数据