spark是干嘛的
奇闻怪事 2023-03-25 22:03www.huluw.com奇闻怪事
spark是一个用来实现快速,通用的集群计算平台 spark适用于各种各样原先需要多种不同的分布式平台的场景,包括批处理,迭代算法,交互式查询,流处理。通过在一个统一的框架下支持这些不同的计算,spark使我们可以简单而低耗地把各种处理流程整合在一起。
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
尽管创建 Spark 是为了支持分布式数据集上的迭代作业,实际上它是对 Hadoop 的补充,可以在 Hadoop 文件系统中并行运行。通过名为 Mesos 的第三方集群框架可以支持此行为。Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发,可用来构建大型的、低延迟的数据分析应用程序。
上一篇:水仙花是哪个季节开的
下一篇:柳江县景点
奇人奇事
- 闺蜜2什么时候上映 电影闺蜜第二部上映时间
- 唱作人朱星杰高产高质 新作 下世纪初雪复古
- 安宰贤是富二代吗安宰贤的家境怎么样
- 胡定欣透视衣造型惊呆全场 与好友相约40岁时在
- 韩国奔跑吧兄弟名单大分析 大型户外竞技真人秀
- 催眠师催眠挑战上线杨玏男扮女装玩催眠魔法
- 变性主持人利菁夜探诊所缩胸 抽脂不打麻药
- 黄灿灿割双眼皮了吗黄灿灿双眼皮是真的吗
- 江湖岁月英雄柔情展真心,热血演绎铁汉情义
- 电影唐人街探案3映后畅聊会 陈思诚王宝强感
- 中国姓氏排名2020年最新版是怎样的个人大数据
- 加藤纱里婚后3个月分手 老公嫌弃她太花钱
- 青你2迎公演舞台LISA严厉升级 亲自示范舞
- 有些人你永远不必等是什么歌 歌曲梦醒时分
- 演员宣璐是怎么火的演过什么剧 宣璐个人资料简
- 2017年新西兰葡萄收成减少 品质如何