您当前的位置: > 详细浏览

基于Spark的SKA1-MID自校准管线分布计算实现

请选择邀稿期刊:
摘要: SKA 科学数据处理产生的数据超出了所有已存在的分布式处理系统的处理能力,如何实现一个分布式执行框架是当前科学数据处理的一个重要研究内容。Spark 是非常成熟的一个商业框架,在互联网应用中被广泛应用,本文根据SKA项目进展要求,重点研究了如何将算法参考库(ARL)中的部分管线移植到Spark上执行。本文对部分实现过程进行了分析讨论,给出了相应的任务流程实现。最终结果表明,移植后代码生成结果符合预期,Spark能够满足部分数据分布式数据的要求,但迫切需要解决自身存在的一系列问题。

版本历史

[V1] 2019-12-26 11:28:11 ChinaXiv:202001.00044V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量7198
  •  下载量1749
评论
分享