基于Spark的SKA1-MID自校准管线分布计算实现

作者： 戴伟 ¹ 汪森 ¹ 李秋虹 ² 邓辉 ³ 梅盈 ³ 王锋 ^1,3
作者单位：

1. 昆明理工大学云南省计算机技术应用重点实验室，云南昆明，650051

2. 复旦大学，上海，210000

3. 广州大学天体物理中心,广东广州，510006
提交时间：2019-12-26 11:28:11

摘要: SKA 科学数据处理产生的数据超出了所有已存在的分布式处理系统的处理能力，如何实现一个分布式执行框架是当前科学数据处理的一个重要研究内容。Spark 是非常成熟的一个商业框架，在互联网应用中被广泛应用，本文根据SKA项目进展要求，重点研究了如何将算法参考库(ARL)中的部分管线移植到Spark上执行。本文对部分实现过程进行了分析讨论，给出了相应的任务流程实现。最终结果表明，移植后代码生成结果符合预期，Spark能够满足部分数据分布式数据的要求，但迫切需要解决自身存在的一系列问题。

分布计算管线算法参考库-ARL 分布数据处理

分类： 天文学 >> 天文学
引用： ChinaXiv:202001.00044 (或此版本 ChinaXiv:202001.00044V1)
DOI:10.12074/202001.00044V1
CSTR:32003.36.ChinaXiv.202001.00044.V1
推荐引用方式： 戴伟,汪森,李秋虹,邓辉, 梅盈,王锋 .(2019).基于Spark的SKA1-MID自校准管线分布计算实现.天文研究与技术.[ChinaXiv:202001.00044] (点此复制)

版本历史

[V1]

2019-12-26 11:28:11

ChinaXiv:202001.00044V1

下载全文

相关论文推荐

1. Non-perturbative corrections to the planetary perturbation equation	2024-05-16
2. 类星体3C 446射电光变非线性特性分析	2024-04-12
3. 年轻脉冲星周期-磁场分类及演化	2024-04-12
4. Crab脉冲星巨脉冲辐射等待时间分布的非稳态泊松模拟	2024-04-12
5. 一种低表面亮度星系的自动搜索算法---YOLOX-CS	2024-04-12
6. EfficientNetV2-S-Triplet7: 一种改进的星系形态学分类算法	2024-04-12
7. 基于SE-Inception-v3的星系形态分类模型	2024-04-12
8. 吉林天文观测基地光学观测环境及相关研究进展	2024-04-12
9. 利用广义霍夫变换确定中国古代恒星星表的观测年代	2024-04-10
10. Determining the observation epochs of star catalogs from ancient China using the Generalized Hough Transform method	2024-04-10


公开评论匿名评论仅发给作者