spark读取hdfs文件

2024-10-26 00:00:34 数码大全

Spark指定读取hdfs文件的实现

spark读取hdfs时,通过重写FileInputFormat<LongWritable, Text>类,实现自定义TextInputFormat,对读取的hdfs文件的切片进行过滤,从而起到指定读取hdfs文件的效果。

版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。