可以使用不同的函数来查找最小值和最大值。下面是使用
agg
功能。
from pyspark.sql.functions import *
df = spark.table("HIVE_DB.HIVE_TABLE")
df.agg(min(col("col_1")), max(col("col_1")), min(col("col_2")), max(col("col_2"))).show()
但是,您也可以探索
describe
和
summary
(2.3版以后)函数,用于获取数据帧中各列的基本统计信息。
希望这有帮助。
当做,
尼拉杰