Apache Spark 的新编程语言( 二 ) _编程语言

如果你是一名数据科学家，需要导入2022年美国全国汽车销售数据，您只需要两行代码即可完成：
spark_ai = SparkAI auto_df = spark_ai.create_df("2022 USA national auto sales by brand")DataFrame 操作
对于给定的 DataFrame 对象， SDK 允许你运行以 df.ai 开头的方法。这包括转换、绘图、DataFrame 解释等等。
要激活 PySpark DataFrame 的部分函数：
spark_ai.activate要预览 auto_df：
auto_df.ai.plot要查看各汽车公司的市场份额分布：
auto_df.ai.plot("pie chart for US sales market shares, show the top 5 brands and the sum of others")要获取增长最快的品牌：
???????auto_top_growth_df=auto_df.ai.transform("top brand with the highest growth") auto_top_growth_df.show要获取 DataFrame 的解释：
auto_top_growth_df.ai.explain总的来说，这个 DataFrame 正在查找销售增长最快的品牌。它将结果按销售增长率降序排列，并仅返回增长最快的结果。
自定义函数 (UDFs) SDK
支持通过简单而清晰的方式创建自定义函数。使用@spark_ai.udf装饰器，你只需定义一个带有文档字符串的函数， SDK 就会在后台自动完成代码生成：
???????@spark_ai.udf def convert_grades(grade_percent: float) -> str: """Convert the grade percent to a letter grade using standard cutoffs""" ...现在，你可以在 SQL 查询或 DataFrames 中使用这个自定义函数（UDF）
SELECT student_id, convert_grades(grade_percent) FROM grade总结
Apache Spark 的英语 SDK 是一个既简洁又强大的工具，能够显著提升你的开发效率。它的目标是简化复杂的任务，减少必需的代码量，使你可以专注于从数据中挖掘洞察。
虽然英语 SDK 还处于早期的开发阶段，但未来可期。我们鼓励你去尝试这个创新的工具，亲身感受其带来的便利，并考虑为此项目贡献自己的一份力量。不要在这场革命中袖手旁观，而应该积极参与其中。现在就去 pyspark.ai 上探索和体验英语 SDK 的强大功能吧。你的参与和洞见，将为扩大 Apache Spark 的影响力做出重要贡献。

【Apache Spark 的新编程语言】

Apache Spark 的新编程语言( 二 )

推荐阅读

梅西|泽罗伯托：希望梅西拿世界杯冠军，这是他唯一缺少的荣誉

每天读宋词为何曹皇后最终妥协？其中2个原因，太心酸了，清平乐里徽柔婚事

关于吃瓜群众的议论文,论吃瓜群众作文800字-

调味料能放冰箱里保存吗

不惑|《二十不惑》持续霸榜收视领跑热度爆棚

天坑|平整地面突然塌陷出现巨坑：一夜之间由4米增至30米仍在扩大

央视新闻@14亿人在战斗，每个你都算数！

中年冲突再度升级苹果删除Epic工作室的开发者账号

超云时尚结果搭上长袜潮翻，海清出门太急了？鞋子标签忘了撕

上海六旬爷叔执意转账给“英国女兵”，7位民警轮番劝阻止付

北鼻很萌|直到看到辞职老师晒的午餐，宝妈怒火中烧，女儿幼儿园放学总说饿

苦槠怎么做成豆腐苦槠豆腐什么人不能吃

|职场中，太会做事，领导都不重视，更多的是“看笑话”

人类|达尔文的漏洞是什么？我们的祖先到底是谁？

松鼠热点|两学员不幸身亡，其中一名为应届毕业生，驾校教练开车出车祸

烹饪|家常菜制作：香菇酿肉，加点玉米混合肉馅口感更特别

生肖|国庆前后，财运起飞，3生肖喜事不请自来，步步高升，有钱有势

新福建|国羽从实战出发强化备战，汤尤杯模拟赛

每日电竞趣谈|只有赢下去，才有呼吸的资格，TES夏季赛首败后的36小时

平安科技获评“2000-2020中国软件和信息服务业发展杰出企业”