쿠리이야기

  • 홈
  • 태그
  • 방명록

Programming/Python 2

PySpark - DeltaTable 주요 method 정리

DeltaTable 주요 메서드 정리 1. 테이블 접근from delta.tables import DeltaTable# 경로 기반으로 불러오기delta_table = DeltaTable.forPath(spark, "/mnt/delta/user_metrics")# 테이블 이름 기반으로 불러오기delta_table = DeltaTable.forName(spark, "default.user_metrics") 2. MERGE (업서트)delta_table.alias("t").merge( df_updates.alias("s"), "t.user_id = s.user_id AND t.date = s.date").whenMatchedUpdateAll() \ .whenNotMatchedInsertAll() \..

Programming/Python 2025.09.04

PySpark - ETL 코드 흐름

PySpark - ETL 코드 흐름 # 데이터 읽기### 데이터 읽기 extract from pyspark.sql import SparkSessionspark = SparkSession.builder.appName("ETLExample").getOrCreate()# CSV 읽기df_csv = spark.read.option("header", True).csv("/mnt/data/input/sample.csv")# Parquet 읽기df_parquet = spark.read.parquet("/mnt/data/input/sample.parquet")# Delta 읽기df_delta = spark.read.format("delta").load("/mnt/delta/sample_delta") # 데이터 변환##..

Programming/Python 2025.09.04
이전
1
다음
더보기
프로필사진

쿠리이야기

  • 분류 전체보기 (81)
    • DB (22)
      • PostgreSQL (17)
    • AWS (3)
    • Echo system (30)
      • HDFS (1)
      • Airflow (28)
    • Monitoring (6)
      • Grafana (1)
      • Prometheus (4)
    • Kubernetes (2)
    • Programming (11)
      • Python (2)
      • C# (9)
      • Java (0)
    • Web Server (3)
      • IIS (3)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/12   »
일 월 화 수 목 금 토
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바