본문 바로가기

river의 기술 로그

검색하기
river의 기술 로그
프로필사진 riverruns

  • 분류 전체보기 (7)
    • Spark(Scala and PySpark) (5)
    • SQL (2)
    • Python (0)
    • ML and DL (0)
    • NLP (0)
    • DataScience Book Reivews (0)
    • 기술자격증 (0)
    • 후기 (0)
Guestbook
Notice
Recent Posts
Recent Comments
Link
«   2026/05   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
Tags
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록SQL (2)

river의 기술 로그

[SQL] collect_list() 함수

collect_list() : 한 개의 id 기준으로 여러가지 값을 가질 때, 그 여러가지 값들을 배열 형식으로 묶어주는 함수 (*SparkSQL도 가능) SELECT id, COLLECT_LIST(ITEM) AS item_list FROM item_info GROUP BY id

SQL 2021. 5. 16. 15:45
[SQL] SELECT DISTINCT | DISTINCT한 로우들을 COUNT한 것들의 COUNT

groupBy를 하든 group by를 하든 이렇게 중복 없이 묶인 DISTINCT한 로우들을 COUNT 하는 방법 SELECT Count(*) AS 이름맘대로 FROM (SELECT DISTINCT 컬럼명 FROM 테이블명) 예를 들어 우리집에 사놓은 라면이 열라면, 진라면, 신라면이 각각 뭐 2개 3개 3개 이렇다고 하면 총 라면은 8개가 있지만 라면의 종류는 3종류이다. 이런 종류, 분류, 항목, 카테고리 기타 등등을 세는 방법이다 SELECT Count(*) 우리집이먹는라면종류 FROM (SELECT DISTINCT 라면이담긴컬럼 FROM 테이블명)

SQL 2021. 4. 9. 23:56
Prev 1 Next

Blog is powered by AXZ / Designed by Tistory

티스토리툴바