[AWS] 데이터 아키텍처 (RDS, S3, GLUE, ATHENA, REDSHIFT)
내가 보려고 정리하는 우리 회사 AWS 데이터 아키텍처 사업 본부별 다른 DBMS 쓰다가 최근에 데이터 통합을 추진하면서, AWS 서비스를 사용한 데이터웨어하우스를 구축하는 중이다. (AWS는 단순한 웹페이지가 아니라 클라우드 컴퓨팅 환경이다.) 위의 아키텍처에서 필요한대로 점점 더 추가될 수 있다. 하나씩 기능을 살펴보자 RDS (Relational Database Service) Category : DB 관리형 관계형 데이터베이스 MySQL, PostgreSQL, Oracle Database, SQL Server,MariaDB, Amazon Aurora 중에 선택해서 데이터베이스를 생성할 수 있다. 클라우드에서 관계형 데이터베이스를 간편하게 설정, 운영 및 확장 가능 S3 (Simple Storage..
2022. 3. 8.
[AWS Redshift SQL] 숫자 세 자리 마다 콤마(,) 찍기 / 소수점 자릿수 맞추기 (ft. TO_CHAR)
AWS Redshift 에서 123,444,000 처럼 숫자 세자리 수 마다 콤마 찍어주는 방법 MySQL 에서는 FORMAT 함수로 되지만 Redshift 에서는 FORMAT 함수 지원 안해줌.. TO_CHAR 함수 사용하면 할 수 있다. SELECT TO_CHAR ( 컬럼명 , '999,999,999,999' ) FROM 테이블명 999,999 는 출력 될 예상 수치 보다 큰 숫자로 입력해야 잘 적용 됨으로 일단 큰 숫자로 설정하는게 좋다 ex) SELECT TO_CHAR ( 주문금액, '999,999,999,999,999' ) FROM shop_order 소수점 자리도 몇자리까지만 출력되게 할 ..
2022. 3. 7.
파일, 폴더(디렉토리) 다루는 커맨드 - pwd, cd, ls, mkdir, touch
이번 글에서는 pwd, cd, ls, mkdir, touch 커맨드의 사용법과 예시를 설명하겠습니다. cat, less, head, tail, mv, cp, rm 커맨드는 아래에서 확인해보세요! 👉파일, 폴더(디렉토리) 다루는 커맨드 - cat, less, head, tail, mv, cp, rm👈 컴퓨터에 있는 파일과 폴더를 다루는 중요한 커맨드 pwd, cd, ls 사용법을 알아보자. 유닉스 운영체제에서는 폴더를 디렉토리 라고 한다. 디렉토리를 다루려면 유닉스 디렉토리 구조를 알아야한다. 유닉스 디렉토리 구조는 거꾸로 된 나무와 같다 맨 위에 root 가 있고 그 밑으로 디렉토리들이 뻗어 나간다. 사용자의 홈 디렉토리가 중요한데 사용자의 홈 디렉토리는 Linux는 root 안에 home 안에 있고 m..
2022. 2. 7.
[MySQL] 테이블 컬럼 값 생성, 수정, 삭제 (CREATE, UPDATE, DELETE)
animal_info 라는 테이블 생성하기 id : Primary Key로 사용할 컬럼, 데이터 타입 : INT AUTO_INCREMENT 속성 주기 type : 동물 종류(사자, 코끼리 등), 데이터 타입 : VARCHAR, 최대 길이 : 30자 name : 동물 이름(리오, 조이 등), 데이터 타입 : VARCHAR, 최대 길이 : 10자 age : 나이, 데이터 타입 : TINYINT sex : 성별, 데이터 타입 : CHAR, 최대 길이 : 1자 weight : 몸무게, 데이터 타입 : DOUBLE feature : 특징 묘사, 데이터 타입 : VARCHAR, 최대 길이 : 500자 entry_date : 동물원에 들어온 날짜, 데이터 타입 : DATE feature ..
2022. 2. 3.
[MySQL] 문자열 관련 함수 (SUBSTRING, LENGTH, UPPER 등)
MySQL 문자열 관련 자주 쓰이는 함수 모음 SUBSTRING, LENGTH, UPPER, LOWER, LPAD, RPAD, TRIM, LTRIM, RTRIM 1. SUBSTRING 예시 쿼리문> # 회원들이 사는 주요 지역의 고유값 개수 # '서울' '경기' 등 맨 앞 2자리 추출하기 위해 SUBSTRING 사용 SELECT (SUBSTRING (address, 1, 2)) AS region_count FROM member ; # 중복제거, 고유한 값 추출 하기 위해 DISTINCT 사용 SELECT DISTINCT ((SUBSTRING (address, 1, 2))) AS region_count FROM member ; # COUNT : 말 그대로 카운트! SELECT COUNT (DISTINCT ..
2022. 1. 26.