🔬 Intro

duckdb의 특성에 대한 이해를 목적으로 python 환경에서 테이블 생성 및 데이터 조회 실습을 진행합니다.

duckdb와 mysql의 쿼리는 기본적인 형태는 유사하지만, 지엽적인 부분에서의 차이점들이 상당히 많습니다.
python 환경에서 생성한 duckdb 테이블은 in-memory 환경이 아닌 로컬 환경에 저장됩니다.
connection labels을 사용하지 않는 한, duckdb는 단일 connector만을 지원합니다. Thread를 열거나 복수의 스크립트로 connection을 구성하려면 connection label이 필요하며, 해당 레포지토리에서는 관련 내용에 대해서 다루지 않습니다. 공식 가이드를 참조 부탁드립니다.

🛠️ Install

$ wget https://github.com/duckdb/duckdb/releases/download/v0.8.1/duckdb_cli-linux-amd64.zip
$ unzip duckdb_cli-linux-amd64.zip

$ pip install duckdb

This repository runs in python3.10
/src/create_table 이하의 모든 스크립트는 aws s3 접속을 위한 key 정보를 포함하고 있습니다. 해당 레포지토리에서는 AWS와 관련된 내용에 대해서는 다루지 않습니다. 이 점을 참조 부탁드립니다. 또한 config parser와 관련된 내용도 다루지 않습니다.