일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 요한하리
- 책읽는케이크
- 카카오
- 통화주의학파
- ReinforcementLearning
- 재무제표
- 증권투자권유자문인력
- 도둑맞은집중력
- potatoeseater
- ldbc
- 통화정책파급경로
- RL
- 집중하는법
- montecarlo
- 코딩테스트
- 파생상품평가모형
- 인도가격
- SQL
- Nas
- dataanalysis
- 주식
- 재무엑셀
- 독서모임
- pandas
- agviewer
- 독후감
- 블라인드테스트
- python
- 프로그래머스
- 파이썬
- Today
- Total
목록IT/Data Processing (3)
이것저것 담는 블로그
* pgAdmin쿼리 tool, 이번 교육을 위해 새로 설치해봄 * AGViewerGDB 시각화 도구 * GDB queryGDB = 노드 + 엣지 MATCH ... RETURN ...; MATCH문은 특정 노드를 변수명으로 선언하는 역할이고 return이 기존 select 문 같은 역할을 함 * 데이터 조회MATCH(a:person) return distinct key(a);person 테이블의 모든 컬럼을 조회 = SQL의 describe와 유사MATCH(a:person) WHERE a.name in ['Keanu Reeves', 'Tom Cruise']] return a.born, a.name;이름이 Keanu Reeves, Tom Cruise 중 하나인 person을 a라 하였을 때, a의 출생연도..
데이터과학자로 일하다보면 데이터를 처리하는 과정은 어느 정도 정형화된 부분이 있다. 앞으로 항상 하게 될 일이라서 머릿 속에 framework을 잡는다는 생각으로 과정을 정리하였다. 다른 데이터분석가/데이터과학자 분들의 업무 프로세스도 유사할 것이라 생각한다. 1. 데이터 추출 - ANSI SQL, HiveQL, Sybase, Python Step 1. 원하는 테이블과 컬럼 값 찾기 메타데이터시스템 활용 자주 활용하는 도메인 명칭과 datatype 등을 기억해두면 일처리 속도가 매우 빨라진다. 원하는 데이터가 없다면, 분석용 주제영역에만 없는 데이터인 경우, 인프라 쪽에 적재 요청 어디에도 없다면, API/크롤링 등으로 외부로부터 데이터 긁어서 적재 API는 Parameter나 정책이 종종 바뀌기도 하기..
부동소수점을 반올림할때 쓰는게 ROUND 해당 컬럼과 몇번째 이하 소수점에서 반올림할지 써준다. ROUND(총자산수익률, 2) 데이터 타입을 변환해야할때 (type cast) 쓰는게 CAST 어떤 컬럼을 어떤 데이터 타입으로 변환할지 적어준다. 기본 문법은 CAST 컬럼명 AS 데이터타입명 CAST(ROUND(총자산수익률, 2)) AS DECIMAL(18,1) 결측치 처리할 때 쓰는게 ISNULL 보유한 상품개수가 null 이면 0으로 대체한다. ISNULL(보유한상품개수, 0) Select한 걸 새로운 테이블에 넣고 싶을 때 쓰는 INTO SELECT C1, C2 INTO NEW_TABLE FROM ORIGINAL_TABLE 컬럼으로 조건을 줘서 새로운 컬럼 만들고 싶을 땐 CASE문 기본 문법은 CA..