일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 지도학습
- 한국전자통신연구원 인턴
- 한국전자통신연구원
- r
- 빅분기
- 딥러닝
- KT AIVLE
- 다변량분석
- 에트리 인턴
- SQLD
- hadoop
- 프로그래머스
- kaggle
- ETRI
- 빅데이터분석기사
- Ai
- 기계학습
- 머신러닝
- Eda
- arima
- kt aivle school
- ML
- SQL
- 가나다영
- dx
- 소셜네트워크분석
- 에이블러
- 에이블스쿨
- 웹크롤링
- httr
- 하둡
- ggplot2
- python
- KT 에이블스쿨
- matplot
- 시각화
- cnn
- 시계열
- 하계인턴
- 서평
- Today
- Total
목록정규화 (2)
소품집
정규화란? 정규화는 데이터의 일관성, 최소한의 데이터 중복, 최소한의 데이터 유연성을 위한 방법이며 데이터를 분해하는 과정이다. 정규화된 모델은 테이블이 분해된다. 테이블이 분해되면 직원 테이블과 부서 테이블 간에 부서코드로 조인(join)을 수행하며 하나의 합집합으로 만들 수 있다. 정규화를 하면 불필요한 데이터를 입력하지 않아도 되기 때문에 중복 데이터가 제거된다. 정규화 절차 정규화의 문제점 정규화는 데이터 조회(select) 시에 조인(join)을 유발하기 때문에 CPU와 메모리를 많이 사용한다. 아래 코드를 프로그램화 한다면 중첩된 루프(Nested Loop)를 사용해야 한다. [ANSI JOIN} select 사원번호, 부서코드, 부서명, 이름, 전화번호, 주소 from 직원, 부서 where..
반정규화란? 정규화된 엔티티 속성, 관계에 대해 시스템 성능향상과 개발, 운영의 단순화를 위해 중복, 통합, 분리등을 수행하는 데이터 모델링 기법 언제 반정규화를 사용하는게 좋을까? 자주 사용되는 테이블에 접근하는 프로세스의 수가 많고 항상 일정한 범위만을 조회하는 경우 테이블에 대량 데이터가 있고 대량의 데이터 범위를 자주 처리하는 경우, 처리 범위를 줄이지 않으며 성능을 보장할 수 없는 경우 테이블에 지나친 조인이 걸려있는 경우 → 데이터를 중복하여 성능을 향상시키기 위한 기법! 반정규화를 사용하는 이유 데이터 무결성이 깨질 수 있는 위험을 무릅쓰고 데이터를 중복하여 반정규화를 적용하는 이유는,데이터를 조회할 때 디스크 I/O 양이 많아서 성능이 저하 경로가 너무 멀어 조인으로 인한 성능 저하 칼럼을..