데이터 베이스 면접 대비

정규화 과정

정규화 과정은 릴레이션 간의 잘못된 종속 관계로 인해 데이터베이스 이상 현상이 일어나서 이를 해결하거나, 저장 공간을 효율적으로 사용하기 위해 릴레이션을 여러 개로 분리하는 과정이다.

이상 현상의 종류

  • 삽입 이상 : 데이터 삽입 시 의도와 다른 값들도 삽입됨
  • 삭제 이상 : 데이터 삭제 시 의도와 다른 값들도 연쇄 삭제됨
  • 갱신 이상 : 속성값 갱신 시 일부 튜플만 갱신되어 모순 발생

정규화 과정은 정규형 원칙을 기반으로 정규형을 만들어가는 과정이며, 정규화된 정도는 정규형(NF)로 표현한다.

정규형 원칙

정규형 원칙이란 같은 의미를 표현하는 릴레이션이지만 좀 더 좋은 구조로 만들어야 하고, 자료의 중복성을 감소해야 하고, 독립적인 관계는 별개의 릴레이션으로 표현해야 하며, 각각의 릴레이션은 독립적인 표현이 가능해야 하는 것을 말한다.

  • 기본 정규형
    • 제1정규형(1NF)
    • 제2정규형(2NF)
    • 제3정규형(3NF)
    • 보이스/코드 정규형(BCNF)
  • 고급 정규형

제1정규형

릴레이션의 모든 도메인이 더 이상 분해될 수 없는 원자 값만으로 구성되어야 한다.

제2정규형

릴레이션이 제1정규형이며 부분 함수의 종속성을 제거한 형태를 말한다.

  • 부분 함수의 종속성 제거 : 기본키가 아닌 모든 속성이 기본키에 완전 함수 종속적인 것을 말한다.
  • 완전 함수적 종속 : 종속자가 키본키에만 종속되며, 기본키가 여러 속성으로 구성되어 있을 경우 기본 키를 구성하는 모든 속성이 포함된 기본키의 부분집합에 종속된 경우이다.
  • 기본키 : 기본키는 줄여서 PK 또는 프라이머리키라고 많이 부르며, 중복되는 값이 없다는 유일성과 필드를 조합하지 않고 최소 필드만 써서 키를 형성할 수 있는 최소성을 만족하는 키이다.

제3정규형

제2정규형이고 기본키가 아닌 모든 속성이 이행적 함수 종속(transitive FD)을 만족하지 않는 상태를 말한다.

  • 이행적 함수 종속 : A -> B와 B -> C가 존재하면 논리적으로 A -> C 가 성립할 때, C가 A에 이행적으로 함수 종속이 되었다고 한다.

보이스/코드 정규형

제3정규형이고, 결정자가 후보키가 아닌 함수 종속 관계를 제거하여 릴레이션의 함수 종속 관계에서 모든 결정자가 후보키인 상태를 말한다.

  • 결정자 : X -> Y일 때 X는 결정자, Y는 종속자이다.
  • 후보키 : 후보키는 기본키가 될 수 있는 후보들이며 유일성과 최소성을 동시에 만족하는 키이다.

트랜잭션

트랜잭션은 데이터베이스에서 하나의 논리적 기능을 수행하기 위한 작업의 단위를 말하며 데이터베이스에 접근하는 방법은 쿼리이므로, 즉 여러 개의 쿼리들을 하나로 묶는 단위를 말한다. 이는 ACID(원자성, 일관성, 독립성, 지속성) 특징을 가지고 있다.

A : 원자성

원자성은 트랜잭션과 관련된 일이 모두 수행되었거나 되지 않았거나를 보장하는 특징이다.

C : 일관성

일관성은 허용된 방식으로만 데이터를 변경해야 하는 것을 의미한다.

I : 독립성, 격리성

격리성은 트랜잭션 수행시 서로 끼어들지 못하는 것을 말한다.

D : 지속성

지속성은 성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것을 의미한다.

무결성

무결성이란 데이터의 정확성, 일관성, 유효성을 유지하는 것을 말한다.

무결성의 종류

  • 개체 무결성 : 기본키로 선택된 필드는 빈 값을 허용하지 않는다.
  • 참조 무결성 : 서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지해야 한다.
  • 고유 무결성 : 특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우 그 속성 값은 모두 고유한 값을 가진다.
  • NULL 무결성 : 특정 속성 값에 NULL이 올 수 없다는 조건이 주어진 경우 그 속성 값은 NULL이 될 수 없다는 제약 조건이다.

인덱스

인덱스는 데이터를 빠르게 찾을 수 있는 하나의 장치이다. 인덱스가 효율적인 이유는 효율적인 단계를 거쳐 모든 요소에 접근할 수 있는 균형 잡힌 트리 구조와 트리 깊이의 대수확장성 때문이다.

  • 대수확장성 : 트리 깊이가 리프 노드 수에 비해 매우 느리게 성장하는 것을 의미한다.

RDBMS와 NoSQL 차이

RDBMS : 관계형 데이터베이스는 행과 열을 가지는 표 형식 데이터를 저장하는 형태의 데이터 베이스를 가리키며 SQL이라는 언어를 써서 조작한다. MySQL, PostgreSQL 등이 있다. NoSQL : SQL을 사용하지 않는 데이터 베이스이다. MongoDB와 redis 등이 있다.


출처

카테고리:

업데이트:

댓글남기기