트랜잭션
트랜잭션의 특성
트랜잭션 (Transaction)
- 논리적인 작업의 단위, 하나의 작업을 수행하는 데 필요한 DB 연산들을 모아 놓은 것
- 장애 발생 시 복구 작업이나 병행 제어 작업을 위한 중요한 단위로 사용
- 데이터베이스의 무결성과 일관성을 보장하기 위해 작업 수행에 필요한 연산들을 하나의 트랜잭션으로 제대로 정의하고 관리해야 함
트랜잭션의 특성 (ACID)
- 원자성 (Atomicity)
- 트랜잭션의 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 하는 all-or-nothing 방식
- 트랜잭션 실행 도중 장애가 발생하면 지금까지 실행한 연산 처리를 모두 취소하고, DB를 트랜잭션 작업 전 상태로 되돌려야 함
- 👉 원자성의 보장을 위해 장애 발생 시 회복 기능 필요
- 일관성 (Consistency)
- 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함
- 모순된 데이터가 존재하면 안된다.
- 👉 일관성의 보장을 위해 동시성 제어 기능 필요
- 격리성 (Isolation)
- 수행 중인 트랜잭션이 완료될 때까지 다른 트랜잭션들이 중간 연산 결과에 접근할 수 없음
- 👉 격리성의 보장을 위해 동시성 제어 기능 필요
- 지속성 (Durability)
- 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 영구적이어야 함
- 👉 지속성의 보장을 위해 장애 발생 시 회복 기능 필요
트랜잭션의 주요 연산
Commit 연산
- 트랜잭션의 수행이 성공적으로 완료되었음을 선언하는 연산
- commit 연산이 실행되면 트랜잭션의 수행 결과가 데이터베이스에 반영되고 일관된 상태를 지속적으로 유지하게 됨
Rollback 연산
- 트랜잭션의 수행이 실패했음을 선언하는 연산
- rollback 연산이 실행되면 트랜잭션이 지금까지 실행한 연산의 결과가 취소되고 데이터베이스가 트랜잭션 수행 전의 일관된 상태로 되돌아감
트랜잭션의 상태

활동(active) 상태
- 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태
부분 완료(partially committed) 상태
- 트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태
완료(committed) 상태
- 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태
- 트랜잭션이 수행한 최종 결과를 데이터베이스에 반영하고, 데이터베이스가 새로운 일관된 상태가 되면서 트랜잭션이 종료됨
실패(failed) 상태
- 장애가 발생하여 트랜잭션의 수행이 중단된 상태
철회(aborted) 상태
- 트랜잭션의 수행 실패로 rollback 연산을 실행한 상태
- 지금까지 실행한 트랜잭션의 연산을 모두 취소하고 트랜잭션이 수행되기 전의 데이터베이스 상태로 되돌리면서 트랜잭션이 종료됨
- 철회 상태로 종료된 트랜잭션은 상황에 따라 다시 수행되거나 폐기됨
장애(Failure)와 회복(Recovery)
장애(Failure)의 유형
장애(Failure)
- 시스템이 제대로 동작하지 않는 상태
장애의 유형
- 트랜잭션 장애: 트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태
- 시스템 장애: 하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태
- 미디어 장애: 디스크 장치의 결함으로 디스크에 저장된 DB의 일부 혹은 전체가 손상된 상태
데이터베이스를 저장하는 저장 장치의 종류
- 휘발성(volatile) 저장 장치: 장애가 발생하면 데이터가 손실 - 메인 메모리
- 비휘발성(nonvolatile) 저장 장치: 저장 장치 자체에 이상이 발생하지 않으면 장애가 발생해도 저장된 데이터가 손상되지 않음 - 디스크, 자기 테이프, CD/DVD
- 안정(stable) 저장 장치: 비휘발성 저장 장치를 이용해 데이터 복사본 여러 개를 만드는 방법으로, 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음.
데이터 이동 연산
트랜잭션 수행을 위해 필요한 데이터 이동 연산
- input / output: 디스크와 메인 메모리 간의 데이터 이동 연산
- 일반적으로 데이터베이스는 비휘발성 저장 장치인 디스크에 상주
- 트랜잭션이 데이터베이스의 데이터를 처리하기 위해서는 데이터를 디스크에서 메인 메모리로 가져와 처리한 다음 그 결과를 디스크로 보내는 작업 필요
- read / write: 메인 메모리와 응용 프로그램 변수 간의 데이터 이동 연산
Input / Output 연산
- block 단위로 수행 - 디스크 블록(디스크에 있는 블록) / 버퍼 블록(메인 메모리에 있는 블록)
- input(x): 디스크 블록에 저장되어 있는 데이터 x를 메인 메모리 버퍼 블록으로 이동시키는 연산
- output(x): 메인 메모리 버퍼 블록에 있는 데이터 x를 디스크 블록으로 이동시키는 연산
Read / Write 연산
- read(x): 메인 메모리 버퍼 블록에 저장되어 있는 데이터 x를 프로그램의 변수로 읽어오는 연산
- write(x): 프로그램의 변수 값을 메인 메모리 버퍼 블록에 있는 데이터 x에 기록하는 연산
회복 (Recovery) 연산
회복 (Recovery)
- 장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구시키는 것
- 트랜잭션의 특성을 보장하고, 데이터베이스를 일관된 상태로 유지하기위해 필수적인 기능
- 회복 관리자(recovery manager)가 담당: 장애 탐지, 데이터 베이스 복구 기능 제공
회복을 위해 데이터베이스 복사본을 만드는 방법
- 덤프 (dump): 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법
- 로그 (log): 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후 값을 별도의 파일에 기록하는 방법
- 레코드 단위로 트랜잭션 수행과 함께 기록됨
회복을 위한 기본 연산
- redo (재실행): 가장 최근에 저장한 DB 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 DB 상태로 복구
- 전반적으로 손상된 경우에 주로 사용
- undo (취소): 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 DB를 원래 상태로 복구
- 변경 중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우에 주로 사용
회복 기법
로그 회복 기법
- 즉시 갱신(immediate update) 회복 기법
- 트랜잭션 수행 중에 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영
- 장애 발생에 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에 기록: 로그 파일에 로그 레코드를 먼저 기록한 다음 DB에 변경 연산 반영
- 트랜잭션이 완료되기 전 장애가 발생한 경우: undo 연산
- 트랜잭션이 완료된 후 장애가 발생한 경우: redo 연산
- 지연 갱신(deferred update) 회복 기법
- 트랜잭션 수행 중에 데이터 변경 연산의 결과를 로그에만 기록해두고, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터베이스에 한번에 반영
- 트랜잭션 수행 중에 장애가 발생할 경우: 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지하게 됨, undo 연산 필요 X
- 트랜잭션이 완료된 후에 장애가 발생한 경우: redo 연산
검사 시점 회복 기법
- 로그 기록을 이용하되, 일정 시간 간격으로 검사 시점(checkpoint)을 만듦
- 검사 시점이 되면 모든 로그 레코드를 로그 파일에 기록하고, 데이터 변경 내용을 데이터베이스에 반영한 후 검사 시점을 표시하는 로그 레코드를 로그 파일에 기록
- 장애 발생 시 가장 최근 검사 시점 이후의 트랜잭션에만 회복 작업 수행
- 회복 작업은 즉시 갱신 회복 기법이나 지연 갱신 회복 기법을 이용해 수행
- 로그 전체를 대상으로 회복 기법을 적용할 때 발생할 수 있는 비효율성의 문제를 해결 -> 시간 단축
미디어 회복 기법
- 디스크에 발생할 수 있는 장애에 대비한 회복 기법
- 덤프 이용: 디스크에 장애가 발생하면 가장 최근에 복사해 둔 덤프를 이용해 장애 발생 이전의 데이터베이스 상태로 복구하고 필요에 따라 redo 연산 수행
동시성 제어 (Concurrency Control)
병행 수행(concurrency)
- 여러 사용자가 데이터베이스를 동시 공유할 수 있도록 여러 개의 트랜잭션을 동시에 수행하는 것
- 여러 트랜잭션이 차례로 번갈아 수행되는 인터리빙(interleaving) 방식으로 진행됨
동시성 제어(concurrency control, 병행 제어)
- 병행 수행 시 같은 데이터에 접근하여 연산을 실행해도 문제가 발생하지 않고 정확한 수행 결과를 얻을 수 있도록 트랜잭션의 수행을 제어하는 것
병행 수행 시 발생할 수 있는 문제점
갱신 분실(lost update)
- 하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화되는 것
모순성(inconsistency)
- 하나의 트랜잭션이 여러 개 데이터 변경 연산을 실행할 때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산함으로써 모순된 결과가 발생하는 것
연쇄 복귀(cascading rollback)
- 트랜잭션이 완료되기 전 장애가 발생하여 rollback 연산을 수행하면, 장애 발생 전에 이 트랜잭션이 변경한 데이터를 가져가서 변경 연산을 실행한 다른 트랜잭션에도 rollback 연산을 연쇄적으로 실행해야 한다는 것
트랜잭션 스케줄
트랜잭션 스케줄
- 트랜잭션에 포함되어 있는 연산들을 수행하는 순서
직렬 스케줄(serial schedule)
- 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것
- 직렬 스케줄에 따라 트랜잭션이 수행되면, 다른 트랜잭션의 방해를 받지 않고 독립적으로 수행되므로 항상 모순이 없는 정확한 결과를 얻게 됨
- 각 트랜잭션을 독립적으로 수행하기 때문에 병행 수행으로 볼 수 없음
비직렬 스케줄(nonserial schedule)
- 인터리빙 방식을 이용하여 트랜잭션을 병행 수행하는 것
- 트랜잭션이 번갈아 연산을 실행하기 때문에 하나의 트랜잭션이 완료되기 전에 다른 트랜잭션의 연산이 실행될 수 있음
직렬 가능 스케줄(serializable schedule)
- 직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄
- 인터리빙 방식으로 병행 수행하면서도 정확한 결과를 얻을 수 있음
- 직렬 가능 스케줄인지 판단하는 것은 간단한 작업이 아니므로 직렬 가능성을 보장하는 병행 제어 기법을 사용하는 것이 일반적
동시성 제어 기법: 로킹(Locking) 기법
동시성 제어 기법(병행 제어 기법)
- 병행 수행하면서도 직렬 가능성을 보장하기 위한 기법
로킹(locking) 기법
- 한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 끝낼 때까지는 다른 트랜잭션이 그 데이터에 접근하지 못하도록 상호 배제(mutual exclusion)함
- 병행 수행되는 트랜잭션들이 같은 데이터에 동시에 접근하지 못하도록 lock과 unlock 연산을 이용해 제어
- lock : 트랜잭션이 데이터에 대한 독점권을 요청하는 연산
- unlock: 트랜잭션이 데이터에 대한 독점권을 반환하는 연산
- 기본 로킹 규약
- 트랜잭션은 데이터에 접근하기 위해 먼저 lock 연산을 실행해 독점권을 획득함
- 다른 트랜잭션에 의해 이미 lock 연산이 실행된 데이터에는 다시 lock 연산을 실행할 수 없음
- 독점권을 획득한 데이터에 대한 모든 연산의 수행이 끝나면 트랜잭션은 unlock 연산을 실행해서 독점권을 반납해야 함
- 로킹 단위: lock 연산을 실행하는 대상 데이터의 크기
- 전체 데이터베이스부터 릴레이션, 투플, 속성까지도 가능함
- 로킹 단위가 커질수록 병행성은 낮아지지만 제어가 쉬움 vice versa
기본 로킹 규약의 효율성을 높이기 위한 방법
- lock 연산을 두 가지 종류로 구분하여 트랜잭션들이 같은 데이터에 동시에 read 연산을 실행하는 것을 허용
- 공용(shared) lock: 트랜잭션이 데이터에 대해 공용 lock 연산을 실행하면, 해당 데이터에 read 연산을 실행할 수 있지만 write 연산은 실행할 수 없다. 그리고 해당 데이터에 다른 트랜잭션도 공용 lock 연산을 동시에 실행할 수 있다.
- 데이터에 대한 사용권을 여러 트랜잭션이 공유할 수 있음.
- 전용(exclusive) lock: 해당 데이터에 read 연산과 write 연산을 모두 실행할 수 있다. 그러나 해당 데이터에 다른 트랜잭션은 공용이든 전용이든 어떤 lock 연산도 실행할 수 없다.
- 전용 lock 연산을 실행한 트랜잭션만 해당 데이터에 대한 독점권을 가질 수 있음
2단계 로킹 규약(2PLP; 2 Phase Locking Protocol)
- 기본 로킹 규약의 문제를 해결하고 트랜잭션의 직렬 가능성을 보장하기 위해 lock과 unlock 연산의 수행 시점에 대한 새로운 규약을 추가한 것
- 트랜잭션이 lock과 unlock 연산을 확장 단계와 축소 단계로 나누어 실행
- 트랜잭션이 처음 수행되면 확장 단계로 들어가 lock 연산만 실행 가능
- unlock 연산을 실행하면 축소 단계로 들어가 unlock 연산만 실행 가능
- 트랜잭션은 첫 번째 unlock 연산 실행 전에 필요한 모든 lock 연산을 실행해야 함
- 확장 단계: 트랜잭션이 lock 연산만 실행할 수 있는 단계
- 축소 단계: 트랜잭션이 unlock 연산만 실행할 수 있는 단계
교착 상태(Deadlock)
- 트랜잭션들이 상대가 독점하고 있는 데이터에 unlock 연산이 실행되기를 서로 기다리면서 트랜잭션의 수행을 중단하고 있는 상태
'CS > 데이터베이스' 카테고리의 다른 글
11. 데이터베이스 응용 기술 (0) | 2023.12.20 |
---|---|
10. 보안과 권한 관리 (1) | 2023.12.19 |
8. 정규화 (0) | 2023.11.30 |
7. 데이터베이스 설계 (1) | 2023.11.27 |
6. SQL 기본 문법 (1) | 2023.11.18 |
트랜잭션
트랜잭션의 특성
트랜잭션 (Transaction)
- 논리적인 작업의 단위, 하나의 작업을 수행하는 데 필요한 DB 연산들을 모아 놓은 것
- 장애 발생 시 복구 작업이나 병행 제어 작업을 위한 중요한 단위로 사용
- 데이터베이스의 무결성과 일관성을 보장하기 위해 작업 수행에 필요한 연산들을 하나의 트랜잭션으로 제대로 정의하고 관리해야 함
트랜잭션의 특성 (ACID)
- 원자성 (Atomicity)
- 트랜잭션의 연산들이 모두 정상적으로 실행되거나 하나도 실행되지 않아야 하는 all-or-nothing 방식
- 트랜잭션 실행 도중 장애가 발생하면 지금까지 실행한 연산 처리를 모두 취소하고, DB를 트랜잭션 작업 전 상태로 되돌려야 함
- 👉 원자성의 보장을 위해 장애 발생 시 회복 기능 필요
- 일관성 (Consistency)
- 트랜잭션이 성공적으로 수행된 후에도 데이터베이스가 일관된 상태를 유지해야 함
- 모순된 데이터가 존재하면 안된다.
- 👉 일관성의 보장을 위해 동시성 제어 기능 필요
- 격리성 (Isolation)
- 수행 중인 트랜잭션이 완료될 때까지 다른 트랜잭션들이 중간 연산 결과에 접근할 수 없음
- 👉 격리성의 보장을 위해 동시성 제어 기능 필요
- 지속성 (Durability)
- 트랜잭션이 성공적으로 완료된 후 데이터베이스에 반영한 수행 결과는 영구적이어야 함
- 👉 지속성의 보장을 위해 장애 발생 시 회복 기능 필요
트랜잭션의 주요 연산
Commit 연산
- 트랜잭션의 수행이 성공적으로 완료되었음을 선언하는 연산
- commit 연산이 실행되면 트랜잭션의 수행 결과가 데이터베이스에 반영되고 일관된 상태를 지속적으로 유지하게 됨
Rollback 연산
- 트랜잭션의 수행이 실패했음을 선언하는 연산
- rollback 연산이 실행되면 트랜잭션이 지금까지 실행한 연산의 결과가 취소되고 데이터베이스가 트랜잭션 수행 전의 일관된 상태로 되돌아감
트랜잭션의 상태

활동(active) 상태
- 트랜잭션이 수행되기 시작하여 현재 수행 중인 상태
부분 완료(partially committed) 상태
- 트랜잭션의 마지막 연산이 실행을 끝낸 직후의 상태
완료(committed) 상태
- 트랜잭션이 성공적으로 완료되어 commit 연산을 실행한 상태
- 트랜잭션이 수행한 최종 결과를 데이터베이스에 반영하고, 데이터베이스가 새로운 일관된 상태가 되면서 트랜잭션이 종료됨
실패(failed) 상태
- 장애가 발생하여 트랜잭션의 수행이 중단된 상태
철회(aborted) 상태
- 트랜잭션의 수행 실패로 rollback 연산을 실행한 상태
- 지금까지 실행한 트랜잭션의 연산을 모두 취소하고 트랜잭션이 수행되기 전의 데이터베이스 상태로 되돌리면서 트랜잭션이 종료됨
- 철회 상태로 종료된 트랜잭션은 상황에 따라 다시 수행되거나 폐기됨
장애(Failure)와 회복(Recovery)
장애(Failure)의 유형
장애(Failure)
- 시스템이 제대로 동작하지 않는 상태
장애의 유형
- 트랜잭션 장애: 트랜잭션 수행 중 오류가 발생하여 정상적으로 수행을 계속할 수 없는 상태
- 시스템 장애: 하드웨어의 결함으로 정상적으로 수행을 계속할 수 없는 상태
- 미디어 장애: 디스크 장치의 결함으로 디스크에 저장된 DB의 일부 혹은 전체가 손상된 상태
데이터베이스를 저장하는 저장 장치의 종류
- 휘발성(volatile) 저장 장치: 장애가 발생하면 데이터가 손실 - 메인 메모리
- 비휘발성(nonvolatile) 저장 장치: 저장 장치 자체에 이상이 발생하지 않으면 장애가 발생해도 저장된 데이터가 손상되지 않음 - 디스크, 자기 테이프, CD/DVD
- 안정(stable) 저장 장치: 비휘발성 저장 장치를 이용해 데이터 복사본 여러 개를 만드는 방법으로, 어떤 장애가 발생해도 데이터가 손실되지 않고 데이터를 영구적으로 저장할 수 있음.
데이터 이동 연산
트랜잭션 수행을 위해 필요한 데이터 이동 연산
- input / output: 디스크와 메인 메모리 간의 데이터 이동 연산
- 일반적으로 데이터베이스는 비휘발성 저장 장치인 디스크에 상주
- 트랜잭션이 데이터베이스의 데이터를 처리하기 위해서는 데이터를 디스크에서 메인 메모리로 가져와 처리한 다음 그 결과를 디스크로 보내는 작업 필요
- read / write: 메인 메모리와 응용 프로그램 변수 간의 데이터 이동 연산
Input / Output 연산
- block 단위로 수행 - 디스크 블록(디스크에 있는 블록) / 버퍼 블록(메인 메모리에 있는 블록)
- input(x): 디스크 블록에 저장되어 있는 데이터 x를 메인 메모리 버퍼 블록으로 이동시키는 연산
- output(x): 메인 메모리 버퍼 블록에 있는 데이터 x를 디스크 블록으로 이동시키는 연산
Read / Write 연산
- read(x): 메인 메모리 버퍼 블록에 저장되어 있는 데이터 x를 프로그램의 변수로 읽어오는 연산
- write(x): 프로그램의 변수 값을 메인 메모리 버퍼 블록에 있는 데이터 x에 기록하는 연산
회복 (Recovery) 연산
회복 (Recovery)
- 장애가 발생했을 때 데이터베이스를 장애가 발생하기 전의 일관된 상태로 복구시키는 것
- 트랜잭션의 특성을 보장하고, 데이터베이스를 일관된 상태로 유지하기위해 필수적인 기능
- 회복 관리자(recovery manager)가 담당: 장애 탐지, 데이터 베이스 복구 기능 제공
회복을 위해 데이터베이스 복사본을 만드는 방법
- 덤프 (dump): 데이터베이스 전체를 다른 저장 장치에 주기적으로 복사하는 방법
- 로그 (log): 데이터베이스에서 변경 연산이 실행될 때마다 데이터를 변경하기 이전 값과 변경한 이후 값을 별도의 파일에 기록하는 방법
- 레코드 단위로 트랜잭션 수행과 함께 기록됨
회복을 위한 기본 연산
- redo (재실행): 가장 최근에 저장한 DB 복사본을 가져온 후 로그를 이용해 복사본이 만들어진 이후에 실행된 모든 변경 연산을 재실행하여 장애가 발생하기 직전의 DB 상태로 복구
- 전반적으로 손상된 경우에 주로 사용
- undo (취소): 로그를 이용해 지금까지 실행된 모든 변경 연산을 취소하여 DB를 원래 상태로 복구
- 변경 중이었거나 이미 변경된 내용만 신뢰성을 잃은 경우에 주로 사용
회복 기법
로그 회복 기법
- 즉시 갱신(immediate update) 회복 기법
- 트랜잭션 수행 중에 데이터 변경 연산의 결과를 데이터베이스에 즉시 반영
- 장애 발생에 대비하기 위해 데이터 변경에 대한 내용을 로그 파일에 기록: 로그 파일에 로그 레코드를 먼저 기록한 다음 DB에 변경 연산 반영
- 트랜잭션이 완료되기 전 장애가 발생한 경우: undo 연산
- 트랜잭션이 완료된 후 장애가 발생한 경우: redo 연산
- 지연 갱신(deferred update) 회복 기법
- 트랜잭션 수행 중에 데이터 변경 연산의 결과를 로그에만 기록해두고, 트랜잭션이 부분 완료된 후에 로그에 기록된 내용을 이용해 데이터베이스에 한번에 반영
- 트랜잭션 수행 중에 장애가 발생할 경우: 로그에 기록된 내용을 버리기만 하면 데이터베이스가 원래 상태를 그대로 유지하게 됨, undo 연산 필요 X
- 트랜잭션이 완료된 후에 장애가 발생한 경우: redo 연산
검사 시점 회복 기법
- 로그 기록을 이용하되, 일정 시간 간격으로 검사 시점(checkpoint)을 만듦
- 검사 시점이 되면 모든 로그 레코드를 로그 파일에 기록하고, 데이터 변경 내용을 데이터베이스에 반영한 후 검사 시점을 표시하는 로그 레코드를 로그 파일에 기록
- 장애 발생 시 가장 최근 검사 시점 이후의 트랜잭션에만 회복 작업 수행
- 회복 작업은 즉시 갱신 회복 기법이나 지연 갱신 회복 기법을 이용해 수행
- 로그 전체를 대상으로 회복 기법을 적용할 때 발생할 수 있는 비효율성의 문제를 해결 -> 시간 단축
미디어 회복 기법
- 디스크에 발생할 수 있는 장애에 대비한 회복 기법
- 덤프 이용: 디스크에 장애가 발생하면 가장 최근에 복사해 둔 덤프를 이용해 장애 발생 이전의 데이터베이스 상태로 복구하고 필요에 따라 redo 연산 수행
동시성 제어 (Concurrency Control)
병행 수행(concurrency)
- 여러 사용자가 데이터베이스를 동시 공유할 수 있도록 여러 개의 트랜잭션을 동시에 수행하는 것
- 여러 트랜잭션이 차례로 번갈아 수행되는 인터리빙(interleaving) 방식으로 진행됨
동시성 제어(concurrency control, 병행 제어)
- 병행 수행 시 같은 데이터에 접근하여 연산을 실행해도 문제가 발생하지 않고 정확한 수행 결과를 얻을 수 있도록 트랜잭션의 수행을 제어하는 것
병행 수행 시 발생할 수 있는 문제점
갱신 분실(lost update)
- 하나의 트랜잭션이 수행한 데이터 변경 연산의 결과를 다른 트랜잭션이 덮어써 변경 연산이 무효화되는 것
모순성(inconsistency)
- 하나의 트랜잭션이 여러 개 데이터 변경 연산을 실행할 때 일관성 없는 상태의 데이터베이스에서 데이터를 가져와 연산함으로써 모순된 결과가 발생하는 것
연쇄 복귀(cascading rollback)
- 트랜잭션이 완료되기 전 장애가 발생하여 rollback 연산을 수행하면, 장애 발생 전에 이 트랜잭션이 변경한 데이터를 가져가서 변경 연산을 실행한 다른 트랜잭션에도 rollback 연산을 연쇄적으로 실행해야 한다는 것
트랜잭션 스케줄
트랜잭션 스케줄
- 트랜잭션에 포함되어 있는 연산들을 수행하는 순서
직렬 스케줄(serial schedule)
- 인터리빙 방식을 이용하지 않고 각 트랜잭션별로 연산들을 순차적으로 실행시키는 것
- 직렬 스케줄에 따라 트랜잭션이 수행되면, 다른 트랜잭션의 방해를 받지 않고 독립적으로 수행되므로 항상 모순이 없는 정확한 결과를 얻게 됨
- 각 트랜잭션을 독립적으로 수행하기 때문에 병행 수행으로 볼 수 없음
비직렬 스케줄(nonserial schedule)
- 인터리빙 방식을 이용하여 트랜잭션을 병행 수행하는 것
- 트랜잭션이 번갈아 연산을 실행하기 때문에 하나의 트랜잭션이 완료되기 전에 다른 트랜잭션의 연산이 실행될 수 있음
직렬 가능 스케줄(serializable schedule)
- 직렬 스케줄에 따라 수행한 것과 같이 정확한 결과를 생성하는 비직렬 스케줄
- 인터리빙 방식으로 병행 수행하면서도 정확한 결과를 얻을 수 있음
- 직렬 가능 스케줄인지 판단하는 것은 간단한 작업이 아니므로 직렬 가능성을 보장하는 병행 제어 기법을 사용하는 것이 일반적
동시성 제어 기법: 로킹(Locking) 기법
동시성 제어 기법(병행 제어 기법)
- 병행 수행하면서도 직렬 가능성을 보장하기 위한 기법
로킹(locking) 기법
- 한 트랜잭션이 먼저 접근한 데이터에 대한 연산을 끝낼 때까지는 다른 트랜잭션이 그 데이터에 접근하지 못하도록 상호 배제(mutual exclusion)함
- 병행 수행되는 트랜잭션들이 같은 데이터에 동시에 접근하지 못하도록 lock과 unlock 연산을 이용해 제어
- lock : 트랜잭션이 데이터에 대한 독점권을 요청하는 연산
- unlock: 트랜잭션이 데이터에 대한 독점권을 반환하는 연산
- 기본 로킹 규약
- 트랜잭션은 데이터에 접근하기 위해 먼저 lock 연산을 실행해 독점권을 획득함
- 다른 트랜잭션에 의해 이미 lock 연산이 실행된 데이터에는 다시 lock 연산을 실행할 수 없음
- 독점권을 획득한 데이터에 대한 모든 연산의 수행이 끝나면 트랜잭션은 unlock 연산을 실행해서 독점권을 반납해야 함
- 로킹 단위: lock 연산을 실행하는 대상 데이터의 크기
- 전체 데이터베이스부터 릴레이션, 투플, 속성까지도 가능함
- 로킹 단위가 커질수록 병행성은 낮아지지만 제어가 쉬움 vice versa
기본 로킹 규약의 효율성을 높이기 위한 방법
- lock 연산을 두 가지 종류로 구분하여 트랜잭션들이 같은 데이터에 동시에 read 연산을 실행하는 것을 허용
- 공용(shared) lock: 트랜잭션이 데이터에 대해 공용 lock 연산을 실행하면, 해당 데이터에 read 연산을 실행할 수 있지만 write 연산은 실행할 수 없다. 그리고 해당 데이터에 다른 트랜잭션도 공용 lock 연산을 동시에 실행할 수 있다.
- 데이터에 대한 사용권을 여러 트랜잭션이 공유할 수 있음.
- 전용(exclusive) lock: 해당 데이터에 read 연산과 write 연산을 모두 실행할 수 있다. 그러나 해당 데이터에 다른 트랜잭션은 공용이든 전용이든 어떤 lock 연산도 실행할 수 없다.
- 전용 lock 연산을 실행한 트랜잭션만 해당 데이터에 대한 독점권을 가질 수 있음
2단계 로킹 규약(2PLP; 2 Phase Locking Protocol)
- 기본 로킹 규약의 문제를 해결하고 트랜잭션의 직렬 가능성을 보장하기 위해 lock과 unlock 연산의 수행 시점에 대한 새로운 규약을 추가한 것
- 트랜잭션이 lock과 unlock 연산을 확장 단계와 축소 단계로 나누어 실행
- 트랜잭션이 처음 수행되면 확장 단계로 들어가 lock 연산만 실행 가능
- unlock 연산을 실행하면 축소 단계로 들어가 unlock 연산만 실행 가능
- 트랜잭션은 첫 번째 unlock 연산 실행 전에 필요한 모든 lock 연산을 실행해야 함
- 확장 단계: 트랜잭션이 lock 연산만 실행할 수 있는 단계
- 축소 단계: 트랜잭션이 unlock 연산만 실행할 수 있는 단계
교착 상태(Deadlock)
- 트랜잭션들이 상대가 독점하고 있는 데이터에 unlock 연산이 실행되기를 서로 기다리면서 트랜잭션의 수행을 중단하고 있는 상태
'CS > 데이터베이스' 카테고리의 다른 글
11. 데이터베이스 응용 기술 (0) | 2023.12.20 |
---|---|
10. 보안과 권한 관리 (1) | 2023.12.19 |
8. 정규화 (0) | 2023.11.30 |
7. 데이터베이스 설계 (1) | 2023.11.27 |
6. SQL 기본 문법 (1) | 2023.11.18 |