-
1과목 데이터 모델링의 이해SQLD 2024. 5. 10. 19:21
⬛ 제 1장 데이터 모델링의 이해
🌓 데이터 모델링의 특징
추상화 현실세계를 일정한 형식에 맞추어 표현하는 추상화의 의미 단순화 복잡한 현실을 제한된 언어나 표기법을 통해 이해하기 쉽게 하는 단순화의 의미를 가지고 있음 명확화 애매모호함을 배제하고 누구나 이해가 가능하도록 정확하게 현상을 기술하는 정확화(=명확화) 🌓 데이터 모델링이란?
- 정보시스템을 구축하기 위한 데이터 관점업무 분석기법
- 현실세계의 데이터에 대해 약속된 표기법에 의해 표현하는 과정
- 데이터베이스를 구축하기 위한 분석,설계의 과정
🌓 데이터 모델링을 할 때 유의할 점 ( 중복, 비유연성, 비일관성 )
- 여러 장소의 데이터베이스에 같은 정보를 저장하지 않도록 하여 중복성을 최소화한다. (중복)
- 데이터의 정의를 데이터의 사용 프로세스와 분리하여 유연성을 높여 작은 변화가 중대한 변화를 일으킬 수 있는 가능성을 줄인다. (비유연성)
- 데이터간의 상호 연관관계를 명확하게 정의하여 일관성 있게 데이터가 유지되도록 한다.(비일관성)
🌓 데이터 모델링의 3단계 진행
개념적 데이터 모델링 추상화 수준이 높고 업무 중심적이고 포괄적인 수준의 모델링 진행, 전사적 데이터 모델링, EA 수립 시 많이 이용 논리적 데이터 모델링 시스템으로 구축하고자 하는 업무에 대해 Key, 속성, 관계 등을 정확하게 표현, 재사용성이 높음 물리적 데이터 모델링 실제로 데이터베이스에 이식할 수 있도록 성능, 저장 등 물리적인 성격을 고려하여 설계 🌓 데이터 독립성 요소
외부 스키마 - 뷰 단계 여러 개의 사용자 관점으로 구성, 즉 개개 사용자 단계로서 개개 사용자가 보는 개인적 DB스키마
- DB의 개개 사용자나 응용 프로그래머가 접근하는 DB 정의사용자 관점 접근하는 특성에 따른 스키마 구성 개념 스키마 - 개념 단계 하나의 개념적 스키마로 구성, 모든 사용자 관점을 통합한 조직 전체 관점의 통합적 표현
- 모든 응용 시스템이나 사용자들이 필요로 하는 데이터를 통합한 조직 전체의 DB를 기술한 것. DB에 저장되는 데이터와 그들 간의 관계를 표현하는 스키마통합 관점 내부 스키마 - 내부 단계와 내부 스키마로 구성됨. DB가 물리적으로 저장된 형식
- 물리적 장치에서 데이터가 실제적으로 저장되는 방법을 표현하는 스키마물리적 저장구조 🌓 ERD
1. ERD를 작성하는 작업순서
엔터티 그린다( = 엔터티 도출 ) → 엔터티 배치 → 관계 설정 → 관계명 기술 → 관계의 참여도 기술 → 관계의 필수여부 기술
( * 가장 중요한 엔터티는 왼쪽 상단에 배치하고, 이것을 중심으로 다른 엔터티를 나열하여 전개한다 )
2. 1976년 피터첸에 의해 Entity-Relationship Model(E-R Model)이라는 표기법이 만들어졌다.
3. 관계의 명칭은 관계 표현에 있어서 매우 중요한 부분에 해당한다.
❓ 엔터티
- 반드시 해당 업무에서 필요하고 관리하고자 하는 정보이어야 한다. (ex) 환자, 토익의 응시횟수,…)
- 유일한 식별자에 의해 식별이 가능해야 한다.
- 영속적으로 존재하는 인스턴스의 집합이어야 한다. ( 한개가 아니라 두개이상 )
- 엔터티는 업무 프로세스에 의해 이용되어야 한다.
- 엔터티는 반드시 속성이 있어야 한다.
- 엔터티는 다른 엔터티와 최소 한 개 이상의 관계가 있어야 한다.
🌓 엔터티의 분류
발생시점에 따라
기본 엔터티 다른 엔터티로부터 주식별자를 상속받지않고 자신의 고유한 주식별자를 가짐 ex) 사원, 부서, 고객, 상품, 자재 중심 엔터티 데이터 양이 많이 발생되고 다른 엔터티와의 관계를 통해 많은 행위엔터티 생성 행위 엔터티 두개 이상의 부모 엔터티로부터 발생, 자주 내용이 바뀌거나 데이터 양이 증가한다. 🌓 엔터티의 명명
- 가능하면 현업업무에서 사용하는 용어를 사용한다
- 가능하면 약어를 사용하지 않는다
- 단수 명사를 사용한다
- 모든 엔터티에서 유일하게 이름이 부여되어야 한다
- 엔터티 생성 의미대로 의미를 부여한다
❓ 속성
⇒ 업무에서 필요로 하는 인스턴스에서 관리하고자 하는 의미상 더 이상 분리되지 않는 최소의 데이터 단위
- 반드시 해당 업무에서 필요하고 관리하고자 하는 정보여야 한다. (ex) 강사의 교재이름)
- 엔터티에 대한 자세하고 구체적인 정보를 나타냄, 속성도 집합임
🌓 엔터티, 인스턴스, 속성, 속성값의 관계
- 한 개의 엔터티는 두 개 이상의 인스턴스의 집합이어야 한다.
- 한 개의 엔터티는 두 개 이상의 속성을 갖는다.
- 한 개의 속성은 한 개의 속성값을 갖는다.
🌓 속성의 특성에 따른 분류
기본속성설계속성파생속성
기본속성 업무분석을 통해 바로 정의한 속성
ex) 이름, ID, 전화번호설계속성 업무상 필요한 데이터외에 데이터 모델링을 위해 업무를 규칙화하기 위해 속성을 새로 만들거나 변형하여 정의
ex) 상품코드, 지점코드파생속성 다른 속성에 영향을 받아 발생하는 속성,
데이터를 조회할 때 빠른 성능을 낼 수 있도록 원래 속성의 값을 계산하여 저장할 수 있도록 만든 속성
ex) 합계, 평균예를들어…
🫵🏻 우리은행은 예금분류(일반예금, 특별예금 등)의 원금, 예치기간, 이자율을 관리할 필요가 있다. 또한 원금에 대한 이자율을 적용하여 계산된 이자에 대해서도 속성으로 관리하고자 한다. 예를 들어 원금이 1000원이고 예치기간이 5개월이며 이자율이 5.0%라는 속성을 관리하고 계산된 이자도 관리한다. 일반예금이나 특별예금 등에 대해서는 코드를 부여(예. 01-일반예금, 02-특별예금 등)하여 관리한다.
일반예금은 코드 엔터티를 별도로 구분하고 값에는 코드값만 포함한다. 원금, 예치기간, 이자율은 기본 속성이다. 이자는 파생 속성이다. 예금분류는 설계 속성이다.
🌓 속성의 명명
- 해당업무에서 사용하는 이름을 부여한다.
- 서술식 속성명은 사용하지 않는다.
- 약어 사용은 가급적 제한한다.
- 전체 데이터 모델에서 유일성을 확보하는 것이 좋다.
❓ 도메인
🫵🏻 각 속성은 가질 수 있는 값의 범위가 있는데 이를 그 속성의 도메인(Domain)이라하며, 엔터티 내에서 속성에 대한 데이터타입과 크기 그리고 제약사항을 지정하는 것이다.
❓ 관계
🫵🏻 인스턴스 사이의 논리적인 연관성으로서 존재 또는 행위로서 서로에게 연관성이 부여된 상태
- UML(Unified Modeling Language)에는 클래스다이어그램의 관계 중 연관관계와 의존관계가 있다. 이 둘의 차이는 연관관계는 항상 이용하는 관계로 존재적 관계에 해당하고, 의존관계는 상대방 클래스의 행위에 의해 관계가 형성될 때 구분하여 표현한다. 이것은 실선과 점선의 표기법으로 다르게 표현이 된다. ( 연관관계는 실선(→)으로 표현, 의존관계는 점선으로 표현) ⇒ 존재와 행위 구분함
- ERD에서는 존재와 행위를 구분하지 않고 단일화된 표기법을 사용한다. ⇒ 존재와 행위 구분안함
존재에 의한 관계 - ex) 부서와 사원과의 관계
행위에 의한 관계 - ex) 고객과 주문에 의한 관계
🌓 관계의 표기법
관계명 관계의 이름 관계차수 1:1, 1:M, M:N 관계선택사양 필수관계, 선택관계 🌓 관계 체크사항
- 두 개의 엔터티 사이에 관심있는 연관규칙이 존재하는가?
- 두 개의 엔터티 사이에 정보의 조합이 발생하는가?
- 업무기술서, 장표에 관계연결을 가능하게 하는 동사가 있는가?
- 업무기술서, 장표에 관계연결에 대한 규칙이 서술되어 있는가?
❓ 식별자
🫵🏻 엔터티는 인스턴스들의 집합이라고 하였다. 여러 개의 집합체를 담고 있는 하나의 통에서 각각을 구분할 수 있는 논리적인 이름이 있어야 한다. 이 구분자를 식별자라고 한다.
🌓 식별자의 특징
유일성 주식별자에 의해 엔터티 내에 모든 인스턴스들이 유일하게 구분되어야 한다.
최소성 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 한다. 불변성 지정된 주식별자의 값은 자주 변하지 않는 것이어야 한다. 존재성 주식별자가 지정이 되면 반드시 값이 들어와야 한다. 🌓 주식별자 도출 기준
- 해당 업무에서 자주 이용되는 속성을 주식별자로 지정
- 명칭, 내역 등과 같이 이름으로 기술되는 것들은 가능하면 주식별자로 지정하지 않는다.
- 복합으로 주식별자로 구성할 경우 너무 많은 속성이 포함되지 않도록 한다.
🌓 식별자의 분류체계
대표성 여부 주식별자 엔터티 내에서 각 어커런스를 구분할 수 있는 구분자이며, 타 엔터티와 참조관계를 연결할 수 있는 식별자
대표성 여부 주식별자 엔터티 내에서 각 어커런스를 구분할 수 있는 구분자이며, 타 엔터티와 참조관계를 연결할 수 있는 식별자 보조식별자 엔터티 내에서 각 어커런스를 구분할 수 있는 구분자이나 대표성을 가지지 못해 참조관계연결을 못함 스스로 생성 여부 내부식별자 엔터티 내부에서 스스로 만들어지는 식별자 외부식별자 타 엔터티와의 관계를 통해 타 엔터티로부터 받아오는 식별자 속성 수 단일식별자 하나의 속성으로 구성된 식별자 복합식별자 둘 이상의 속성으로 구성된 식별자 대체 여부 본질식별자 업무에 의해 만들어지는 식별자 인조식별자 업무적으로 만들어지지는 않지만 원조식별자가 복잡한 구성을 갖고 있기 때문에 인위적으로 만든 식별자 ❗어커런스란? 엔티티의 인스턴스의 각각의 데이터를 말함
🌓 식별자와 비식별자관계 비교
항목 식별자관계 비식별자관계 목적 강한 연결관계 표현 약한 연결관계 표현 자식 주식별자 영향 자식 주식별자의 구성에 포함됨 자식 일반 속성에 포함됨 표기법 실선 표현 점선 표현 연결 고려사항 - 반드시 부모엔터티 종속
- 자식 주식별자구성에 부모 주식별자포함 필요
- 상속받은 주식별자속성을 타 엔터티에 이전 필요- 약한 종속관계
- 자식 주식별자구성을 독립적으로 구성
- 자식 주식별자구성에 부모 주식별자 부분 필요
- 상속받은 주식별자속성을 타 엔터티에 차단 필요
- 부모쪽의 관계참여가 선택관계