Chapter1 논리 데이터 저장소 확인
1. 데이터모델 이란
현실 세계의 정보를 인간과 컴퓨터가 이해할수 있도록 추상화 하여 포현한 모델
2. 데이터모델 절차
절차 | 설명 |
개념적 설계 | 현실세계에 대한 인식을 추상적, 개념적으로 표현 / 트랜잭션모델링, View통합방법 Attribute 합성 고려 |
논리적 설계 | 목표 DBMS에 맞는 스키마 설계, 개체관계 다이어그램이 있다. |
물리적 설계 | 물리적 스키마 설계, 성능 측면에서 반정규화를 실행한다. |
3. 논리적 데이터 모델링의 종류
종류 | 설명 |
관계 데이터 모델 | 테이블 형태, 1:1, 1:N, N:M |
계층 데이터 모델 | 트리형태, 1:N |
네트워크 데이터 모델 | 그래프형태, N:M |
4. 관계대수 연산자 종류
-일반집합 연산자(합.교.차.카)
합집합,교집합,차집합,카티션프로덕트
- 순수관계 연산자(셀.프.조.디)
셀렉트,프로젝트,조인,디비전
5. 관계해석
튜플 관계해석과 도메인 해석을 하는 비절차적 언어
5-1 관계데이터 모델의 구성
테이블명(학생) = 릴레이션
학번 | 이름 | 학년 | 학과 |
20221 | 일수은 | 1 | 컴공 |
20222 | 이수은 | 2 | 화공 |
20223 | 삼수은 | 3 |
카디널리티 = 튜플의 갯수 = 3개 (행갯수)
속성의 갯수 = 4개 (열 갯수)
스키마 : DB 구조, 제약조건등의 정보를 가지고 있다.
인스턴스 : 정의된 스키마에 따라 생성된 테이블에 저장된 데이터 집합
6. 개체관계 모델 (E-R)
데이터와 그들간의 관계를 사람이 이해할 수 있는 형태로 표현한 모델
7. 정규화(원.부.이.결.다.조)
단계 | 조건 |
1정규형 | 원자값으로 구성 |
2정규형 | 부분 함수 종속 제거 |
3정규형 | 이행 함수 종속 제거 |
보이스코드(BCNF) | 결정자 후보 키가 아닌 함수 종속 제거 |
4정규형 | 다치 종속 제거 |
5정규형 | 조인 종속 제거 |
8. 이상현상(Anormaly)의 종류 (삽,삭,갱)
종류 | 설명 |
삽입이상 | 불필요한 세부정보 입력하는 경우 |
삭제이상 | 원치 않는 다른 정보가 같이 삭제되는 경우 |
갱신이상 | 특정부분만 수정되어 중복된값이 모순을 일으키는 경우 |
8. 반정규화
장점 : 성능 향상과 관리의 효율성이 증가
단점 : 데이터의 일관성 및 정확성 저하, 유지비용이 별도 발생
9. 반정규화 기법
구분 | 설명 |
테이블 | 테이블병합, 테이블 분할, 중복 테이블 추가 |
컬럼 | 컬럼 중복화 |
관계 | 중복관계 추가 |
Chapter2 물리 데이터 저장소 설계
1. 물리데이터 모델링 개념
논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정
2. 참조무결성 제약조건
릴레이션과 릴레이션 사이의 참조 일관성을 보장하기 위한 조건
용어 | 설명 |
제한(Restircted) | 참조 무결성을 위배하는 연산 거절 |
연쇄(Cascade) | 참조되는 릴레이션에서 튜플 삭제 후, 이 튜플을 참조하는 다른 릴레이션의 튜플도 삭제 |
널 값(Nullify) | 참조 되는 릴레이션에서 튜플 삭제 후, 이 튜플을 참조하는 다른 릴레이션의 튜플을 Null 처리 |
3. 참조무결성 제약조건 SQL문법 (삭제)
Alter table '테이블명' add foregin key (외래키) references 참조테이블(기본키) on delete [restrict || cascade || set null ]
4. Index란
검색 연상의 최적화를 위해 키값과 포인터의 쌍으로 구성되는 데이터 구조
5. View란
사용자에게 허용된 정보만 보여주기 위해 하나 이상의 테이블로부터 유도된 논리적인 가상 테이블
6. Cluster
데이터 접근 효율을 높이기 위해 동일한 성격의 데이터를 같은 데이터 블록에 저장하는 방법
장점 : 조회속도 향상
단점 : 삽입,삭제,갱식 속도 저하
7. 파티셔닝 (대용량의 테이블을 작은 논리적인 단위인 파티션으로 나눈것) 의 종류
종류 | 설명 |
레인지(Range) 파티셔닝 | 연속되는 숫자나 날짜 기준으로 파티셔닝 |
해시(Hash) 파티셔닝 | 파티션 키의 해시 함수값 활용 |
리스트(List) 파티셔닝 | 데이터에 대한 명시적 제어가 가능한 파티셔닝 |
컴포지트(Composite) 파티셔닝 | 범위분할 후 해시 함수를 사용 |
8.PL/SQL
표준 SQL 기반으로 Oracle에서 개발한 데이터 조작 언어
9. APM
안정적인 시스템 운영을 위한 성능 모니터링 도구
10. Optimizer
SQL을 가장빠르고 효율적으로 수행할 수 있는 최적의 경로
11. 옵티마이저 종류
RBO : 규칙 기반 옵티마이저 - 사전 등록 규첵에 따라 실행
CBO : 비용 기반 옵티마이저 - 모든 접근 경로를 고려한다.
Chapter3 데이터베이스 특징
1. DBMS
데이터 관리의 복장성을 해결하는 동시에 추가,변경,검색,삭제,백업,복구 등의 기능을 지원하느 SW
2. 데이터베이스의 특성
실시간접근성, 계속적인 변화, 동시공용, 내용참조
3. 데이터베이스의 종류
종류 | 설명 |
파일시스템 | 데이터베이스 전 단계의 데이터관리 방식 |
관계형데이터베이스(RDBMS) | 관계형 모델 기반, Oracle, Mysql, MairaDB 등 |
계층형데이터베이스(HDBMS) | 데이터를 상하종속적인 관계로 계층화 하여 관리 IMS, System2000 |
네트워크 데이터베이스 (NDBMS) | 데이터를 네트워크상의 망 형태로 표현한 데이터 모델 IDS, IDMS 등 |
4. DMBS의 유형
유형 | 설명 |
Key-Value | Unique 한 키에 하나의 값을 가지고 있는 형태 |
Column Family Data Store | Key안에 (Column,Value) 조합으로 된 여러개의 필드를 간는 DBMS |
Document Store | Value의 데이터 타입이 문서 타입을 사용하는 DBMS |
Graph | 시맨틱웹과 온톨로지 분야세서 활용되는 그래프로 데이터를 표현한 DBMS |
5. DBMS의 특징
무결성, 일관성, 회복성, 보안성, 효율성
6. Big Data
특성 : 데이터의 양, 데이터으 다양성, 데이터의 속도 중요
7. Big Data의 저장 처리 기술
종류 | 설명 |
비정형/반정형 데이터수집 | 내/외부 정제되지 않은 데이터를 확보하여 수집 및 전송하는 기술 |
정형 데이터 수집 | 내/외부 정제된 대용량 데이터의 수집 및 전송 기술 |
분산데이터 저장/처리 | 대용량 파일의 효과적인 분산 저장 및 처리 기술 |
HDFS | 대용량 데이터의 집합을 처리하는 으용 프로그램에 적합하도록 설계된 Hadoop 분산 파일 시스템 |
8. NoSQL
데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산 사용할수 없으며 수평적으로 확장가능 DBMS
9.데이터 마이닝
대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적인 규칙이나 패턴을 찾아 내는 기술
10. 데이터 마이닝 절차
목적 설정 / 데이터 준비 / 가공 / 마이닝 기법 적용 / 정보 검증
11. 데이터마이닝 기법
규칙 | 설명 |
분류규칙 | 과거 데이터를 토대로 새로운 레코드 결과 값을 예측하는 기법 |
연과 규칙 | 데이터 안에 항목들 간의 종속관계를 찾아내는 기법 |
연속 규칙 | 연관 규칙에 시간 관련 정보가 포함된 형태의 기법 |
데이터 군집화 | 대상 레코드들을 유사한 특성을 지닌 몇개의 소그룹으로 분할하는 작업 |
'공부중인것' 카테고리의 다른 글
정보처리기사 실기(7과목 SQL응용) (0) | 2022.06.16 |
---|---|
정보처리기사 실기 (5과목 인터페이스 구현) (0) | 2022.06.16 |
정보처리기사 실기 (4과목 통합 구현) (0) | 2022.06.16 |
정보처리기사 실기 (2과목 화면설계) (0) | 2022.06.15 |
정보처리기사 실기 준비 1과목(소프트웨어 개발 방법론) (0) | 2022.06.14 |