본문 바로가기

공부중인것

정보처리기사 실기 (3과목 데이터 입출력 구현)

Chapter1 논리 데이터 저장소 확인

 

1. 데이터모델 이란

현실 세계의 정보를 인간과 컴퓨터가 이해할수 있도록 추상화 하여 포현한 모델

 

2. 데이터모델 절차

절차 설명
개념적 설계 현실세계에 대한 인식을 추상적, 개념적으로 표현 / 트랜잭션모델링, View통합방법 Attribute 합성 고려
논리적 설계 목표 DBMS에 맞는 스키마 설계, 개체관계 다이어그램이 있다.
물리적 설계 물리적 스키마 설계, 성능 측면에서 반정규화를 실행한다.

 

3. 논리적 데이터 모델링의 종류

종류 설명
관계 데이터 모델 테이블 형태, 1:1, 1:N, N:M
계층 데이터 모델 트리형태, 1:N
네트워크 데이터 모델 그래프형태, N:M

 

4. 관계대수 연산자 종류

-일반집합 연산자(합.교.차.카)

  합집합,교집합,차집합,카티션프로덕트

 

- 순수관계 연산자(셀.프.조.디)

 셀렉트,프로젝트,조인,디비전

 

5. 관계해석

튜플 관계해석과 도메인 해석을 하는 비절차적 언어

 

5-1 관계데이터 모델의 구성

테이블명(학생) = 릴레이션

학번 이름 학년 학과
20221 일수은 1 컴공
20222 이수은 2 화공
20223 삼수은 3  

카디널리티 = 튜플의 갯수 = 3개 (행갯수)

속성의 갯수 = 4개 (열 갯수)

스키마 : DB 구조, 제약조건등의 정보를 가지고 있다.

인스턴스 : 정의된 스키마에 따라 생성된 테이블에 저장된 데이터 집합

 

 

 

6. 개체관계 모델 (E-R)

데이터와 그들간의 관계를 사람이 이해할 수 있는 형태로 표현한 모델

 

7. 정규화(원.부.이.결.다.조)

단계 조건
1정규형 원자값으로 구성
2정규형 부분 함수 종속 제거 
3정규형 이행 함수 종속 제거
보이스코드(BCNF) 결정자 후보 키가 아닌 함수 종속 제거
4정규형 다치 종속 제거
5정규형 조인 종속 제거

 

8. 이상현상(Anormaly)의 종류 (삽,삭,갱)

종류 설명
삽입이상 불필요한 세부정보 입력하는 경우
삭제이상 원치 않는 다른 정보가 같이 삭제되는 경우
갱신이상 특정부분만 수정되어 중복된값이 모순을 일으키는 경우

 

8. 반정규화

장점 : 성능 향상과 관리의 효율성이 증가

단점 : 데이터의 일관성 및 정확성 저하, 유지비용이 별도 발생

 

9. 반정규화 기법

구분 설명
테이블 테이블병합, 테이블 분할, 중복 테이블 추가
컬럼 컬럼 중복화
관계 중복관계 추가

 

Chapter2 물리 데이터 저장소 설계

1. 물리데이터 모델링 개념

논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정

 

2. 참조무결성 제약조건

릴레이션과 릴레이션 사이의 참조 일관성을 보장하기 위한 조건

용어 설명
제한(Restircted) 참조 무결성을 위배하는 연산 거절
연쇄(Cascade) 참조되는 릴레이션에서 튜플 삭제 후, 이 튜플을 참조하는 다른 릴레이션의 튜플도 삭제
널 값(Nullify) 참조 되는 릴레이션에서 튜플 삭제 후, 이 튜플을 참조하는 다른 릴레이션의 튜플을 Null 처리

 

3. 참조무결성 제약조건 SQL문법 (삭제)

Alter table '테이블명' add foregin key (외래키) references 참조테이블(기본키) on delete [restrict || cascade || set null ]

 

4. Index란

검색 연상의 최적화를 위해 키값과 포인터의 쌍으로 구성되는 데이터 구조

 

5. View란

사용자에게 허용된 정보만 보여주기 위해 하나 이상의 테이블로부터 유도된 논리적인 가상 테이블

 

6. Cluster

데이터 접근 효율을 높이기 위해 동일한 성격의 데이터를 같은 데이터 블록에 저장하는 방법

장점 : 조회속도 향상 

단점 : 삽입,삭제,갱식 속도 저하

 

7. 파티셔닝 (대용량의 테이블을 작은 논리적인 단위인 파티션으로 나눈것) 의 종류

종류 설명
레인지(Range) 파티셔닝 연속되는 숫자나 날짜 기준으로 파티셔닝
해시(Hash) 파티셔닝 파티션 키의 해시 함수값 활용
리스트(List) 파티셔닝 데이터에 대한 명시적 제어가 가능한 파티셔닝
컴포지트(Composite) 파티셔닝 범위분할 후 해시 함수를 사용

 

8.PL/SQL

표준 SQL 기반으로 Oracle에서 개발한 데이터 조작 언어

 

9. APM

안정적인 시스템 운영을 위한 성능 모니터링 도구

 

10. Optimizer

SQL을 가장빠르고 효율적으로 수행할 수 있는 최적의 경로

 

11. 옵티마이저 종류

RBO : 규칙 기반 옵티마이저 - 사전 등록 규첵에 따라 실행

CBO : 비용 기반 옵티마이저 - 모든 접근 경로를 고려한다.

 

 

Chapter3 데이터베이스 특징

 

1. DBMS

데이터 관리의 복장성을 해결하는 동시에 추가,변경,검색,삭제,백업,복구 등의 기능을 지원하느 SW

 

2. 데이터베이스의 특성

실시간접근성, 계속적인 변화, 동시공용, 내용참조

 

3. 데이터베이스의 종류

종류 설명
파일시스템 데이터베이스 전 단계의 데이터관리 방식
관계형데이터베이스(RDBMS) 관계형 모델 기반, Oracle, Mysql, MairaDB 등
계층형데이터베이스(HDBMS) 데이터를 상하종속적인 관계로 계층화 하여 관리
IMS, System2000
네트워크 데이터베이스 (NDBMS) 데이터를 네트워크상의 망 형태로 표현한 데이터 모델
IDS, IDMS 등

 

4. DMBS의 유형

유형 설명
Key-Value  Unique 한 키에 하나의 값을 가지고 있는 형태
Column Family Data Store Key안에 (Column,Value) 조합으로 된 여러개의 필드를 간는 DBMS
Document Store Value의 데이터 타입이 문서 타입을 사용하는 DBMS
Graph 시맨틱웹과 온톨로지 분야세서 활용되는 그래프로 데이터를 표현한 DBMS

 

5. DBMS의 특징

무결성, 일관성, 회복성, 보안성, 효율성

 

6. Big Data

특성 : 데이터의 양, 데이터으 다양성, 데이터의 속도 중요

 

7. Big Data의 저장 처리 기술

종류 설명
비정형/반정형 데이터수집 내/외부 정제되지 않은 데이터를 확보하여 수집 및 전송하는 기술
정형 데이터 수집 내/외부 정제된 대용량 데이터의 수집 및 전송 기술
분산데이터 저장/처리 대용량 파일의 효과적인 분산 저장 및 처리 기술
HDFS 대용량 데이터의 집합을 처리하는 으용 프로그램에 적합하도록 설계된 Hadoop 분산 파일 시스템

 

8. NoSQL 

데이터 저장에 고정된 테이블 스키마가 필요하지 않고 조인 연산 사용할수 없으며 수평적으로 확장가능 DBMS

 

9.데이터 마이닝

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적인 규칙이나 패턴을 찾아 내는 기술

 

10. 데이터 마이닝 절차

목적 설정 / 데이터 준비 / 가공 / 마이닝 기법 적용 / 정보 검증

 

11. 데이터마이닝 기법

규칙 설명
분류규칙 과거 데이터를 토대로 새로운 레코드 결과 값을 예측하는 기법
연과 규칙 데이터 안에 항목들 간의 종속관계를 찾아내는 기법
연속 규칙 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
데이터 군집화 대상 레코드들을 유사한 특성을 지닌 몇개의 소그룹으로 분할하는 작업