본문 바로가기
IT/정보처리기사

정보처리기사 3단원(데이터 입출력 구현) 요약

by 낭만파 2021. 6. 29.
반응형
기출문제가 출제된 부분은 배경색으로 표시해 두었습니다

목차

1. 논리 데이터 저장소 확인
2. 물리 데이터 저장소 설계
3. 데이터베이스 기초 활용하기

 

논리 데이터 저장소 확인


데이터 모델(Data Model)

현실 세계의 정보를 인간과 컴퓨터가 이해할 수 있도록 추상화하여 표현한 모델

 

데이터 모델 절차

용어 설명
개념적 데이터 모델 현실 세계에 대한 인식을 추상적, 개념적으로 표현 (개체관계 다이어그램, ERD)
논리적 데이터 모델 업무 모습을 모델링 표기법으로 형상화하여, 사람이 이해하기 쉽게 표현 (정규화)
물리적 데이터 모델 논리 데이터 모델을 DBMS의 특성 및 성능을 고려해 물리적 스키마를 만듦

 

개체-관계(E-R) 모델 (개념적 데이터 모델)

현실 세계에 존재하는 데이터와 그들 간의 관계를 사람이 이해할 수 있는 형태로 명확하게 표현

구성 기호
개체 □ (사각형)
관계 ◇ (마름모)
속성 ○ (타원)
다중 값 속성 ◎ (이중 타원)
관계-속성 연결 ㅡ (선)

 

논리 데이터 모델

개념 모델로부터 업무 영역의 업무 데이터 및 규칙을 구체적으로 표현

개체(Entity, 사각형, 표), 속성(Attribute, 타원, 표 내부), 관계(Relationship, 마름모, 선)로 구성

종류 설명
관계 데이터 모델 2차원 테이블로 구성
계층 데이터 모델 트리 형태로 구성
네트워크 데이터 모델 그래프 형태로 구성

관계 데이터 모델 (논리 데이터 모델)

관계 데이터 모델의 구성

용어 설명
릴레이션 행(Row)과 열(Column)으로 구성된 테이블
튜플(Tuple) 릴레이션의 행(Row)
속성(Attribute) 릴레이션의 열(Column)
카디널리티(Cardinality) 튜플(Row)의 개수
차수(Degree) 속성(Column)의 개수
스키마(Schema) 데이터베이스의 구조, 제약조건 등의 정보를 담고 있는 기본적인 구조
인스턴스(Instance) 정의된 스키마에 따라 테이블에 실제 저장된 데이터의 집합

관계 대수

원하는 정보와 그 정보를 어떻게 유도하는가를 기술하는 절차적 정형 언어

관계 대수 연산자 종류 기호
일반 집합 연산자 ∪ ∩ - × (합집합, 교집합, 차집합, 카티션 프로덕트)
순수 관계 연산자 σ π ⋈ ÷ (셀렉트, 프로젝트, 조인, 디비전)

관계 해석

튜플 관계 해석과 도메인 관계 해석을 하는 비절차적 언어

 

정규화(Normalization)

관계형 데이터 모델에서 데이터의 중복성을 제거하여 이상현상을 방지하고, 일관성과 정확성을 유지하기 위해 무손실 분해하는 과정

이상 현상(Anomaly)

정규화를 하지 않았을 경우에 대한 문제점으로, 데이터 중복성으로 인해 릴레이션을 조작할 때 발생하는 현상

💡 암기 TIP
입, 제, 신 → 삽살개
이상 현상 설명
삽입 이상 정보 저장 시 해당 정보의 불필요한 세부정보를 입력해야 하는 경우
삭제 이상 정보 삭제 시 원치 않는 다른 정보가 같이 삭제 되는 경우
갱신 이상 중복 데이터 중 특정 부분만 수정되어 중복된 값이 모순을 일으키는 경우

정규화 단계

💡 암기 TIP
자값, 분 함수, 행함수, 정자, 치, 인 → 원부 이결 다조 (할머니 이걸 다조? 😓)
단계 조건
1정규형(1NF) 자값으로 구성
2정규형(2NF) 분 함수 종속 제거
3정규형(3NF)
행함수 종속 제거
보이스-코드 정규형(BCNF) 정자 후보키가 아닌 함수 종속 제거
4정규형(4NF) 치 종속 제거
5정규형(5NF) 인 종속 제거

 

반 정규화(De-Normalization, 비정규화, 역정규화)

정규화된 엔티티, 속성, 관계에 대해 성능 향상개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행

 

 

물리 데이터 저장소 설계


물리 데이터 모델링 개념

논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정

 

참조 무결성 제약조건

릴레이션과 릴레이션 사이의 참조의 일관성을 보장하기 위한 조건으로, 두 개의 릴레이션이 기본키 ↔ 외래키를 통해 참조 관계를 형성할 경우, 참조하는 외래키의 값은 항상 참조되는 릴레이션에 기본키로 존재해야 한다.

용어 설명
제한(Restricted) 참조 무결성을 위배하는 연산 거절
연쇄(Cascade) 참조되는 릴레이션에서 튜플 삭제 후, 이 튜플을 참조하는 다른 릴레이션의 튜플도 삭제
널 값(Nullify) 참조되는 릴레이션에서 튜플 삭제 후, 이 튜플을 참조하는 다른 릴레이션의 튜플을 NULL

 

파티션(Partition) 설계

💡 암기 TIP
인지, 포지트, 시, 스트 → 레컴 해리 (베컴, 해리 케인)
용어 설명
레인지(Range) 파티셔닝 연속적인 숫자나 날짜 기준
컴포지트(Composite) 파티셔닝 2개 이상의 파티션을 결합
해시(Hash) 파티셔닝 파티션 키의 해시 함수 값 기준
리스트(List) 파티셔닝 특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능

 

 

데이터베이스 기초 활용하기


데이터베이스(Database) 정의

다수의 인원, 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 데이터의 집합

💡 암기 TIP
용, 합, 영, 장 → 공통 운전
정의 설명
통합된 데이터(Integrated) 중복을 배제한 데이터의 모임
저장된 데이터(Stored) 저장 매체에 저장된 데이터의 모임
운영 데이터(Operational) 조직의 업무를 수행하는데 필요
공용 데이터(Shared) 여러 애플리케이션, 시스템들이 공동으로 사용

 

데이터베이스 특성

💡 암기 TIP
시, 속적, 시간, 용 → 동계 실내 온도
특성 설명
실시간 접근성 쿼리에 대해 실시간 응답 가능
계속적인 변화 새로운 데이터의 삽입, 삭제, 갱신으로 항상 최신 데이터 유지
동시 공용 다수의 사용자가 동시에 같은 데이터 이용 가능
내용 참조 데이터 참조 시 레코드의 주소나 위치가 아닌, 사용자가 요구하는 데이터 내용으로 찾기

 

DBMS(Database Management System)

데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제, 백업, 복구 등의 기능을 지원하는 SW

 

빅데이터(Big Data)

주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트(PB) 크기의 비정형 데이터

용어 설명
HDFS Hadoop Distributed File System의 약자로, 하둡 분산 파일 시스템
맵 리듀스(Map Reduce) 구글에서 대용량 데이터 처리를 목적으로 제작한 SW 프레임워크
온톨로지(Ontology) 실세계에 존재하는 모든 개념들과 속성, 관계컴퓨터가 이해할 수 있도록 서술
시맨틱 웹(Semantic Web) 온톨로지를 활용하여 서비스 기술, 의미적 상호 운용성을 이용해 서비스 검색 등을 자동화

 

NoSQL(Not Only SQL)

전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로, 최근 빅데이터 활성화와 함께 부각

  1. 데이터 저장에 고정된 테이블 스키마가 필요하지 않다
  2. 조인(Join) 연산을 사용할 수 없다
  3. 수평적으로 확장이 가능하다

NOSQL의 특성

💡 암기 TIP
Basically Available, Soft-State, Eventually consistency → BASE
특성 설명
Basically Available 언제든지 데이터에 접근가능해야 함
Soft-State 노드의 상태는 내부에 포함된 정보에 의해가 아니라, 외부에서 전송된 정보를 통해 결정
Eventually Consistency 일정 시간이 지나면 데이터의 일관성이 유지

 

데이터 마이닝(Data Mining)

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

대규모 데이터에서 의미있는 패턴을 찾아내거나 예측하여 의사결정에 활용하는 기법

💡 암기 TIP
류, 관, 속, 이터 군집화 → 어집 연데?
기법 설명
분류(Classification) 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 결과 예측
연관(Association) 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
연속(Sequence) 연관 규칙에 시간 정보가 포함된 형태의 기법
데이터 군집화(Clustering) 유사한 특성을 지닌 몇 개의 소그룹으로 분할

 


 

반응형

댓글