본문 바로가기

개발공부/정보처리기사

정보처리기사(정처기) 실기 - 3단원 총정리

3단원은 이것만 외우면 끝!


데이터 모델 :현실 세계의 정보를 인간과 컴퓨터가 이해할 수 있도록 추상화하여 표현한 모델
데이터 모델 절차 : 개논물 (개념적 데이터 모델 -> 논리적 데이터 모델 -> 물리적 데이터 모델)
논리적 데이터 모델 종류 :관계데이터 모델(테이블) / 계층 데이터 모델(트리) / 네트워크 데이터 모델(그래프,망)

관계 대수 :원하는 정보와 그 정보를 어떻게 유도하는가를 기술하는 절차적 정형 언어
관계 대수 - 일반 집합 연산자 : 합교차카 (합집합, 교집합, 차집합, 카티션 프로덕트)
관계 대수 - 순수 관계 연산자 : 셀프조디 (셀렉트, 프로젝트, 조인, 디비전)

관계 해석 : 튜플 관계 해석과 도메인 관계 해석을 하는 비절차적 언어

정규화 : 관계형 DB 설계 시 중복을 최소화하여 데이터를 구조화하는 과정
정규화 : 원부이 결다조 (원자 - 부분함수 - 이행함수 - 결정자 함수 - 다중값 - 조인)
- 제1정규화 (1NF) : 정규화 - 테이블 내의 속성 값은 원자 값
- 제2정규화 (2NF) : 정규화 - 부분 함수 종속성을 제거
- 제3정규화 (3NF) : 정규화 - 이행 함수 종속성을 제거
- BCNF : 정규화 - 결정자 함수의 종속성을 제거
- 제4정규화 (4NF) : 정규화 - 다중 값 종속을 제거
- 제5정규화 (5NF) : 정규화 - 조인 종속성을 제거

 

이상 현상(Anomaly) : 데이터의 중복성으로 인해 테이블을 조작할 때 발생하는 비합리적인 현상(삽입, 삭제, 갱신)
반정규화 : 시스템의 성능 향상을 위해 정규화 원칙을 의도적으로 위배하는 행위


파티셔닝(해시,레인지,리스트,컴포지트) : 대용량 테이블을 작은 논리적인 단위인 파티션으로 나누는 것
파티션(Partition)의 종류 : 레해리컴 (레인지, 해시 , 리스트 , 컴포지트)
- 레인지(Range) 파티셔닝 : 파티션(Partition)의 종류 - 연속적인 숫자나 날짜 기준
- 해시(Hash) 파티셔닝 : 파티션(Partition)의 종류 - 파티션 키의 해시 함수 값
- 리스트(List) 파티셔닝 : 파티션(Partition)의 종류 - 특정 파티션에 저장 될 데이터에 대한 명시적 제어 가능
- 컴포지트(Composite) 파티셔닝 : 파티션(Partition)의 종류 - 레인지, 해시, 리스트 중 2개 이상의 파티셔닝 결합
파티션의 장점 : 성가백합 (성능향상 - 가용성 향상 - 백업 가능 - 경합 감소)

빅데이터 : 시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리가 가능한 수십 페타바이트 크기의 비정형 데이터
HDFS (Hadoop Distributed File System) : 대용량의 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 하둡 분산 파일 시스템
맵 리듀스(Map reduce) : 구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅 처리하기 위한 목적으로 제작해 2004년에 발표한 소프트 프레임 워크(Hadoop)

NoSQL : 전통적 RDBMS와 달리 테이블 스키마가 필요하지 않고 수평적 확장이 가능한 DBMS
- Basically Available : NoSQL의 특성(BASE) - 언제든지 데이터는 접근할 수 있어야하는 속성
- Soft-State  : NoSQL의 특성(BASE) - 노드의 상태는 외부에서 전송된 정보를 통해 결정되는 속성
- Eventually Consistency  : NoSQL의 특성(BASE) - 일정 시간이 지나면 데이터의 일관성이 유지

온톨로지(Ontology) : 실세계에 존재하는 모든 개념들과 개념들의 속성, 개념들 간의 관계 정보를 컴퓨터가 이해할 수 있도록 서술해 놓은 지식베이스
시맨틱 웹(Semantic Web) : Ontology를 활용하여 서비스 검색/조합 기능들을 자동화하는 웹
데이터 마이닝 : 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술
데이터 마이닝의 주요 기법 : 분류 규칙 - 연관 규칙 - 연속 규칙 - 데이터 군집화
분류 규칙 : 데이터 마이닝의 주요 기법 - 과거 데이터로부터 특성을 찾아내어 분류모형을 만들어 결과 값 예측
연관 규칙 : 데이터 마이닝의 주요 기법 - 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법
연속 규칙 : 데이터 마이닝의 주요 기법 - 연관 규칙에 시간 관련 정보가 포함된 형태의 기법
데이터 군집화 : 데이터 마이닝의 주요 기법 - 대상 레코드들을 유사한 특성을 지는 몇 개의 소그룹으로 분할하는 작업